La web semántica es lo que va a ser la web del futuro. Pero para poder
llegar a la web del futuro tenemos que entender cuál es la web actual en
la que estamos. Entonces, la web actual en la que estamos está
compuesta por documentos. Estos documentos son básicamente páginas web
html que vemos cualquier día, todos los días en nuestro navegador web.
Estos documentos web están compuestos por contenido, que pueden ser
texto, pueden ser imágenes, pueden ser vídeos, audios, etcétera. Y
además está compuesto por enlaces. Estos enlaces nos llevan a otras
páginas web. Esta es la forma de la web actual. Es la que todos
conocemos. Un ejemplo de esta web actual sería el que vemos ahora en la
pantalla.
Este
ejemplo lo que contiene es la descripción de la world wide web en la
Wikipedia. Todos conocemos la Wikipedia y es muy sencillo acceder a
ella. Dentro de esa descripción podemos ver que tenemos texto. Mucho
texto. Esto sería principalmente el contenido de la página web. Además
tenemos una imagen dentro de esta página web. Sería una parte más del
contenido de la página web. Además, dentro de esta página web de la
Wikipedia tenemos enlaces. Por ejemplo, tenemos enlaces a informática,
tenemos enlaces a computación, tenemos enlaces a Internet. Estos enlaces
nos redirigen a otra
página web con un contenido distinto. O no tan distinto ya que nos vamos
a
quedar dentro de la Wikipedia, pero en general es un contenido
distinto. Seguimos hablando de enlaces. Y los enlaces en este otro
ejemplo son enlaces de PubMed.
PubMed es una base de datos. Una página web que contiene
documentos
científicos, documentos médicos sobre enfermedades y demás. Entonces
aquí tenemos varios ejemplos de enlaces que nos llevan, precisamente, a
esos documentos científicos de medicina. Entonces ya hemos visto un
poquito como es la web actual y ahora vamos a ver los desafíos que
presenta esta web actual.
El
primer desafío es la heterogeneidad. Como hemos visto, la Wikipedia
tiene un formato, PubMed tiene otro formato, Facebook tiene otro formato
de datos, nos presenta las cosas de forma distinta. Es decir la web es
muy heterogénea. Además la web es masiva. Hay muchísimos datos en
PubMed, en Wikipedia, en Facebook. Hay una cantidad ingente de datos.
Además cambia muy rápido. Por ejemplo, yo podría estar actualizando mi
perfil de Facebook cada hora, cada dos horas. Hay gente que lo actualiza
cada 15 minutos. Entonces todo esto cambia muy rápido y estoy dando un
ejemplo muy chiquito, muy concreto. Y sobre todo, la web actual está
hecha para humanos. Si nos hemos fijado hasta el momento, los ejemplos
que he puesto, la Wikipedia, PubMed Facebook, todo esto está hecho para
que sea consumido por humanos. Las máquinas, el software no tiene tanto
acceso a este contenido.
Es
difícil para un programa interpretar los datos que hay, por ejemplo, en
el perfil de Facebook de una persona. o dentro de la Wikipedia. Más en
detalle la web es heterogénea porque cada aplicación web, cada página
web crea los datos y los presenta a los usuarios de una forma totalmente
distintas. Es distinto lo que se hace en Facebook, en LinkedIn, en
Orkut, en MySpace. Todas esas son redes sociales. Son totalmente
distintas y no intercambian datos entre ellas. Además la web es masiva.
Por ejemplo, la Wikipedia son casi 6 terabytes de datos. Y ¿qué es un
terabyte de datos? En un terabyte de datos caben 678 millones de páginas
de texto. 678 millones, eso, suponiendo que el Quijote tiene 1.000
páginas de texto, quiere decir que en un terabyte caben 678 mil
Quijotes, Y en una Wikipedia, con 6 terabytes de datos, caben alrededor
de 4 millones de Quijotes. Muchísimo. Además, en la biblioteca del
congreso de los Estados Unidos, como se puede ver en este ejemplo hay
datos que ocupan 235 terabytes de datos. En cuanto a la velocidad, solo
un ejemplo. La web actual cambia muy rápido.
Actualmente
se transfieren en Internet 160 terabytes de datos por segundo. Esos son
27 Wikipedias por segundo. Se transfieren alrededor de Internet 27
Wikipedias cada segundo. Eso es muchísimo. Además la web está hecha para
humanos. Como comentaba anteriormente Facebook lo consumen
principalmente las personas. La Wikipedia la consumen normalmente las
personas. Pero ¿qué pasa si yo quiero enlazar o combinar los datos de la
Wikipedia y de Facebook o la Wikipedia y de PubMed? Eso actualmente,
con el diseño de la web actual no es posible. Entonces ¿cómo podría una
aplicación consumir datos de dos webs distintas? Leyendo el texto, el
contenido. Pero, ¿cómo sabe qué texto leer? ¿Cómo sabe qué contenido
leer dentro de una página web? Mirando el código de la html de cada
página web. Podría ser pero es muy desordenado. Por dentro el código
está muy desordenado siempre. Uno no sabe, una aplicación no sabría
exactamente dónde está el nombre de una persona dentro del código html.
Normalmente es muy difícil de saber. Entonces, para resumir hemos visto
que la web es masiva, está compuesta por documentos. Estos documentos
tienen contenido y enlaces a otras páginas web.
Hay
varios desafíos dentro de la web actual que son la heterogeneidad, la
velocidad de cambio, la masividad de la web. Y que está hecha para
humanos. Un software, una aplicación no sabe identificar o consumir los
datos de una página web. Entonces, estos son los desafíos que intenta
resolver la web semántica. Sobre todo la parte de la heterogeneidad de
datos y la parte de que está hecha para los humanos. La web semántica va
a tratar de derribar las barreras que existen en la web actual para que
los contenidos puedan ser consumidos por máquinas de manera mucho más
eficiente.
|
||
Búscador investigación |
No hay comentarios:
Publicar un comentario