Describiremos algunas de las nociones básicas necesarias para entender esta web del futuro. En la web hay datos de todo tipo, datos genéricos, datos médicos, noticias, datos fundamentales. Y en general las páginas web están diseñadas para ser leídas por personas y tienen formatos adecuados para ello. Pero la cantidad de datos es tan grande que no la podemos manejar. Por ejemplo, tiene el correo electrónico, una página en Facebook, puede tener información en Instagram, puede acceder a información en Wikipedia y en información general, puede acceder a información geográfica, etc... Veamos algunos ejemplos de estos datos en la web.
En primer lugar tenemos datos genéricos como el ejemplo en Wikipedia.
En Wikipedia podemos encontrar
información
sobre todo tipo de elementos, por ejemplo información geográfica,
información sobre historia de los países, información científica, etc...
Si bien en algún lugar también tenemos datos médicos, por ejemplo
tenemos la biblioteca nacional de medicina de Estados Unidos, donde uno
puede encontrar información sobre enfermedades, síntomas, tratamientos,
etc... También tenemos noticias y probablemente usted todos los días lee
algún diario que está publicado en la web, por ejemplo The New York Times.
También
tenemos datos gubernamentales; los distintos gobiernos han decidido
tener leyes de transparencia que han obligado a las distintas agencias
de estos gobiernos a publicar datos en la web.
Por ejemplo, en esta transparencia podemos ver el London Data store,
donde la ciudad de Londres guarda información sobre transporte, sobre
salud pública, etcétera. Entonces, ¿cómo podemos aprovechar estos datos?
Algo que es importante tener en cuenta en este momento, es que los
computadores tienen la capacidad para poder analizar estos datos,
tenemos suficientes computadores, tenemos suficientes procesadores como
para organizar esta información. Pero, ¿cuál es el problema que tenemos
actualmente?
Los
computadores no son capaces de interpretar la información que está en
estas páginas web, o sea, las páginas están pensadas para ser leídas por
personas no por computadores. Entonces, necesitamos permitir que las
aplicaciones computacionales entiendan los datos. Y aquí la pregunta
fundamental es, ¿cómo podemos hacer esto?, ¿cuáles son los requisitos
para una web de datos efectiva donde los computadores y las personas
puedan acceder y entender la información?
En
primer lugar, es necesario tener un lenguaje que nos permita
especificar los recursos que tenemos en la web y cuáles son las
relaciones que existen entre ellos. Con recurso me refiero a los
distintos componentes de la web, esto puede ser una página web, un
diario, una persona que tiene una página web, etcétera. Y queremos
también especificar cuáles son las relaciones que existen entre ellos.
Por ejemplo, esta noticia fue publicada en este diario, esta página por
ejemplo tiene información sobre problemas de salud en este determinado
país, etc...
Ahora
un requisito fundamental para diseñar este lenguaje que nos permita
definir distintos recursos y sus relaciones es que debe ser procesable
por un computador. Un computador, una aplicación computacional debe
entender este lenguaje.
En
segundo lugar, necesitamos poder consultar estos datos mediante
aplicaciones computacionales y con esto nos referimos a poder
especificar lo que estamos buscando y que de manera automática se
extraiga esta información. Aquí nuevamente tenemos dos requisitos
fundamentales; necesitamos un lenguaje para describir consultas que sea
procesable por un computador; de nuevo vamos a describir una consulta en
un cierto lenguaje y esperamos que el computador o la aplicación
computacional entienda esta consulta y sea capaz de sacar conclusiones a
partir de los datos de manera automática. Debemos ser capaces de
extraer de manera automática la respuesta a la consulta que estamos
realizando. En este punto es donde aparece la web semántica; en palabras de Tim Berners-Lee
la web semántica es una extensión de la web actual en la cual se da un
significado bien definido a la información, permitiendo mejorar la
colaboración entre personas y computadores en la web.
¿En
qué se traduce esto en la práctica? Bueno, la web semántica hoy en día
es un conjunto de recomendaciones desarrolladas por el World Wide Web Consortium,
cuyo objetivo es que los computadores sean capaces de entender los
datos en la web. Aquí tenemos que detenernos en dos conceptos
importantes. En primer lugar, una recomendación es una descripción
formal de una tecnología que debería ser utilizada por todos; es decir,
un lenguaje común para todos. Lo que queremos hacer en este punto es
desarrollar un lenguaje que por ejemplo nos permita especificar los
recursos de la web, que tenga una descripción formal, para que pueda ser
entendida por un computador y que sea un lenguaje común para todos.
También es importante mencionar acá que el World Wide Web Consortium
es el organismo regulador de la web, el organismo que dicta los
distintos estándares para la web. Ahora, ¿cuáles son esos estándares
para la web?
En
la figura se puede observar la pirámide de estándares que se está
desarrollando para llevar a cabo esta web semántica. En la parte
inferior vemos los componentes más básicos; en la parte superior vemos
el trust o el nivel de confianza que va aumentando en los niveles
superiores.
Vamos
a centrarnos en cuatro de estos componentes de esta pirámide que están
marcados con colores. En primer lugar vamos a ver RDF, que es el
lenguaje básico para definir recursos de la web y sus relaciones, RDFS
que nos permite decir un poco más de este vocabulario, SPARQL que es el
lenguaje de consulta que nos permite extraer información desde la web y
finalmente OWL o lenguaje que nos permite identificar ontologías.
En
resumen, hemos visto que hay datos de todo tipo en la web, que son de
fácil acceso para las personas. Hemos visto que la cantidad de datos es
tan grande que las personas no lo pueden manejar en su totalidad por sí
solas. También hemos visto que es difícil para un computador acceder a
estos datos ya que no sabe como interpretarlos. Las páginas web están
diseñadas para ser leídas por personas. No están diseñadas para que un
computador las pueda leer de manera automática. Y finalmente la web semántica,
que es un conjunto de recomendaciones para facilitar el acceso de los
computadores a los datos. En particular, lo que queremos en este punto
es tener el lenguaje que nos permita especificar los recursos que
tenemos en la web, especificar las relaciones que tenemos entre ellos y
también definir lenguajes que nos permitan extraerlos de manera
automática de esta web.
No hay comentarios:
Publicar un comentario