Semántica en la WEB: 1.1.2 Introducción a la WEB Semántica

Describiremos algunas de las nociones básicas necesarias para entender esta web del futuro. En la web hay datos de todo tipo, datos genéricos, datos médicos, noticias, datos fundamentales. Y en general las páginas web están diseñadas para ser leídas por personas y tienen formatos adecuados para ello. Pero la cantidad de datos es tan grande que no la podemos manejar. Por ejemplo, tiene el correo electrónico, una página en Facebook, puede tener información en Instagram, puede acceder a información en Wikipedia y en información general, puede acceder a información geográfica, etc... Veamos algunos ejemplos de estos datos en la web.

En primer lugar tenemos datos genéricos como el ejemplo en Wikipedia.

En Wikipedia podemos encontrar

información sobre todo tipo de elementos, por ejemplo información geográfica, información sobre historia de los países, información científica, etc... Si bien en algún lugar también tenemos datos médicos, por ejemplo tenemos la biblioteca nacional de medicina de Estados Unidos, donde uno puede encontrar información sobre enfermedades, síntomas, tratamientos, etc... También tenemos noticias y probablemente usted todos los días lee algún diario que está publicado en la web, por ejemplo The New York Times.

También tenemos datos gubernamentales; los distintos gobiernos han decidido tener leyes de transparencia que han obligado a las distintas agencias de estos gobiernos a publicar datos en la web.

Por ejemplo, en esta transparencia podemos ver el London Data store, donde la ciudad de Londres guarda información sobre transporte, sobre salud pública, etcétera. Entonces, ¿cómo podemos aprovechar estos datos? Algo que es importante tener en cuenta en este momento, es que los computadores tienen la capacidad para poder analizar estos datos, tenemos suficientes computadores, tenemos suficientes procesadores como para organizar esta información. Pero, ¿cuál es el problema que tenemos actualmente?

Los computadores no son capaces de interpretar la información que está en estas páginas web, o sea, las páginas están pensadas para ser leídas por personas no por computadores. Entonces, necesitamos permitir que las aplicaciones computacionales entiendan los datos. Y aquí la pregunta fundamental es, ¿cómo podemos hacer esto?, ¿cuáles son los requisitos para una web de datos efectiva donde los computadores y las personas puedan acceder y entender la información?

En primer lugar, es necesario tener un lenguaje que nos permita especificar los recursos que tenemos en la web y cuáles son las relaciones que existen entre ellos. Con recurso me refiero a los distintos componentes de la web, esto puede ser una página web, un diario, una persona que tiene una página web, etcétera. Y queremos también especificar cuáles son las relaciones que existen entre ellos. Por ejemplo, esta noticia fue publicada en este diario, esta página por ejemplo tiene información sobre problemas de salud en este determinado país, etc...

Ahora un requisito fundamental para diseñar este lenguaje que nos permita definir distintos recursos y sus relaciones es que debe ser procesable por un computador. Un computador, una aplicación computacional debe entender este lenguaje.

En segundo lugar, necesitamos poder consultar estos datos mediante aplicaciones computacionales y con esto nos referimos a poder especificar lo que estamos buscando y que de manera automática se extraiga esta información. Aquí nuevamente tenemos dos requisitos fundamentales; necesitamos un lenguaje para describir consultas que sea procesable por un computador; de nuevo vamos a describir una consulta en un cierto lenguaje y esperamos que el computador o la aplicación computacional entienda esta consulta y sea capaz de sacar conclusiones a partir de los datos de manera automática. Debemos ser capaces de extraer de manera automática la respuesta a la consulta que estamos realizando. En este punto es donde aparece la web semántica; en palabras de Tim Berners-Lee la web semántica es una extensión de la web actual en la cual se da un significado bien definido a la información, permitiendo mejorar la colaboración entre personas y computadores en la web.

¿En qué se traduce esto en la práctica? Bueno, la web semántica hoy en día es un conjunto de recomendaciones desarrolladas por el World Wide Web Consortium, cuyo objetivo es que los computadores sean capaces de entender los datos en la web. Aquí tenemos que detenernos en dos conceptos importantes. En primer lugar, una recomendación es una descripción formal de una tecnología que debería ser utilizada por todos; es decir, un lenguaje común para todos. Lo que queremos hacer en este punto es desarrollar un lenguaje que por ejemplo nos permita especificar los recursos de la web, que tenga una descripción formal, para que pueda ser entendida por un computador y que sea un lenguaje común para todos. También es importante mencionar acá que el World Wide Web Consortium es el organismo regulador de la web, el organismo que dicta los distintos estándares para la web. Ahora, ¿cuáles son esos estándares para la web?

En la figura se puede observar la pirámide de estándares que se está desarrollando para llevar a cabo esta web semántica. En la parte inferior vemos los componentes más básicos; en la parte superior vemos el trust o el nivel de confianza que va aumentando en los niveles superiores.

Vamos a centrarnos en cuatro de estos componentes de esta pirámide que están marcados con colores. En primer lugar vamos a ver RDF, que es el lenguaje básico para definir recursos de la web y sus relaciones, RDFS que nos permite decir un poco más de este vocabulario, SPARQL que es el lenguaje de consulta que nos permite extraer información desde la web y finalmente OWL o lenguaje que nos permite identificar ontologías.

En resumen, hemos visto que hay datos de todo tipo en la web, que son de fácil acceso para las personas. Hemos visto que la cantidad de datos es tan grande que las personas no lo pueden manejar en su totalidad por sí solas. También hemos visto que es difícil para un computador acceder a estos datos ya que no sabe como interpretarlos. Las páginas web están diseñadas para ser leídas por personas. No están diseñadas para que un computador las pueda leer de manera automática. Y finalmente la web semántica, que es un conjunto de recomendaciones para facilitar el acceso de los computadores a los datos. En particular, lo que queremos en este punto es tener el lenguaje que nos permita especificar los recursos que tenemos en la web, especificar las relaciones que tenemos entre ellos y también definir lenguajes que nos permitan extraerlos de manera automática de esta web.

Semántica en la WEB

Páginas

viernes, 23 de octubre de 2015

1.1.2 Introducción a la WEB Semántica

No hay comentarios:

Publicar un comentario

Etiquetas

Mi lista de blogs

Visitas: