ejemplos de la web semántica

Una de las principales páginas que destacan la mayoría de los entrevistados es DBPedia. En especial Mariano Rico, profesor de la UPM, destacó esta página. Y es que el creador de dicha página fue él junto con Óscar Corcho. ¿Pero qué es exactamente DBPedia? “El proyecto DBpedia ha generado durante mucho tiempo información semántica a partir de la wikipedia inglesa. Desde junio de 2011 el proceso de generación de información extrae información de wikipedia en 15 de sus versiones (idiomas). Uno de ellos es el español. El comité de internacionalización de DBpedia ha asignado un sitio web y un SPARQL Endpoint para cada uno de estos idiomas”. (Ejemplo extraído íntegramente de la página es.dbpedia.org)

Veámos un ejemplo de cómo funciona exactamente con un ejemplo. “Si buscas ‘científicos’ en wikipedia verás que hay una categoría con ese nombre. También verás que no tiene una lista de científicos, sino una lista de categorías (como ‘Científicos por disciplina’, o ‘Científicos por país’). Si entras en la categoría ‘Científicos por país’ (a su vez tiene 128 categorías) y eliges la categoría ‘Científicos de España’ verás que (aparte de más categorías) tiene 29 páginas de científicos. Estos son los que devuelve la consulta anterior” (Extracto de es.dbpedia.org)

EJEMPLO 1

PREFIX dcterms: <http://purl.org/dc/terms/>

SELECT ?person WHERE{

  ?person dcterms:subject <http://es.dbpedia.org/resource/Categoría:Científicos_de_España>

RESULTADO

person
http://es.dbpedia.org/resource/Gustavo_Pittaluga_Fattorini
http://es.dbpedia.org/resource/Eduardo_Zorita
http://es.dbpedia.org/resource/Bernardo_Rodríguez_Largo
http://es.dbpedia.org/resource/Fermín_Muñoz_Urra
http://es.dbpedia.org/resource/Manuel_Luque_Otero
http://es.dbpedia.org/resource/Mateo_Valero_Cortés
http://es.dbpedia.org/resource/Miguel_Ángel_Mayer
http://es.dbpedia.org/resource/Bernardino_Landete_Aragó
http://es.dbpedia.org/resource/Salvador_Gil_Vernet
http://es.dbpedia.org/resource/Gonzalo_Gallas_Novás
http://es.dbpedia.org/resource/María_Luisa_Ferrándiz_Manglano
http://es.dbpedia.org/resource/María_Teresa_Miras_Portugal
http://es.dbpedia.org/resource/Montse_Calleja
http://es.dbpedia.org/resource/Anastasio_Anselmo_González_y_Fernández
http://es.dbpedia.org/resource/Gabriel_Galán_Ruiz
http://es.dbpedia.org/resource/Amador_Schüller
http://es.dbpedia.org/resource/Pedro_Mayoral_Carpintero
http://es.dbpedia.org/resource/Guillermo_Velarde
http://es.dbpedia.org/resource/Tomás_Manuel_Vilanova_Muñoz_y_Poyanos
http://es.dbpedia.org/resource/Nuria_Martí_Gutiérrez
http://es.dbpedia.org/resource/Álvaro_Arias

Así es cómo funcionaría en este caso la página DBpedia en español, aunque tal y cómo aparece en la propia página: “Las consultas que no devuelven los resultados esperados, típicamente porque los datos de Wikipedia están mal, o por deficiencias del extractor”.

Vamos con el segundo caso que nos introdujo Mariano Rico. Era otro de los proyectos en los que él estaba inmerso. Durante la propia entrevista que le realizamos nos lo puso de ejemplo, centrando en gran parte del propio encuentro. Rico destacó aparte de la anterior mencionada, el Banco de Datos de la Biblioteca Nacional de España a través de su página web: http://datos.bne.es/inicio.html

Como aparece en la misma foto, es un proyecto de Linked Open Data, y en él, se encuentra trabajando el profesor Rico, junto con más gente de la Universidad Politécnica de Madrid. Seguiremos el mismo ejemplo que nos proporcionó él:

Esta sería la página principal, la de Inicio. En el marco superior podemos encontrar los apartados “Personas”, “Entidades”, “Obras”, “Temas”, “Búsquedas Avanzadas” y “Ayuda”. Vemos que aparece también una barra en la cual podemos poner a buscarnos. Nuestra búsqueda se va a centrar en “Miguel de Cervantes Saavedra”.

La imagen tiene un atributo ALT vacío; su nombre de archivo es image1.png

Como podemos apreciar, salen bastantes “Persona” a la hora de poner “Miguel”. En la lista del escalafón, Cervantes se encontraría en segunda posición. Pinchamos en su apartado correspondiente.

La imagen tiene un atributo ALT vacío; su nombre de archivo es image2.png

Tras clickar en Miguel de Cervantes, éste sería el primer apartado que nos saldría de él dentro de la propia página de la Biblioteca.

La imagen tiene un atributo ALT vacío; su nombre de archivo es image3.png

Si seguimos bajando para abajo, encontraríamos “Sus obras”. Dentro de la propia BNE, vemos que aparece que es autor de 133 obras, que quedan reflejadas dentro de una lista todas ellas; es tema en 411 obras, y más abajo, saldría también una lista similar a la que aparece en la imagen, pero con “Obras sobre la personas”. Por último, misma lista con “Participa en 191 obras”.

La imagen tiene un atributo ALT vacío; su nombre de archivo es image4.png

Por último, y ya al final de la página, encontraríamos enlaces relacionados con el propio autor que hemos buscado. También vemos enlaces a otras Bibliotecas Nacionales, como pueden ser la de Alemania, Francia o la Biblioteca del Congreso de los Estados Unidos, en este caso. Por último, encontraríamos el apartado de “Más Información”, con otros nombres utilizados para la búsqueda, Fuentes Consultadas e Información encontrada.

La imagen tiene un atributo ALT vacío; su nombre de archivo es image5.png

Al final de la página, antes de que aparezcan los Datos de la Biblioteca Nacional de España encontramos que esta información se podría descargar en otros formatos, siendo uno de éstos dos el formato antiguo. Cabe destacar que todas las obras están enlazadas a la propia obra, que estaría dentro de la biblioteca.

La imagen tiene un atributo ALT vacío; su nombre de archivo es image6.png

Así podríamos acceder una por una a todas las obras del autor en cuestión que estemos buscando. En este caso, sería una obra en la que sería tema con motivo de su tercer centenario. Fue un homenaje que preparó el Instituto Argentino de Artes Gráficas. También podemos encontrar en “Acceder a esta obra” a exactamente dónde estaría ubicado dentro de la Biblioteca Nacional este libro. Incluso la posibilidad de leerlo en línea, si se encuentra disponible para ello, en el apartado que aparece con el nombre de “Digitalización”.

Estos dos ejemplos que acabamos de mencionar serían tecnologías que utilizan la Web Semántica. Pero existen varias que repasaremos en este listado:

  • Sistemas de Datos Abiertos gubernamentales en varios países
  • Datos Abiertos de la Biblioteca Nacional de Francia
  • Incorporación de metadatos en sistemas de comercio electrónico.
  • Resultados semánticos en el motor de búsquedas Google
  • Datos Abiertos en la Biblioteca Virtual Miguel de Cervantes
  • El proyecto europeo INSEMTIVES está generando la tecnología necesaria que permita añadir una capa semántica sobre el contenido actualmente disponible en web.
fUENTE: CAPTURAS DESDE LA PÁGINA DATOS.BNE.ES

Fundamentos

Según Miguel Ángel Rodríguez García, la Web Semántica propone “la modificación de la forma en que se presentan los contenidos de la Web de manera que no sólo contenga información para formatear el contenido, sino también incluya información que describa el contenido para facilitar su procesamiento por parte de las máquinas”. Siguiendo con lo mencionado anteriormente, la principal diferencia de la web convencional con la Web Semántica vendría a ser lo descrito por Mariano Rico, en la que hace referencia a la web convencional que está hecha para ser leída por “humanos”, mientras que la Web Semántica, para ser leída por “máquinas”.

La Web actual junta los recursos para ser almacenados como conjuntos de palabras sin ninguna relación. Sin embargo, en la Web Semántica los recursos no solo son almacenados como conjuntos de palabras sino que, además, incluyen significado y estructura. (Rodríguez García, M.A.)

¿Qué es una web semántica?

La web semántica surge para dar respuesta a una pregunta: ¿Por qué no presentar la información que contienen esas bases de datos, que es más fácilmente comprensible para las máquinas, directamente en la web? Así surgiría la web semántica, según Alfredo Sánchez Alberca, y se puede considerar “una extensión de la World Wide Web (WWW) en la que la información publicada tiene un significado formalmente definido, que es comprensible, no sólo para las personas, sino también para las máquinas, permitiendo una mayor cooperación entre ellas. (Berners-Lee, 2001)

No hay una respuesta exacta para describir lo que es la web semántica. Sin embargo, muchas de ellas son bastantes similares y apenas varían. Tomando como referencia las entrevistas que hemos realizado, para Mariano Rico “las webs semánticas tienen documentos para ser leídos por máquinas”. Para Lluís Codina y Cristófol Rovira, del Departamento de Periodismo y de Comunicación Audiovisual de la Universidad Pompeu Fabra: “La Web semántica es un proyecto a corto, medio y largo plazo del organismo de regulación más importante del mundo en relación a Internet: el World Wide Web Consortium (W3C a partir de ahora). El proyecto de la Web semántica incluye transformaciones que ya están afectando a los ámbitos de la creación, edición y publicación de páginas y sitios Web2 y que seguirán teniendo una importancia creciente en el futuro”.

Por otro lado, Adolfo Martín Antón comienza el resumen de su tesis doctoral sobre “Las Tecnologías de la Web Semántica” de la siguiente manera: “La Web Semántica es un conjunto de tecnologías que están en constante evolución, un fenómeno que desarrolla o extiende la Web y pretende ir un paso más allá en la recuperación de información, una base de datos gigantesca y viva que supone un campo de experimentación y pruebas para las humanidades y para el periodismo. El espacio destinado a alojar documentos HTML se ha convertido en el canal de acceso a información, contenidos y datos, en la interfaz estándar de relación de lxs usuarixs con las tecnologías”.

La definición que podríamos considerar más correcta, aunque las anteriores mencionadas también la son, la pronunció el “padre” de la web semántica, Tim Bernens-Lee, junto con James Hendler y Ora Lalissa en el libro “The Semantic Web” en el año 2001: “La Web Semántica aportará estructura al contenido significativo de las páginas Web, creando un entorno donde los agentes software itinerantes de página en página, podrán llevar a cabo tareas sofisticadas para los usuarios”. Mientras que para el W3C (World Wide Consortium), es “una Web extendida, dotada de mayor significado, en la que cualquier usuario en Internet podrá encontrar respuestas a sus preguntas de forma más rápida y sencilla gracias a una información mejor definida”.

Entre los objetivos de la web semántica se encuentra la posibilidad de que sea posible llevar una interacción entre usuario y agente de software mediante el cual el primero pueda ir expresando y perfilando sin ambigüedad puntos como objetivos de la búsqueda, punto de vista, etc. A partir de ahí, el agente de software es capaz de elaborar una estrategia de búsqueda según su propia iniciativa que involucre el uso de lenguajes documentales, metadatos y ontologías para responder con eficacia y rapidez al usuario (Codina, L.; Rovira, C.)

Para Javier Iglesia Aparicio, en su trabajo “Web Semántica: fundamentos, tecnologías y futuro”, destaca la web semántica como “la web de los datos”. Más concretamente, la web de los datos relacionados. “Se basa en añadir metadatos semánticos y de ontologías a la página web para describir el contenido, el significado y la relación de los datos”, continúa añadiendo el trabajo. El objetivo -según Iglesia Aparicio- es “crear un medio universal que permita el intercambio de datos y brindar un mayor significado a la misma para que puedan ser interpretadas por máquinas”.

Como podemos observar, no hay una definición exacta sobre la tecnología de la Web Semántica, pero la mayoría de las fuentes consultadas destacan la realizada por Tim Bersens-Lee, por ser el fundador de este tipo de tecnología.