Datos enlazados y Grafos de Conocimiento

Linked Data o Datos Enlazados

Tim Berners-Lee es el responsable tanto del concepto de Web Semántica -que acuñó en 2001 en un artículo seminal publicado en 'Scientific American', 'Semantic Web'-, como del de Linked Data desarrollado a partir de una nota de diseño relacionada con la construcción del proyecto de Web Semántica.

Linked Data o Datos Enlazados o Enlazables designan un método de publicación estructurada de datos que, en la práctica es el que hace posible la navegación por hiperdata y la construcción de Grafos de Conocimiento.  Este método de publicación posibilita el que las personas pueden interrogar los datos de un grafo de manera semántica.

Para publicar de acuerdo con los principios de la Web de los Datos Enlazados o Linked Data Web es preciso utilizar algunos estándares como http, RDF y URIs, que se utilizan no tanto para servir las páginas que leen las personas, sino para editar las páginas que pueden interpretar automáticamente los sistemas  y, por tanto,  compartir la información con ellos. Esto posibilita conectar los datos de diferentes fuentes en un grafo unificado e interrogable.

En el caso de GNOSS, el proyecto del Museo del Prado ha estado orientado desde el principio a integrar todos los recursos del Museo en un grafo de conocimiento cuyo objetivo era construir una nueva presencia del Museo en la Web, mejorar la experiencia de los usuarios en su interacción con los recursos del museo e integrar y enlazar toda la producción del museo en un grafo unificado o, dicho de otro modo, convertir todos los datos de todos los sistemas en hiperdata. Finalmente, este enfoque basado en la utilización de los datos del Museo para la mejora de sus propios procesos y no sólo enfocado a la reutilización de los mismos por parte de terceros, ha mostrado una incidencia importante en el modo en el que el museo opera, al conectar de manera directa los procesos de creación y generación de conocimiento del museo, con los de publicación y con los de descubrimiento de conocimiento.

Por otro lado, cuando se transciende el punto de vista de la publicación de los datos para uso de los presuntos reutilizadores y se adopta el punto de vista de desarrollar utilidades para las diferentes audiencias, incluidas algunos grupos de interés de la propia institución el resultado puede transformar de manera significativa los modos de producción y consumo de los materiales que representan el patrimonio y conocimiento de la institución.

¿Qué es un grafo? 

En griego la palabra grafo significa dibujo.  Desde un punto de vista técnico, “grafo” en matemáticas y ciencias de la computación designa un conjunto de objetos, llamados vértices o nodos, unidos entre sí mediante aristas o arcos, que representan las relaciones entre los elementos de un conjunto. Se utiliza la palabra “grafo” para designar el modo en el que se representan típicamente esta clase de objetos matemáticos, como un conjunto de puntos (vértices o nodos) unidos por líneas (aristas). La teoría de los grafos se ocupa del estudio de este tipo objetos matemáticos.

Desde un punto de vista aplicado, los grafos permiten estudiar las interrelaciones entre unidades que interactúan entre sí. Puede pensarse en una red de ordenadores, pero también en el conjunto de relaciones implícitas entre los libros de una biblioteca, las obras de un museo o un conjunto de artículos científicos y un determinado conjunto de ensayos clínicos.

La teoría de grafos permite representar, formalizar y desarrollar explotaciones y aplicaciones prácticas para un conjunto muy amplio de problemas.

Grafos de Conocimiento

Un grafo de conocimiento es un sistema de representación de un conjunto de contenidos y recursos digitales que, sobre la base de un modelo ontológico, entiende hechos relacionados con los objetos de conocimiento o entidades de un área de conocimiento en particular y, especialmente, entiende el modo en que este conjunto de entidades está todo él conectado. Cuando decimos que es un sistema que 'entiende' debemos asumir que es un sistema escrito en un lenguaje técnico que posibilita que las máquinas o sistemas 'entiendan' y traten correctamente el conjunto de entidades al que nos hemos referido para, de ese modo, colaborar con las personas en sus procesos de interrogación, recuperación de la información, descubrimiento de conocimiento y aprendizaje proporcionando sistemas de recomendación confiables.

Los Grafos de Conocimiento son una dimensión esencial de un proyecto de inteligencia artificial, proporcionan un medio cognitivo a través del que se puede viajar, al que se puede interrogar y que es capaz de inferir y proponer a partir de las peticiones de los usuarios nuevos relatos o narrativas vinculadas con las áreas de conocimiento de que se trate.