Política de cookies

GNOSS usa cookies, propias y de terceros, con finalidad principalmente técnica y necesaria para prestación de nuestros servicios y mostrarles contenido relevante. Más información en nuestra política de cookies.

ACEPTA para confirmar que has leído la información y aceptado su instalación. Puedes modificar la configuración de tu navegador.

IA Semántica

Interoperabilidad semántica: La base de sistemas que realmente se entienden entre sí

Grafos de conocimiento

Los grafos de conocimiento suelen implementarse utilizando estándares abiertos como RDF, SPARQL y OWL, promovidos por el W3C. Como señalan Heath y Bizer (2011) en su trabajo sobre datos enlazados, el uso de estos estándares facilita la interoperabilidad y el intercambio de datos entre sistemas, a diferencia de muchas implementaciones SQL propietarias que pueden crear dependencias tecnológicas.
La interoperabilidad semántica permite una gestión integral de los datos, asegurando no solo que puedan “conversar” entre sí dentro de un sistema, sino también interactuar eficazmente con sistemas de terceros. Esta capacidad enriquece y contextualiza la información, mejorando su precisión, utilidad y alcance. 
Garantizar que cada sistema pueda compartir información de forma completa, precisa y oportuna permite a las organizaciones aprovechar al máximo las capacidades para las que sus sistemas fueron diseñados. Por lo contrario, la ausencia de interoperabilidad da lugar a sistemas que crecen de forma aislada, provocando un ecosistema de datos fragmentado tanto para la organización como para los usuarios.
Asegurar que los sistemas de datos estén equipados con funciones de interoperabilidad es fundamental para maximizar su eficacia en el futuro. Estas funciones ayudan a las organizaciones a combatir la “entropía de datos”, es decir, la tendencia de los ecosistemas de datos a volverse más caóticos y desorganizados con el tiempo.

Algunos aspectos a los que hay que hacer frente para cumplir con los objetivos de interoperabilidad semántica son seguir los Principios FAIR y los Principios Linked Open Data.

Principios FAIR DATA

Los principios FAIR establecen que los datos deben ser:

  • Findable (Encontrables): deben contar con identificadores únicos y persistentes (por ejemplo, URIs) y estar descritos con metadatos estructurados que permitan su localización e interpretación.
  • Accessible (Accesibles): deben poder ser recuperados a través de protocolos universales como HTTP o HTTPS, permitiendo el acceso seguro mediante certificados digitales, y garantizando que los metadatos sigan disponibles incluso si los datos originales dejan de estarlo.
  • Interoperable: deben utilizar vocabularios estandarizados y formalizados, como OWL y RDF, ampliamente adoptados y comprendidos por distintos sistemas y comunidades.
  • Reusable (Reutilizables): deben publicarse bajo licencias claras que definan sus condiciones de uso, incluir información sobre su procedencia, y cumplir con los estándares del dominio correspondiente, lo que favorece su aplicación en distintos contextos sin pérdida de fiabilidad.
Principios FAIR Alineación con Principios FAIR
Findable (“Encontrable”) F.1: A los (meta)datos se les asigna un identificador global único y persistente: Todas las entidades deben contar con un URI que actúe como identificador único persistente.
F.2: Los datos son descritos con metadatos expresivos: Los datos deben describirse de manera estructurada y expresiva a través de OWL/RDF. Para cada entidad, se deben definir un conjunto de metadatos que detallen su alcance y conexiones con otros conceptos.
F.3: Los metadatos incluyen clara y explícitamente el identificador de los datos que describen: Cada entidad debe constar de unos atributos fundamentales, que indiquen específicamente su identificador, junto con un conjunto de relaciones que apunten a otras entidades a través de sus respectivos identificadores únicos.
F.4: Los (meta)datos se registran o indexan en un recurso con capacidad de búsqueda.
Accesible A.1: Los (meta)datos se pueden recuperar mediante su identificador utilizando un protocolo de comunicaciones estandarizado: Los datos y metadatos de todas las entidades deben ser recuperables a través de su URI mediante el protocolo HTTPS.
A.1.1: El protocolo es abierto, gratuito y universalmente implementable: Se debe usar el protocolo HTTP, que permita la resolución entre los identificadores y los recursos web que representan tales identificadores.
A.1.2: El protocolo permite un procedimiento de autenticación y autorización, cuando sea necesario: Para que los datos se puedan obtener de manera segura, la comunicación debe estar protegida con certificado digital, por lo que las peticiones deben ser de tipo HTTPS. Se podría adoptar OAuth para la autenticación y autorización de acceso a recursos.
A.2: Los metadatos son accesibles, incluso cuando los datos ya no están disponibles: Se debe garantizar la persistencia en el tiempo de los metadatos.
Interoperable I.1: Los (meta)datos usan un lenguaje formal, accesible, compartido y ampliamente aplicable para la representación del conocimiento: Deben utilizarse lenguajes como OWL y serializaciones RDF (JSON-LD, Turtle, RDF/XML) para garantizar la interoperabilidad.
I.2: Los (meta)datos usan vocabularios que siguen los principios FAIR: Todas las ontologías deben ser recuperables.
I.3: Los (meta)datos incluyen referencias calificadas a otros (meta)datos: Siguiendo el enfoque de Linked Data, las ontologías y las instancias de las mismas deben estar enlazadas a otras ontologías y, eventualmente, a recursos de grafos externos de contenido similar o complementario.
Reusable R.1: Los (meta)datos se describen ampliamente con una pluralidad de atributos precisos y relevantes: Es necesario modelar una ontología que describa el ámbito de los datos con alta expresividad. Además, las propiedades definidas por cada entidad deben alinear propiedades complementarias identificadas en ontologías establecidas equivalentes.
R.1.1: Los (meta)datos se publican con una licencia de uso de datos clara y accesible.
R.1.2: Los (meta)datos están asociados con información detallada sobre procedencia.
R.1.3: Los (meta)datos cumplen con los estándares de la comunidad relevantes para el dominio: El enfoque para la definición de la ontología se basa en la reutilización de ontologías previamente usadas para los conceptos modelados, siempre que sea posible. Además, es recomendable realizar un mapeo y alineación de conceptos de varias ontologías para ofrecer una descripción más precisa y completa de los datos.

Actualmente, la mejor manera de garantizar que los datos cumplan con los principios FAIR es publicarlos como Linked Data. Esto requiere prestar especial atención a la generación de datos y metadatos de alta calidad, lo que no solo mejora su reusabilidad para las máquinas, sino que, como consecuencia, también facilita su comprensión y uso por parte de las personas.

Principios de Linked Open Data

Tim Berners-Lee, el creador de la World Wide Web, definió un conjunto de reglas conocidas como los Principios de Linked Data. Estas reglas establecen las tecnologías y prácticas necesarias para publicar datos de manera que impulsen la creación de un espacio global interconectado. Los principios son los siguientes:

  • Utilizar URIs (Uniform Resource Identifier) como identificadores únicos para las entidades.
  • Emplear HTTP URIs para permitir la búsqueda y el acceso directo a estos identificadores.
  • Proporcionar información útil cuando se consulta un URI, empleando estándares como RDF o SPARQL.
  • Incluir enlaces a otros URIs, facilitando la conexión y descubrimiento de más datos relacionados.

Publicar datos como Linked Data es una excelente forma de implementar los principios FAIR en la práctica, ya que aborda directamente los aspectos clave de estos principios.  Los datos enlazados utilizan URIs como identificadores únicos (primer principio) y su asociación con el protocolo HTTP (segundo principio) permite que sean "encontrables" en la Web. La descripción y la relación con otros recursos (tercer principio) se hacen efectivas mediante la aplicación del modelo RDF, mientras que su recuperación y manipulación se realiza a través del protocolo SPARQL. El cuarto principio, junto con el tercero, es responsable del enlace efectivo de datos de diferentes fuentes y retoma la idea de que los beneficios de enlazar datos se potencian cuando estos son abiertos.
Aunque los principios FAIR son más amplios y aplicables a otros activos además de los datos, Linked Data proporciona una base técnica sólida para lograr la interoperabilidad y reutilización que FAIR busca promover.

La implementación de una arquitectura con verdadera interoperabilidad semántica proporciona ventajas decisivas para las organizaciones:

  • Permite la creación de un tejido de datos conectados, transformando datos aislados en un ecosistema de conocimiento interrelacionado. Esto, a su vez, mejora la calidad de la información al reducir ambigüedades y enriquecer el contexto de los datos.
  • Dota a los sistemas de la capacidad de razonamiento automático, permitiendo inferencias y el descubrimiento de relaciones no evidentes. Esto, junto con la facilidad para incorporar nuevas fuentes de datos sin comprometer la coherencia del sistema, proporciona una escalabilidad sostenible a medida que el ecosistema de datos evoluciona.
  • Democratiza el acceso a la información al facilitar que usuarios sin conocimientos técnicos avanzados puedan interrogar y explorar datos complejos, promoviendo un entorno más inclusivo y colaborativo dentro de la organización.

Para aprovechar al máximo los beneficios de la interoperabilidad semántica, en GNOSS establecemos expectativas sólidas desde el inicio del proyecto, considerándola un elemento fundamental y listo para usar. La implementación de características de interoperabilidad semántica desde el principio, con conectores estandarizados que preservan el contexto, vocabularios compartidos y capacidades para definir precisamente qué significados se intercambian, cuándo y cómo, proporciona a las organizaciones las herramientas necesarias para mantener el control sobre su conocimiento y escalar de manera coherente y resiliente en el universo de datos actual.