Política de cookies

GNOSS usa cookies, propias y de terceros, con finalidad principalmente técnica y necesaria para prestación de nuestros servicios y mostrarles contenido relevante. Más información en nuestra política de cookies.

ACEPTA para confirmar que has leído la información y aceptado su instalación. Puedes modificar la configuración de tu navegador.

CASOS DE ÉXITO

El Grafo de Conocimiento del CDTI al servicio de la gestión inteligente del conocimiento tecnológico

Situación de partida

El Centro para el Desarrollo Tecnológico Industrial (CDTI) enfrentaba un problema común a muchas instituciones con décadas de trayectoria: la información valiosa dispersa en sistemas heterogéneos que no dialogaban entre sí. Bases de datos Oracle contenían expedientes estructurados, mientras SharePoint alojaba la documentación técnica, sin que existiera una forma integrada de acceder a ambos repositorios ni de extraer conocimiento significativo de su combinación.

Esta fragmentación impedía aprovechar el verdadero valor del patrimonio tecnológico acumulado. Los análisis demandaban trabajo manual intensivo, las búsquedas resultaban limitadas y las decisiones estratégicas carecían del respaldo que décadas de proyectos financiados podrían haber proporcionado. El desafío consistía en transformar este vasto archivo en un activo estratégico realmente explotable.

La solución requería ir más allá de la simple integración de sistemas. Era necesario construir una capa semántica que permitiera comprender las relaciones entre expedientes, proyectos, organizaciones, tecnologías y personas, convirtiendo datos aislados en conocimiento conectado y accionable.

Descripción de la solución

El grafo de conocimiento como núcleo del sistema

El grafo de conocimiento que constituye el núcleo de BICCO no es simplemente una base de datos unificada, sino una representación semántica del universo tecnológico del CDTI. Se construye mediante un Modelo Digital Semántico expresado en OWL/RDF, un lenguaje formal que permite a las máquinas "comprender" las estructuras de conocimiento de forma similar a como lo haría un experto humano. Este modelo puede hibridar múltiples ontologías para enriquecer la representación del dominio, capturando tanto la información estructurada de los expedientes como los resultados del procesamiento automático de las memorias técnicas mediante técnicas de Procesamiento del Lenguaje Natural e Inteligencia Artificial.

Cuatro propiedades fundamentales definen la potencia del grafo:

  • Unificación de información heterogénea: Consolida en una única estructura semántica datos procedentes de Oracle, SharePoint o fuentes externas, eliminando los silos de información que caracterizaban el sistema anterior.
  • Interrogabilidad: Tanto personas como máquinas pueden formular consultas complejas sobre el conocimiento acumulado, aprovechando la naturaleza explícita de las relaciones semánticas.
  • Expresividad del conocimiento: La información no se limita a simples registros, sino que se representa con toda la riqueza de sus conexiones contextuales, permitiendo inferencias y descubrimientos que permanecerían ocultos en estructuras convencionales.
  • Extensibilidad: Nuevas entidades, relaciones o fuentes de datos se pueden incorporar sin rediseñar el sistema completo, simplemente extendiendo el modelo semántico existente.

Sistema inteligente de búsqueda y exploración de expedientes

El buscador semántico de BICCO supera las limitaciones de las búsquedas tradicionales por palabras clave, incorporando capacidades predictivas y un sistema de búsqueda facetada que permite filtrar expedientes por múltiples dimensiones simultáneamente.

El abanico de facetas disponibles refleja la riqueza del modelo semántico: temas de conocimiento, tecnologías específicas, sectores económicos, temporalidad, localización geográfica del desarrollo, tipología y estado de los expedientes, características de las organizaciones participantes, programas de financiación, finalidades y modalidades de las ayudas, ámbitos de cooperación y rangos presupuestarios. Esta granularidad permite que un técnico del CDTI pueda, por ejemplo, localizar todos los proyectos de biotecnología desarrollados en Cataluña por pymes durante los últimos tres años con presupuestos entre 500.000 y 1.000.000 euros, en cuestión de segundos.

Complementando estas capacidades de búsqueda, el sistema proporciona una ficha enriquecida para cada expediente, incorporando sistemas contextuales y de recomendación fundamentados en el reconocimiento de entidades nombradas, así como visualizaciones gráficas dinámicas que facilitan la comprensión y el análisis de la información.

Sistema de enriquecimiento de datos

El sistema de enriquecimiento de datos de BICCO incorpora datos al grafo de conocimiento y contribuye a mejorar la experiencia de usuario con relación al sistema de búsqueda y exploración de expedientes.

  • Integración con fuentes externas: El sistema se conecta con repositorios de la Linked Open Data Cloud para contextualizar los expedientes con información procedente de DBpedia (la versión semántica de Wikipedia), Wikidata, EPO Linked Data de la Oficina Europea de Patentes, DBLP para publicaciones científicas en tecnologías de la información, y el proyecto Hércules del Sistema de Gestión de Investigación de las Universidades Españolas. Esta última resulta especialmente valiosa, ya que se ha desarrollado también con tecnología GNOSS y previsiblemente publicará datos de investigadores, publicaciones, proyectos y patentes.
  • Extracción automática de conocimiento: El sistema se ocupa de leer de forma automática los documentos de memoria técnica de los expedientes, aplicar técnicas de NLP para reconocer, desambiguar y enlazar entidades nombradas, extraer descriptores tecnológicos y topics temáticos, clasificar expedientes, y consolidar toda esa información en el grafo de conocimiento vinculándola con las entidades ya existentes.

Dimensión tecnológica

Para diseñar el Grafo de Conocimiento de BICCO se ha diseñado un Modelo Digital Semántico que permite identificar las entidades, los atributos y las relaciones que conforman el universo de conocimiento del CDTI. El Modelo Digital Semántico hace referencia a este ámbito de la realidad que está formado por un conjunto de entidades y sus relaciones y que tiene que ver con el modo en el que las personas piensan y se relacionan con el mundo.

El Modelo Digital Semántico es un modelo de representación de los datos contenidos en todos los objetos de conocimiento que afectan al dominio o ámbito de aplicación del CDTI, que proporciona el mapa de las entidades y subentidades que conforman todos los objetos de conocimiento en dicho ámbito y las relaciones entre las mismas. Tiene en cuenta tanto los contenidos que debe representar el modelo como los objetos de conocimiento que lo forman: las entidades y atributos de los diferentes objetos de conocimiento, así como las relaciones entre entidades y entre los diferentes objetos de conocimiento. El modelo puede hibridar varias ontologías para proporcionar una representación más rica y completa del dominio.

Es un sistema escrito en un lenguaje técnico (OWL/RDF) que posibilita que las máquinas o sistemas "comprendan" y traten correctamente el conjunto de entidades al que nos hemos referido para, de ese modo, colaborar con las personas en un marco de sentido común en sus procesos de interrogación, recuperación de la información y descubrimiento de conocimiento.

Impacto

Con la incorporación de BICCO al entorno del CDTI, el centro dispone de un nuevo entorno de trabajo más potente y capaz, en el que realizar búsquedas inteligentes sobre los datos no estructurados, de forma flexible, sencilla, personalizable y segura, sin comprometer la confidencialidad de la información gestionada al observarse plenamente todas las políticas de seguridad del CDTI sobre tratamiento y confidencialidad de los datos.

  • Herramienta de decisión: BICCO se ha consolidado como apoyo fundamental en los procesos de toma de decisiones. La dirección del centro puede ahora basar sus orientaciones estratégicas en análisis rigurosos del conocimiento acumulado, identificando tendencias tecnológicas emergentes, detectando gaps en la financiación de determinadas áreas o evaluando el impacto histórico de diferentes programas de ayudas.
  • Búsquedas inteligentes y flexibles: La capacidad de combinar múltiples criterios de filtrado ha revolucionado el trabajo cotidiano de los técnicos. Lo que antes requería días de consultas manuales en diferentes sistemas ahora se resuelve en segundos con precisión superior.
  • Conocimiento unificado y accesible: La integración de información heterogénea en un único punto de acceso inteligente ha eliminado los silos de información que caracterizaban el entorno anterior, permitiendo análisis transversales que relacionan expedientes, organizaciones, tecnologías y resultados de formas antes impracticables.
  • Automatización de procesos: La extracción automática de información de las memorias técnicas ha liberado recursos humanos especializados, que ahora pueden dedicarse a tareas de mayor valor añadido en lugar de clasificación y etiquetado manual de documentos.
  • Enriquecimiento contextual: Las conexiones con fuentes externas amplían significativamente el contexto de cada expediente, permitiendo relacionar proyectos financiados con el estado del arte científico, con patentes relevantes o con líneas de investigación universitarias complementarias.
  • Escalabilidad garantizada: La arquitectura basada en grafo de conocimiento y modelo semántico formal permite extender el sistema con nuevos tipos de entidades o fuentes de datos sin rediseñar la estructura completa, asegurando que BICCO pueda evolucionar junto con las necesidades del centro.
  • Seguridad y confidencialidad: Todas estas capacidades se han implementado respetando rigurosamente las políticas de seguridad del CDTI sobre tratamiento y confidencialidad de datos. El sistema incorpora controles de acceso granulares basados en roles y permisos que garantizan que cada usuario accede únicamente a la información que le corresponde según su función.
  • Eficiencia operativa mejorada: Los procesos de evaluación y seguimiento de proyectos se han agilizado notablemente. Los evaluadores pueden consultar rápidamente el historial tecnológico de las organizaciones solicitantes, identificar sinergias con proyectos anteriores o detectar posibles duplicidades, todo ello a través de una interfaz única e intuitiva.
  • Evolución tecnológica: BICCO establece una plataforma abierta a la incorporación de nuevas herramientas y enfoques futuros. La arquitectura modular permite integrar técnicas emergentes de IA generativa, análisis predictivo o visualización avanzada sin comprometer los componentes ya operativos.

Tecnologías utilizadas

Graph Discovery Capacidades de IA
Semantic AI Platform Plataformas
Ontology Capacidades de IA
Enrich Capacidades de IA
Context Capacidades de IA
Classify Capacidades de IA
Visual Capacidades de IA
Implicit Graph Capacidades de IA
Argos Plataformas