Cargando...
Situación de partida
De la fragmentación a la interoperabilidad semántica
La integración y consolidación de información de la producción audiovisual, tanto de vídeo como de audio, es un proceso complejo que requiere la contribución de terceros, la consolidación de múltiples fuentes de datos y, finalmente, el enriquecimiento con metadata para dotar al contenido de una información completa
La plataforma técnica de RTVE Play enfrentaba el desafío de integrar y consolidar información procedente de múltiples fuentes heterogéneas, tanto internas como externas, que incluían desde contenidos históricos del Archivo RTVE hasta las últimas producciones. Esta complejidad técnica se traducía en una experiencia de usuario fragmentada y dificultades para acceder eficientemente al vasto patrimonio audiovisual de la radiotelevisión pública española.
- Fragmentación de sistemas: Necesidad de integrar múltiples sistemas heterogéneos con contenidos históricos y producción actual.
- Interoperabilidad limitada: Dificultad para el intercambio efectivo de información entre sistemas internos y con terceras partes.
- Metadatado insuficiente: Los contenidos carecían de un etiquetado preciso y detallado que facilitara su búsqueda y acceso.
- Experiencia de usuario mejorable: Necesidad de ofrecer una navegación más intuitiva y semánticamente consciente de sus recursos.
Descripción de la solución
RTVE Grafo: Un Proyecto de interoperabilidad semántica

RTVE Grafo quiere resultar útil a las personas y a sus demandas de conocimiento expresadas a través de sus procesos de interrogación. Para ello, el proyecto ha transformado los datos y conocimientos masivos de RTVE Play en respuestas rápidas y precisas a preguntas complejas en un escenario que asume la necesidad de que las respuestas sean explicables, utilizando, para ello, inteligencia artificial basada en la emulación de un razonamiento similar al humano (razonamiento semántico) operada con la tecnología de grafos de conocimiento de alto rendimiento.
RTVE ha implementado para ello y sobre la base del grafo de conocimiento de RTVE Grafo un buscador semántico facetado que permite la búsqueda textual, la búsqueda contextual, la búsqueda avanzada por entidades, así como la generación de páginas con información enriquecida. En suma, ha construido un sistema de interrogación y recuperación de la información de RTVE PLay más intuitivo, sencillo, natural y contextual.

Esto significa, en la práctica, que las búsquedas no solo se basan en palabras clave, sino en el significado y contexto de los términos, lo que las hace más eficientes y relevantes.
El grafo de conocimiento de RTVE integra unos 2.000.000 de recursos digitales, 26 millones de entidades, unos 85 millones de relaciones entre esos diferentes objetos y entidades, y 167 millones de triples, que se utilizan para entender el significado del término que el usuario introduce en la búsqueda; pero también para ofrecerle un sistema de exploración de la colección y, en general, de todos los recursos, basado en un buscador facetado, entre otras utilidades, que le permite disponer de todos los posibles modos de navegación sobre ese conjunto de entidades. La ontología y el RTVE Grafo permitirá representar los contenidos de un modo más preciso, detallado, exhaustivo y expresivo, y facilitará formas de relación entre los usuarios y los mismos de manera más natural y conversacional.
El proyecto RTVE Grafo persigue proporcionar la mejor experiencia posible a sus visitantes digitales, ofreciendo un motor de búsqueda que interroga un grafo de conocimiento donde están enlazados los recursos audiovisuales entre sí lo que posibilita presentar resultados bien organizados por entidades, además de enriquecidos y contextualizados. En definitiva, una de las finalidades del proyecto ha sido facilitar al público una experiencia de navegación y búsqueda más intuitiva, inteligente, personalizada, semánticamente significativa y eficaz.
Y todo ello, asegurando que esta nueva experiencia de descubrimiento de conocimiento y navegación por los contenidos de la Radio y Televisión Española funciona por igual sobre cualquier clase de dispositivo, de manera que todos los usuarios puedan acceder a lo que les interesa y actuar como deseen en el marco RTVE Grafo en cualquier momento y lugar.
Dimensión Tecnológica
Probablemente, el resultado más destacado y de más largo alcance del presente proyecto digital ha sido la consolidación de los contenidos procedentes de la Radio y Televisión Pública Española en un gran grafo de conocimiento unificado, extensible, expresivo e interrogable por máquinas y personas facilita el que los usuarios puedan recuperar esos recursos en función de cualquier interés o intención.
Modelo Ontológico de RTVE
Para la consolidación de todos los datos de RTVE Play en el grafo de conocimiento unificado ha sido preciso diseñar y desarrollar un proceso de sincronización que recolecta en línea los datos de los sistemas de RTVE y los anota semánticamente según la ontología basada en EBUCorePlus definida y vocabularios de términos adoptados (como es el caso de ESCORT 2007 - EBU System of Classification Of Radio and Television Programs), representándolos en forma de tripletas (oraciones predicativas con la forma sujeto+predicado+objeto) y depositándolos en el almacén semántico (base de datos de grafos) que está en el corazón de la nueva plataforma de IA semántica de RTVE.

El proyecto ontológico desarrollado en RTVE Play para la construcción de su Grafo de Conocimiento ha extendido la ontología de dominio EBUCorePlus y la ha hibridado con esquemas de metadatos y vocabularios de propósito general como son Dublin Core (dc) y schema, integrándolos en un marco ontológico común que representa el conjunto de las actividades desarrolladas en el ámbito audiovisual, entendido éste en el sentido de conjunto de técnicas, prácticas y procesos relativos al funcionamiento de un ente audiovisual.
Para la correcta anotación semántica ha sido preciso realizar un alineamiento de datos de los contenidos existentes en las bases de datos de RTVE con las clases y atributos definidas en la ontología de RTVE y en algunos casos mejorar el metadatado de dichos contenidos en los sistemas de origen. Un objetivo crucial del proyecto RTVE Grafo era mejorar dicho metadatado, es decir, la forma en que se etiquetan y describen los contenidos de RTVE. Un metadatado más preciso y detallado facilita la búsqueda y el acceso a la información. Desde un punto de vista interno, el proyecto pretendía, por tanto, desarrollar un sistema afinado de anotación y representación semántica de contenidos que acortara la distancia entre RTVE y el conjunto variado de audiencias a las que una institución pública ha de dirigirse y para las que ha de hablar. Para ello y más allá de su uso público. RTVE Grafo se utiliza para anotar, organizar y presentar la información de un modo significativo, acopiando, por ejemplo, en la ficha de cada contenido toda la información relevante relacionada con ella.

El sistema de interrogación, búsqueda y recuperación de la información de RTVE Grafo trabaja en el escenario tecnológico del Programa de Inteligencia Artificial interpretada semánticamente o basada en la explotación por parte de humanos y máquinas de las posibilidades inherentes al enlazado de datos en un grafo de conocimiento. Ello no sólo es la condición para que los sistemas puedan interpretar el conocimiento generado por RTVE, sino para enlazarlo entre sí y, en el futuro, con terceras fuentes que puedan enriquecer ese contenido y contextualizarlo, gracias al marco de Inteligencia Artificial Contextual que RTVE Grafo proporciona.
Estándares Semánticos y Datos Enlazados
El Grafo de Conocimiento de RTVE Play se ha construido sobre los estándares de la web semántica y de acuerdo con los principios de la Web de Datos Enlazados (o Linked Data Web), lo que ha permitido:
- Conectar los sistemas de gestión de los recursos audiovisuales y documentación de Televisión Española con la publicación del espacio digital RTVE Grafo.
- Optimizar el uso de dichos sistemas de documentación, dando valor al conjunto del trabajo de todas las áreas de la corporación.
- Convertir el sistema de información de RTVE en un Grafo de Conocimiento que se expresa por medio de una Web de Datos Enlazados.
- Desarrollar modos de interrogación y visualización de ese Grafo adaptados a diferentes audiencias y orientados a maximizar la satisfacción de sus intereses, ofreciendo datos relacionados explícitamente con aquellos resultados que satisfacen las preguntas del usuario.
- Construir páginas web temáticas sobre la base de un conjunto de datos o subgrafo que cumpla con ciertos requisitos.
- Construir una experiencia semánticamente consciente de exploración, descubrimiento, interrogación y búsqueda por los contenidos de RTVE, que posibilita explorar en profundidad y de manera contextual cualquier tema relacionado con los recursos digitales que conforman en mundo de la televisión.
Todos los contenidos de esta web están representados y publicados según los estándares del W3C para la web semántica y de acuerdo con los principios que promueve el Linking Open Data Project con el fin de promover y facilitar la publicación y enlazado de datos en la web. Estos metadatos semánticos generan, como hemos ya señalado, un grafo de conocimiento unificado que es explotado en primera instancia, si bien no sólo, en la propia web a través de los sistemas de interrogación y recomendación, ofreciendo a los usuarios una experiencia superior.
Impacto
RTVE son Conversaciones
RTVE son conversaciones. Conversaciones personales, pues cada usuario que la visita es distinto y desea cosas diferentes, construye preferencias varias, aspira a cosas diversas. RTVE debe ser capaz de hablar con todos. Hablar con sentido, oportunidad y utilidad con cada persona que se acerca sería el objetivo del grafo de RTVE Play, una plataforma con una fuerte vocación inclusiva que integra a todos, ciudadanos, usuarios habituales, profesores, investigadores, estudiantes, documentalistas, atendiendo a su inherente diversidad.
El proyecto digital RTVE Grafo permite generar ese relato, esa conversación personal con diversas audiencias proporcionando una conversación útil, contextual, rica, pero sobre todo personal.
El proyecto RTVE Grafo ha transformado radicalmente la forma en que RTVE gestiona y presenta su patrimonio audiovisual, estableciendo un nuevo estándar para la industria audiovisual española, creando un valor tangible para la organización y los usuarios:
- Interoperabilidad mejorada: Capacidad de intercambio de datos manteniendo significado claro e inequívoco entre sistemas heterogéneos.
- Acceso unificado: Todos los contenidos de RTVE accesibles desde un único punto de interrogación.
- Búsquedas más efectivas: Sistema que entiende el contexto y significado, proporcionando resultados más relevantes y precisos.
- Experiencia personalizada: Capacidad de generar conversaciones útiles y contextuales adaptadas a diferentes audiencias.
- Liderazgo en estándares: Como miembro de la UER, RTVE eleva los estándares de interoperabilidad de la industria audiovisual español.
- Base para IA avanzada: Infraestructura preparada para hibridar con otras tecnologías de inteligencia artificial y desarrollar servicios futuros.