Los datos abiertos enlazados son algo que parecen cosa de otro planeta, pero aquí hago un ejercicio simple para entenderlos, ver dónde están, cómo funcionan y cuál puede ser su utilidad. Además me topé con una sorpresa frente al feminismo de datos.

Haciendo búsquedas de datos

Usando el servicio de queries de Wikidata puedes hacer múltiples consultas a esta base de conocimiento. Ando aprendiendo sobre cómo hacer este tipo de consultas mediante SPARQL y hay ejemplos sobre la cantidad de hijos de Johann Sebastian Bach. Quise probar este tipo de búsquedas con colombianos en Wikidata para ver cómo me iba, así que en vez de buscar los hijos de un músico alemán, busqué los hijos del pintor colombiano Fernando Botero. Wikidata me respondió que no tenía hijos.

Servicio de queries de Wikidata con los hijos de Fernando Botero (el pintor colombiano).
Servicio de queries de Wikidata con los hijos de Fernando Botero (el pintor colombiano). Abajo se lee «No matching records found» lo que quiere decir que no hay datos.

Para mi fue una sorpresa, porque si no me equivocaba Fernando Botero Zea, quien fue Ministro de Defensa en Colombia es uno de los hijos del pintor.

Enlazando los datos abiertos

Me dirigí a Wikidata, donde se encuentran los datos de Fernando Botero Zea (el político), cuyo identificador es Q5444615 y agregué una nueva declaración (statement) con la propiedad «Padre» con el valor «Fernando Botero», es decir, registré en Wikidata que el padre del político colombiano era el pintor colombiano. Hice lo mismo con el valor de «Madre» para Gloria Zea.

Enlazando los datos de Fernando Botero Zea a los de su padre y su madre en Wikidata
Enlazando los datos de Fernando Botero Zea a los de su padre y su madre en Wikidata

¡Y listo! Los datos abiertos se enlazaron. No tuve que crear el registro de los padres, sino que simplemente tuve que buscar dónde estaban para incluirlos en el registro del hijo.

Comprobando que los datos quedaron enlazados

Hice un nuevo query o consulta para ver qué me decía Wikidata sobre los hijos de Fernando Botero (el pintor, es decir el identificador Q272877) y efectivamente el resultado cambió. Aquí el query que hice:

SELECT ?child ?childLabel WHERE {
  ?child wdt:P22 wd:Q272877.
  SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE]". }
}

Que si lo tradujera a lenguaje humano diría

MUÉSTREME el código-del-hijo y el texto-con-el-nombre DONDE{
 En la propiedad "Padre" (P22), el valor sea Fernando Botero (el pintor, es decir Q272877)
DE POR DIOS PRÉSTEME UN SERVICIO  para que ese resultado no sea un código que lo entiendan las máquinas, sino también muéstreme el texto-con-el-nombre de la primera línea de esta solicitud
}

Y voilà, ahora Fernando Botero, el pintor colombiano, tiene un hijo.

¿Cuál es el poder de los datos enlazados?

Lo más potente de los datos enlazados es que con un simple cambio, todos los datos que estén conectados a un dato se reflejarán automáticamente. Es decir, al momento de escribir este post, Fernando Botero (el pintor) tiene un hijo según Wikidata, Fernando Botero Zea (el político) a quien acabo de incluir. A continuación voy a publicar el resultado de ese query en este blog:

Lo que está en el cuadro anterior no está guardado en el sitio web Nomono.co, sino que es una ventana que muestra el resultado en Wikidata. Es como si hubiera un sitio web dentro de otro sitio web, pero mostrados en un mismo sitio.

El gran poder de los datos enlazados es que a medida que alguien vaya enlazando a los demás hijos de Fernando Botero, este cuadro se irá actualizando automáticamente. Yo no tengo que hacer nada para que los cambios se vean reflejados en Nomono.

Ahora piénsalo en cosas que los bibliotecarios hacemos todos los días: la tediosa catalogación de documentos. En vez de estar creando un nuevo registro por cada nuevo documento (que es lo que comúnmente hacemos) ¿qué tal si nos dedicáramos a enlazar datos preexistentes? Esto ahorraría mucho tiempo, trabajo y aumentaría la fiabilidad de los datos.

Esto por supuesto también tiene un lado menos amable: ¿qué tal si en vez de usar un servicio gratuito como Wikidata y datos abiertos, empezamos a usar datos privados de determinadas compañías que no los compartan? Pues bueno, hay una discusión muy interesante por ese camino, pero no me voy a meter ahí por ahora.

Sobre feminismo de datos

En todo este proceso algo que empezó a aparecer fue lo evidente que resultó la gran cantidad de información de los hombres, pero no de las mujeres. Por ejemplo al ver el artículo de Fernando (el hijo) se encontraba un artículo algo extenso.

Artículo en Wikipedia de Fernando Botero Zea, luego de enlazar a su padre mediante Wikidata.
Artículo en Wikipedia de Fernando Botero Zea, luego de enlazar a su padre mediante Wikidata.

El artículo de Fernando, el padre, era muchísimo más extenso y hasta foto tenía.

Artículo en Wikipedia del pintor colombiano Fernando Botero
Artículo en Wikipedia del pintor colombiano Fernando Botero

Y al redactar «Gloria Zea» para encontrar a la madre de Fernando en Wikidata, casi no aparece información sobre ella en Wikidata. Pensé que había que crear su artículo en Wikidata pero existía, salvo que con muy poca información y sin ninguna referencia. El artículo en Wikipedia de Gloria Zea ni siquiera tenía el cajón de la derecha que aparecía en los dos artículos anteriores.

Artículo en Wikipedia de Gloria Zea
Artículo en Wikipedia de Gloria Zea

Aprovechando que estamos en la campaña de #1Lib1Ref, es decir un bibliotecario una referencia, me puse a buscar imágenes libres de doña Gloria Zea para mejorar su artículo y agregarle más referencias. También esto coincide con las últimas data rodas que hemos venido haciendo con la Comunidad de Grafoscopio y Dataweek sobre feminismo de datos.

A manera de cierre

Como ya dijo Leo en este post sobre ciencia de la información y Wikipedia, que por cierto también se encuentra en nuestro libro, la puerta está abierta para que cualquiera pueda hacerlo. No es tan complicado eso de enlazar datos, pero entre más practiquemos, más nos va a fluir eso.

Más divertido que leer la experiencia de otros resulta hacerlo uno mismo. ¿Te animas? ¿Te podemos ayudar en algo?

Publicado por David Ramírez-Ordóñez

Hola. Soy David. Docente, bloguero y bibliotecario digital. Desarrollo proyectos digitales desde el 2005. Más de mi en este enlace.

Deja un comentario

Tu dirección de correo electrónico no será publicada.