Categorías
Ciencia de la información

Realidad aumentada y búsqueda de información multimedia

¿Cuántas veces ha tenido una canción en mente y no conoce ni el título de la obra, ni su autor, o tan siquiera alguna referencia que le permita identificar esa obra? ¿Alguna vez ha ido a lugares históricos y no recuerda exactamente qué sucedió allí? Algo que puede ser muy útil para esto es la realidad aumentada y la recuperación de información multimedia.

Vamos por partes: la información puede representarse en múltiples formatos; la información textual, que es la que está leyendo justo ahora, la misma que usa para realizar búsquedas en motores de búsquedas como Google o Bing y la información multimedia. Ésta última incluye imágenes, sonidos, videos, animaciones y cosas por el estilo. La información multimedia usa simultáneamente sonidos, imagenes y hasta texto como lo menciona la Real Academia Española.

¿Cómo se recupera este tipo de información?

La forma más común de recuperar informacón multimedia es hacer una búsqueda textual; ésto es particularmente útil cuando tiene información extra sobre lo que quiere recuperar, pero lo ideal sería hacer una búsqueda multimedia a partir de información multimedia, como buscar las imágenes que se parecen a una imagen que usted tiene o tararear una canción para realizar una búsqueda de información a partir de los sonidos que las máquinas interpretan de su voz.

Las máquinas deben encontrar patrones similares. En el caso de imágenes las formas, colores o texturas deben coincidir (como podía hacerlo www.like.com, adquirido por Google en el 2006 y servicio únicamente disponible en Estados Unidos). En los sonidos las notas son un factor determinante para reconocer una tonada y poder compararla con otra (como lo hace www.shazam.com).

Otro ingrediente: Realidad aumentada.

La realidad aumentada es una capa digital que está sobre la realidad que nosotros percibimos por nuestros sentidos, según Realidadaumentada.info es “combinar el mundo real con el virtual”. La hemos visto infinidad de veces en películas de ciencia ficción, o de aventuras. ¿Recuerda cuando El Exterminador buscaba a Sarah Connor en la primer película de la saga Terminator? El robot interpretado por Arnold Schwarzenegger veía todo de color rojo y a medida que los objetos aparecían,letras y símbolos le daban información sobre lo que observaba a su paso. En películas o videojuegos de aviones, cuando el piloto viaja observa, además del horizonte, un montón de indicadores como altitud, velocidad, coordenadas de su ubicación, etc. Todas esas cosas que no vemos sólo con nuestros ojos son realidad aumentada.

[youtube:http://www.youtube.com/watch?v=9MeaaCwBW28]
Así ve El Exterminador, los datos extra son realidad aumentada. Video por izirizibizi (vía Youtube).

¿Ciencia ficción o actualidad?

Actualmente existen aplicaciones que nos permiten ver esas capas digitales que recubren nuestra realidad. Necesitamos dispositivos con cámaras de video o micrófonos para captar el entorno y que las máquinas puedan mostrarnos lo que nuestros ojos y oidos no pueden. Por ejemplo, esta aplicación para iPhone muestra la ruta más cercana al transporte público con flechas, información extra como distancia en millas o kilómetros y lo hace reconociendo su ubicación mediante el sistema de posicionamiento global (GPS)

[youtube:http://www.youtube.com/watch?v=U2uH-jrsSxs]
Aplicación de realidad aumentada para iPhone probada en una calle. Video por acrossair (vía Youtube).

Google Goggles es la respuesta del gigante de las búsquedas a esta tendencia. Mediante fotografías tomadas por un dispositivo móvil, el buscador realizará una búsqueda, sin necesidad de escribir texto. En su sitio oficial (http://www.google.com/mobile/goggles) muestra cómo goggles puede reconocer texto (muy útil por ejemplo para reconocer escritos en otro idioma), lugares, libros, obras de arte, vinos y logos entre otros.

El ejemplo de Goggles con reconocimiento de una imagen y de texto:

[youtube:http://www.youtube.com/watch?v=ck6Ez7u7HNU]
Reconocimiento de El David, de Miguel Ángel a través de Google Goggles. Video por maggblog (vía Youtube).

Shazam por su parte toma melodías y reconoce canciones. Hice la prueba con el tema «Isle of Her» de Klaxons y lo reconoció sin problema, con bajo volumen y a una distancia de 3 metros. Aquí lo vemos en acción:

[youtube:http://www.youtube.com/watch?v=eogz4Gozj-Y]
Shazam reconociendo la canción “Have Fun Go Mad” de Blair. Video por VonKlinkerhofen (vía Youtube)

Así, lo único que resta es que nuestros contenidos locales aparezcan en la red, necesitamos compartir multimedia, acceder a dispositivos móviles y a conexión a internet en cualquier lugar para poder beneficiarnos de estos avances y empezar a entender nuestros espacios como espacios digitales, donde internet no está sólo en los computadores de escritorio sino en cualquier esquina.

Categorías
Ciencia de la información

Mediateca Humberto Monroy // Proyecto Génesis y la historia del Rock en Colombia

Proyecto Génesis

Este fue el diseño que implementamos para el proyecto final de Modelado de Unidades de Información Digitales, una mediateca que almacene información sobre un tema que me gusta bastante y creo que se ha descuidado en términos patrimoniales: El Rock en Colombia. En este proyecto tuvimos que enfrentar varios problemas, aquí anotaré las soluciones que les dimos. Aunque hay detalles que están en proceso nos gustaría buscar la forma de mantener este proyecto y alimentarlo poco a poco, a ver qué resulta.

El Proyecto Génesis busca centralizar información sobre el rock en Colombia. Tiene tres aspéctos claves en su desarrollo: El derecho de autor en entornos digitales, el componente social de la plataforma y la parte técnica.

El derecho de autor: Entramos en la discusión del uso de material multimedia en entornos digitales, material que fácilmente hace parte del patrimonio de nuestro país y que además puede llegar a ser complicado encontrar, hablando de discos del rock en colombia en sus primeros años, por ejemplo. Cuando un libro deja de editarse, las bibliotecas pueden copiar este material, por excepciones y limitaciones de la ley. El problema es que una copia física se comporta de manera diferente que una copia digital, donde es mucho más fácil que se distribuya a cientos o miles de personas. ¿Qué propusimos? Un sistema de licenciamiento que va desde el dominio público, pasando por toda la gama de licencias Creative Commons, hasta llegar al Copyright. Hemos contactado a algunos de los protagonistas de esta época del rock y les parece bien usar nuestra plataforma (Gracias a Tania Moreno), esto nos anima a continuar con el proyecto y buscar abrir la mayor cantidad de contenidos posible.

El componente social de la plataforma: Esta plataforma permite que cualquier usuario pueda registrarse y subir su propio contenido. No queremos atarnos a estar pendientes de todo el contenido producido por nuevas bandas colombianas, así que pensamos en darle la posibilidad a la gente interesada en este tema que aporte contenido a la mediateca sin perder el control de su contenido, usando las licencias que mejor se adapten a lo que quieren hacer con su material. Actualmente estamos en pruebas cerradas, mientras adaptamos las categorías de cada publicación los usuarios solo se pueden dar de alta con el perfil «suscriptores»; más adelante podemos darles permisos de autores.

La parte técnica: Para la mediateca usamos una brillante idea de Daniel Gil, un bibliotecario a quien respeto por su gran labor, implementada en la Biblioteca Hotrats, donde luego de abandonar el uso de Scriblio, recurrió a varios plugins de WordPress para adecuar un blog a las necesidades de un OPAC. Al igual que Daniel usamos Kau Boy’s AutoCompleter para el buscador y Custom Taxonomies para agregar campos especiales a cada publicación, como tipo de licencia. El usar una taxonomía personalizada nos ayudó a mantener autoridades de materia y de autor en las publicaciones. Usamos un tema minimalista para centrar la atención en los contenidos, además de usar un tema liviano para facilitar su carga, teniendo en cuenta que vamos a trabajar una mediateca que en web puede resultar crítico si los contenidos son muy pesados.

Entre otros plugins que usamos está Embed Iframe para poder agregar frames a las publicaciones, como mapas de Tagzania. Usamos WPtouch iPhone Theme para detectar si nos visitan desde un iPhone o iPod Touch y adecuar el blog a este dispositivo. Para terminar agregamos WPaudio para que si en una publicación se agrega un archivo de audio, automáticamente se reemplace el enlace por un reproductor y poder escuchar enseguida el archivo desde la web. Hicimos la prueba con un tema de Banda Nueva, publicación que protegimos por contraseña mientras aclaramos el tema de derechos de autor de este material. Para evitar este tipo de inconvenientes nos gustaría trabajar en este proyecto.

Estamos en una primera fase de adecuación de la plataforma. Según como se vayan dando las cosas estaremos publicando nuestros avances.