Categorías
Ciencia de la información

¿Qué es eso de métricas para arquitectura de información?

Este semestre estoy viendo una materia llamada «Métrica y arquitecturas de información». La primera vez que escuché el nombre me sonó a algo que tenía que ver con bibliometría aunque no estaba muy seguro de su relación con arquitecturas de información, tema que ya he tratado anteriormente en este post.

Pues bien, en esta materia hemos analizado bases de datos bibliográficas y comparando las opciones que presentan en cuanto a la búsqueda, recuperación de información, puntos de acceso (como autor, tipo de documento -artículo, libro, etc.),  depuración y presentación de resultados de búsquedas. La he encontrado particularmente útil ahora que estoy a cargo de un OPAC o catálogo de biblioteca y me he dado cuenta que los resultados de las búsquedas muchas veces se pasan por alto a la hora de diseñar sitios en internet, como si lo único que importara es que la base de datos hiciera su query y trajera cualquier cantidad de información, sin importar si es relevante o pertinente, si le estamos dando a nuestros usuarios toneladas de información para que se pierda en ella.

Para hacer una pequeña prueba he decidido usar uno de los sitios más consultados en Colombia, el sitio del diario www.eltiempo.com donde hice una búsqueda simple sobre la primer noticia que encontré en su portada

Portada de ElTiempo.com 2009-10-02
Portada de ElTiempo.com 2009-10-02

Ingresé «Rio de Janeiro, sede de los Juegos Olímpicos de Verano de 2016» en el buscador y obtuve 11 resultados:

Resultados de búsqueda en ElTiempo.com 2009-10-02
Resultados de búsqueda en ElTiempo.com 2009-10-02″

Esto puede darme a entender que no se estan usando los títulos como puntos de acceso, o que la única forma que pueda acceder a una noticia desde el buscador es que la noticia esté en Archivo y tenga al menos un día de anterioridad. En todo caso se están recuperando documentos a partir de stop words como lo demuestra la última noticia recuperada: «¿U2 en Colombia? ¿Que al Campín no le va a ocurrir nada? ¡No seamos ingenuos!» a partir de las palabras «de» y «los» que coinciden con nuestra búsqueda inicial y son stop words.

ElTiempo.com realiza depuraciones en sus búsquedas por portal, secciones y fecha, ordenacion de resultados por relevancia y más antiguo y más reciente primero. Me pareció un muy buen método el uso de la «Línea de tiempo» para mostrar las noticias por densidad vs. años aunque mi clase de Métricas para arquitectura de información me ha enseñado a trabajar más en las posibilidades que le brindas al usuario para recuperar información en entornos web. Imagino que el realizar una búsqueda con palabras poco usadas como «Olímpicos» te genera estos pocos resultados, habría que hacer la prueba con palabras más frecuentes en las noticias a ver qué tal reacciona el buscador al recuperar muchos más resultados.

Aclaro: este es apenas un ejercicio académico, felicitaciones a los desarrolladores del sitio de noticias por su buen trabajo y su reciente actualización; siempre van a haber comentarios sobre lo que se pordía mejorar y este es solo uno de ellos, tal vez fuera de lugar. Al final de este post dejo un taller común para métricas y arquitectura de información y su respuesta.

¿Debemos dejarle siempre todo el trabajo de búsqueda y recuperación a Google?

Métricas para arquitectura de información

Descargar

Categorías
Ciencia de la información

Web 3.0 y ciencias de la web por Ricardo Baeza-Yates de Yahoo!

Encontré este video donde Ricardo Baeza-Yates, director del laboratorio de Research de Yahoo! en Barcelona a quien ya he mencionado en este blog al escribir sobre recuperación de información paralela y distribuida. Habla sobre las ciencias de la web, tocando temas como la web semántica o web 3.0 pasando por la web social, las comunidades, el compartir conocimiento y la manera como los investiga.

Me parece interesante que menciona la diferencia cultural entre Asia contra Europa y Estados Unidos, eso significa que el idioma puede ser una barrera importante a la hora de encontrar información de avanzada, ya que no tenemos acceso a múltiples noticias que pueden interesarnos al estar producidas en chino, por ejemplo y aunque Baeza-Yates no ve mayor inconveniente en esto me parece que pueden haber detalles importantes que se pierden en las traducciones o adaptaciones.

Por otro lado presenta el paradigma de búsqueda semántica muy ligado con la web social, es decir, no es únicamente enfocarse en el hecho de que las máquinas procesen algoritmos para crear inteligencia artificial y que buscadores puedan responder a preguntas en lenguaje natural, sino que piensa que la web social y la participación aportan un valor importante, lógicamente porque las máquinas necesitan entradas para engrosar los términos que pueden ligar y ese trabajo muy difícilmente lo harán las mismas máquinas.

Además se habla de la cantidad de información que se pierde debido a la brecha digital. Esto es un problema porque la web social por un lado ofrece visibilidad en la web, pero por otro tiene riesgos sobre la propiedad intelectual del material que se sube. De todas maneras es sorprendente la cantidad gigantezca de información en la web y que dicha información es ínfima dado el potencial de producción de información mundial.

Un sistema social necesariamente está relacionado con un sistema de reputación. Esta idea tiene una gran problemática al entender que lo social está lleno de errores, de caos. Una pregunta puede estar mal formulada, pero su interpretación puede contener conceptos muy válidos que se adquieren a través del contexto y el significado que dicha pregunta adquiere en ese contexto.

Creo que hay muchos temas que avanzan con mucha velocidad, me preocupa un poco que además de la brecha digital también debamos cargar con la cruz de contar con el acceso a la información y no saber usarla.

Categorías
Ciencia de la información

Primer encuentro de bibliotecas en tecnologías de información y comunicación // Talleres Bibliotic 2009

talleres-bibliotic2009
Bibliotic 2009

El primer encuentro sobre bibliotecas y tecnologías de información y comunicación Bibliotic 2009 ya publicó los talleres de capacitación que se ofrecerán; a nuestro cargo se encuentra el taller «Bibliotecas 2.0». Los talleres que se dictarán son:

  • Internacionalización y Generación de Redes en Revistas indexadas
  • Administración de repositorios digitales con Dspace
  • Gestión electrónica de revistas con Open Journal System
  • Bibliotecas 2.0
  • Búsqueda de información avanzada en Internet
  • Redes sociales para intercambio de conocimiento

Para mayor información visite este sitio

Si usted quiere participar con una ponencia puede ver aquí los requisitos para poder hacerlo. recuerde, esta es una actividad colaborativa, entre más participe mejor será.

Puede consultar el sitio oficial de Bibliotic o ver posts anteriores en hiperterminal.com