Categorías
Ciencia de la información

Ley de Lotka // Los autores más productivos

Revisamos la Ley de Lotka para mediante análisis bibliométricos encontrar a los autores más productivos. Esta ley dice que bajo determinadas circunstancias podemos predecir la cantidad de autores con una cantidad de n trabajos publicados.

Se espera que una pequeña cantidad de autores publique una gran cantidad de trabajos sobre un tema, pero entre los probemas que encontramos a esta ley está el caso de un autor que publique un solo artículo muy relevante y que no vuelva a publicar del tema. En ese caso este índice no revelaría la importancia de dicha publicación.

Algo que he encontrado es que esta ley bibliométrica se creó para medir la producción científica, pero puede aplicarse a mediciones a producción en la web. ¿Un blogger es más importante que otro por la cantidad de publicaciones? ¿Quién gana en temas de cantidad vs. calidad en cuanto a producción de contenidos?

Puede descargarse el artículo donde Lotka anunció su ley de este enlace

Categorías
Ciencia de la información

El futuro del libro // Bibliometría y e-books

The Future of the Book. from IDEO on Vimeo.

Gracias a Pablo Arrieta llegué a éste video sobre el futuro del libro. Aquí presentan varias ideas sobre cómo serán los libros o cómo se modifican nuestra idea de lectura; tema que había abordado en un post anterior sobre lectores electrónicos. Aquí incluyen temas muy propios de la bibliotecología como lo es la bibliometría, al saber qué referencias hace un documento y en dónde lo mencionan; tiene acceso a comentarios de otros lectores, un tema que se aborda desde la biblioteca 2.0 desde las redes pero no directamente relacionada con el documento (se propone el uso de cosas como Open Library que son OPACs o catálogos 2.0 o Library Thing que generan discusiones en objetos paralelos al documento). Esta propuesta muestra las conversaciones en el objeto (el libro electrónico) y no en una plataforma externa a él (un sitio web donde se referencia el libro pero no necesariamente implica que pueda leerse).

Alice, la última forma del libro presenta la lectura como un servicio. En nuestras clases hemos hablado sobre esto: ¿Qué tal si nos suscribimos a una novela como servicio como ocurre con la tv por cable? En ese sentido los usuarios podrían intervenir en la creación de la historia, en vez de adquirir un producto terminado; en ese caso la lectura sería una lectura y escritura, con con un texto en eterno desarrollo.

¿Cómo crees que evolucionará el futuro del libro? ¿Qué otras cosas le añadirías a estas sugerencias?

Categorías
Ciencia de la información

¿Qué es eso de métricas para arquitectura de información?

Este semestre estoy viendo una materia llamada «Métrica y arquitecturas de información». La primera vez que escuché el nombre me sonó a algo que tenía que ver con bibliometría aunque no estaba muy seguro de su relación con arquitecturas de información, tema que ya he tratado anteriormente en este post.

Pues bien, en esta materia hemos analizado bases de datos bibliográficas y comparando las opciones que presentan en cuanto a la búsqueda, recuperación de información, puntos de acceso (como autor, tipo de documento -artículo, libro, etc.),  depuración y presentación de resultados de búsquedas. La he encontrado particularmente útil ahora que estoy a cargo de un OPAC o catálogo de biblioteca y me he dado cuenta que los resultados de las búsquedas muchas veces se pasan por alto a la hora de diseñar sitios en internet, como si lo único que importara es que la base de datos hiciera su query y trajera cualquier cantidad de información, sin importar si es relevante o pertinente, si le estamos dando a nuestros usuarios toneladas de información para que se pierda en ella.

Para hacer una pequeña prueba he decidido usar uno de los sitios más consultados en Colombia, el sitio del diario www.eltiempo.com donde hice una búsqueda simple sobre la primer noticia que encontré en su portada

Portada de ElTiempo.com 2009-10-02
Portada de ElTiempo.com 2009-10-02

Ingresé «Rio de Janeiro, sede de los Juegos Olímpicos de Verano de 2016» en el buscador y obtuve 11 resultados:

Resultados de búsqueda en ElTiempo.com 2009-10-02
Resultados de búsqueda en ElTiempo.com 2009-10-02″

Esto puede darme a entender que no se estan usando los títulos como puntos de acceso, o que la única forma que pueda acceder a una noticia desde el buscador es que la noticia esté en Archivo y tenga al menos un día de anterioridad. En todo caso se están recuperando documentos a partir de stop words como lo demuestra la última noticia recuperada: «¿U2 en Colombia? ¿Que al Campín no le va a ocurrir nada? ¡No seamos ingenuos!» a partir de las palabras «de» y «los» que coinciden con nuestra búsqueda inicial y son stop words.

ElTiempo.com realiza depuraciones en sus búsquedas por portal, secciones y fecha, ordenacion de resultados por relevancia y más antiguo y más reciente primero. Me pareció un muy buen método el uso de la «Línea de tiempo» para mostrar las noticias por densidad vs. años aunque mi clase de Métricas para arquitectura de información me ha enseñado a trabajar más en las posibilidades que le brindas al usuario para recuperar información en entornos web. Imagino que el realizar una búsqueda con palabras poco usadas como «Olímpicos» te genera estos pocos resultados, habría que hacer la prueba con palabras más frecuentes en las noticias a ver qué tal reacciona el buscador al recuperar muchos más resultados.

Aclaro: este es apenas un ejercicio académico, felicitaciones a los desarrolladores del sitio de noticias por su buen trabajo y su reciente actualización; siempre van a haber comentarios sobre lo que se pordía mejorar y este es solo uno de ellos, tal vez fuera de lugar. Al final de este post dejo un taller común para métricas y arquitectura de información y su respuesta.

¿Debemos dejarle siempre todo el trabajo de búsqueda y recuperación a Google?

Métricas para arquitectura de información

Descargar