Veracidad y confiabilidad en internet // El día que me timaron

Recientemente me pidieron evaluar dos sitios web y dar mi opinión sobre cuál de los dos recomendaría a un estudiante de arte. El primer sitio es sobre Miguel Ángel, mientras que el segundo  trataba sobre Jacopo.

¿Qué pasos debería seguir para verificar su validez? A simple vista los dos parecían creíbles, pero empecé revisando los sitios que alojaban las páginas. Ahí encontré una pista que me pareció importante: la página de Michelangelo.com estaba plagada de errores, enlaces rotos y problemas de comunicación con la base de datos, mientras que la página de Jacopo estaba dentro del hosting de la Universidad de Michigan.

Paso dos: Revisar su contenido. La página de Miguel Ángel vendía posters, mientras que la de Jacopo hablaba sobre sus pinturas, la técnica empleada y su ubicación física. Si el usuario de la información era un estudiante de artes no le iba a presentar un sitio que le vendiera afiches.

Paso tres: Revisar el autor. Unos diseñadores de sitios web contra la Universidad de Michigan. ¡Nada que hacer! ¿Cómo no le iba a creer a la prestigiosa Universidad de Michigan?

Mi diagnóstico luego de revisar estos aspéctos es que la página de Miguel Ángel era falsa, mientras que la página de Jacopo era confiable. ¿Qué opinión hubieras dado?

Me faltó usar un recurso más: Buscar otros sitios que hablan sobre el artísta, en este caso, los sitios que hablan sobre Jacopo di Poggibonsi. Donde encontré una página no enlazada que develaba la verdad sobre éste artista.

Así como este experimento realizado por algunos estudiantes de la Universidad de Michigan para crear un artista falso hay varios sitios en la web con información falaz. Además, hoy en día cualquiera tiene la capacidad de publicar información en la web pero nadie está obligado a publicar información verídica. ¿A quién creerle? Lo que aprendí es que debo:

  • Verificar la autoridad de quien publica información.
  • Verificar el contenido, su calidad, profundidad, relevancia, etc.
  • Verificar la intención del autor.
  • Verificar otros documentos sobre el mismo tema.

Creo en el buen proceder de las personas por el dilema del prisionero que mencionó en un post anterior, pero no siempre la intención de un autor es comunicar la verdad.

Para terminar un pequeño ejercicio: ¿Qué opinan de Genpets.com?

Recuperación de información Distribuida y en Paralelo

No resultó fácil encontrar información sobre estos temas. Recomendación: Leer Modern Information Retrieval de Ricardo Baeza-Yates y Berthier Ribeiro-Neto. Capítulo 9.

Para hacer recuperación de información en paralelo se toman grandes colecciones de documentos, se indexan para poder recuperar cada partición del documento y almacenan en varios dispositivos, es decir, pueden existir un documento de 3 Gb almacenado en tres discos de 1Gb que se reconstruye a partir del index. Así, si tenemos una gran cantidad de documentos podemos realizar varias búsquedas simultáneas para recuperar diversos documentos almacenados en diferentes discos, no es necesario esperar a que un proceso termine para empezar el siguiente. Para esto Google usa la indexación de la web.

Mapas conceptuales de las redes sociales que conforman el ecosistema económico en Cleveland y Silicon Valley.
Mapas conceptuales de las redes sociales que conforman el ecosistema económico en Cleveland y Silicon Valley.

Descentralizado Vs. Distribuido

En cuanto a la recuperación de información distribuida un buen ejemplo es la blogósfera: Muchos nodos son capaces de producir, consumir e intercambiar información.  Se crean redes distribuidas que a diferencia de las redes centralizadas o las descentralizadas nunca van a estar incomunicadas dado que siempre habrá un camino que las una. El problema de la recuperación de información distribuida es su heterogeneidad: No sabemos qué formato nos vamos a enfrentar, su idioma o la calidad de su contenido. Para esto se usa el pagerank, para valorar la información y darle prioridad a la hora de recuperarla.

La diferencia entre Cleveland y Silicon Valley que mencionan en Nomada hablan sobre la paradoja del declive de Cleveland, ya que está altamente jerarquizada mientras que Silicon Valey presentan una topología de red distribuida que no necesariamente obedece a las jerarquías de sus nodos. Puede verse en la imágen que si un nodo central de Cleveland se desconecta dejará por fuera de la red a varios nodos que dependen de él.

[Actualización del 2008-10-28 con comentarios de clase del profesor Leonardo Machett]

Los militares usaron una tipología de red distribuida para comunicarse, dicha red evolucionó a Internet, la red de redes. Imagínese las búsquedas en una red centralizada, que además respondía a sus usuarios de manera secuencial, es decir, hasta que no se haya recuperado una solicitud de información no se puede realizar la siguiente bísqueda. Ahora imagínese que Google no podrá completar su solicitud hasta que se hayan respondido todas las solicitudes anteriores. ¿Cuánto tardaría?

Para poder responder varias consultas al tiempo se realiza la recuperación de información en paralelo.

Entre las características de la recuperación de información distribuida encontramos que la información almacenada puede ser heterogénea. Es decir, puede buscar cierta información que no se encuentra en texto como el usuario lo espera, sino que su formato está en audio.

Otra característica emergente de la recuperación de información distribuida son las difernecias entre el idioma en que se recupera la información y la profundidad de los contenidos recuperados. Quien escribe puede ser un experto en un tema o un principiante, inclusive un embustero (como ya lo comentaré en un post siguiente)


Referencias

ARCHITECTURE & LANGUAGE IMPLEMENTATION. Distributed and parallel information retrieval. [en línea]. [consultado 21 de oct. De 2008]. Disponible en  <http://www-ali.cs.umass.edu/Darch/>

BANCHERO, Santiago. Propuesta de plan de tesis [versión entregada]. [en línea]. [consultado 21 de oct. De 2008]. Disponible en <http://camaronbitmap.blogspot.com/2007/02/propuesta-de-plan-de-tesis-versin.html>

EXPLORADORES ELECTRÓNICOS. Topologías de red. [en línea]. [consultado 21 de oct. De 2008]. Disponible en <http://www.exploradoreselectronicos.net/e4pedia/Imagen:Topolog%C3%ADas_de_red.gif>

GARCIA-MOLINA, Hector y TOMASIC, Anthony. Issues in parallel information retrieval.[en línea]. [consultado 21 de oct. De 2008]. Disponible en <http://www.cs.cmu.edu/~tomasic/doc/1994/TomasicGarciaDEB1994.pdf>

La web social en las bibliotecas

Para cerrar esta serie de posts relacionados con el encuentro de estudiantes dejo la presentación de una colega española: Natalia Arroyo, quien hizo su videoconferencia sobre la web social en las bibliotecas de España y algunas notas que me parecen pertinentes.

Para empezar, en España tenían una bibliogósfera consolidada en el 2006. En Colombia no se siente como una “comunidad”. Si ocurre con la blogósfera, pero en ésta los temas son bastante variados, no hablan específicamente de bibliotecas o temas estrechamente relacionados.

Casa de bloggers, iniciativa de Programator

[HTML4]

¿Existen pioneros de la biblioteca 2.0 en Colombia? No conozco (y disculpen mi ignorancia si existe  alguna y no la nombro) una biblioteca 2.0 en Colombia.

Las bibliotecas no se están preocupando por adoptar el cambio, al menos no se han escuchado convocatorias para trabajar en una biblioteca 2.0 en Colombia, he visto gran cantidad de ofertas laborales para trabajar en los cargos comunes, pero nada que apunte a la biblioteca 2.0. ¿Será que los encargados de planear estas transformaciones le temen al cambio? ¿Serán los usuarios los que no están preparados para modificar su manera de ver la biblioteca? ¿Será que nadie quiere cambiar?

Como conclusión de mi trabajo para el encuentro sé que tenemos todas las herramientas para implantar una biblioteca 2.0 en Colombia, diariamente trabajo para adoptar diversas tecnologías 2.0 que se centran en el usuario. Éste trabajo junto al de todo el equipo de e-Sanitas hizo que nos nominaran a “Mejor sitio de educación virtual en línea” en los premios Colombia en línea 2008 y no es un esfuerzo de unos pocos como pudo verse en la cantidad de postulados a los premios. Esto demuestra que hay mucha gente interesada en abrir espacios digitales en Colombia, acortar la brecha digital y migrar a nuevos lugares.

Web social para difundir el conocimiento // Taller práctico

La mejor manera de aprender es haciendo. Luego de presentar la ponencia en el 5° encuentro de estudiantes de la información vamos a usar algunas herramientas.

Enlaza y haz nuevos contactos. Podemos crear una red de muchas formas. Usa estas herramientas no sólo para entretenimiento, pueden ser un gran impulso para la generación de conocimiento.

Piensa local y actúa global

Mañana es el Lanzamiento de Sonido Local V.2

SonidoLocal.com
SonidoLocal.com

Hace algún tiempo tiempo fui invitado como beta tester de la nueva versión de Sonido Local. Muchas de las cosas que pude ver allí me gustaron bastante y sería excelente compartir un sitio como éste con ustedes. Éste es el comunicado del CEO de SonidoLocal:

Buenas tardes,

Por medio de la presente les anuncio el lanzamiento mañana miércoles 1 de octubre 2008 de la nueva versión del sitio web SonidoLocal.com, primer sitio web de Streaming On Demand (escucha a la carta) en Latinoamérica, posicionando Colombia como un país líder en la región sobre nuevos modelos de negocios digitales en la región.

Creado en julio 2007, acabamos de lanzar esta nueva versión este primer de octubre 2008 con un modelo único y novedoso en la región por su diseño y su plataforma que utiliza las ultimas tecnologías de Amazon Web Service y Google.

Ahora los usuarios pueden escuchar gratuitamente, legalmente y con un sólo click una selección de música de todos los géneros incluyendo el catálogo de Universal Music e independientes colombianos.
¿ Ejemplos ? Juanes, Luis Fonsi, Nelly Furtado, Babasónicos, Jerau,Wisin & Yandel, The Rolling Stones, Metallica, Daddy Yankee, La 33, Alfonso Espriella, Calambuco…
¿ No encuentran todavía la música que les gusta ? No se preocupen estamos subiendo música diariamente para proponerles más de 100.000 canciones en las muy próximas semanas.

¿ Cuales son las novedades de esta segunda versión ?
– creación de un perfil para compartir tu música y tu planes con tus amigos
– gestión de listas y de favoritos
– nuevo sistema de noticias y eventos
– nuevo diseño (les recomendamos probar nuestro Xplorer)

Pueden encontrar adjuntos el logo de SonidoLocal y el comunicado de prensa de Universal Music con citaciones de Alejandro Duque, Director del Departamento Digital de Universal Music.

Estoy a su entera disponibilidad para cualquier información adicional

Saludos y gracias

Jerome Sutter
CEO SonidoLocal.com
jerome@sonidolocal.com
http://www.sonidolocal.com

No importa qué música te guste, aquí encontrarás desde lo más pop hasta algunas cosas del underground bogotano. Lo importante es que existen muy pocos sitios que piensen en crear comunidades en Colombia y éste es uno de ellos. Hablé de este sitio como una de las maneras de acortar la brecha digital en Colombia, porque si bien es cierto que el director de este proyecto es francés, la gente que trabaja con él es de aquí.

Comentaba para el blog de sonidolocal.tv que me parece un lugar que puede competir con grandes marcas y me gustaría que fuera un espacio más para personas de aquí que quieran mostrar lo que hacen.

Es interesante ver esta propuesta que sin violar los derechos de autor y la propiedad intelectual presenta muy buenos servicios acercando a las personas a información músical de una manera atractiva, cosa que suele ser poco frecuente.