Also available in English

Inf@Vis!

La revista digital de InfoVis.net

Autofocus
por Juan C. Dürsteler [mensaje nº 151]

La búsqueda de información en masas ingentes de datos es uno de los motivos constante de la Visualización de Información. Autofocus es un software que combina la lingüística computacional con la visualización para conseguirlo.
ClusterMap.gif (53328 bytes)
ClusterMap en AutoFocus
Fuente:
Captura de pantalla en el ordenador del autor.
Pulse sobre la imagen para agrandarla.

Autofocus es un programa de visualización recientemente aparecido en el mercado de la mano de Aduna, transmutación de la antigua Aidministrator (véase el numero 62), empresa holandesa dedicada a la creación de software abierto para la explotación de las posibilidades de la web semántica y de su visualización.

El objetivo del programa es simplificar la búsqueda en archivos existentes en el ordenador, en ficheros de correo electrónico o en websites a través del uso avanzado de elementos de visualización y recuperación de información. 

Con la intención de valorarlo he descargado la versión de prueba (30 días) y la he instalado en mi ordenador.

Una vez instalado y en marcha, lo primero que hay que hacer es definir una fuente de información y explorarla. He empezado por InfoVis.net, lo que le ha costado casi 46 minutos a través de una conexión ADSL de 512Kb/s. Después he barrido mi directorio personal en el disco duro (6,9 Gb y 36.685 archivos) en cerca de 26 minutos

Una vez realizado el barrido el programa ya ha generado sus índices y estadísticas de manera que se puede comenzar a interrogarlo y recibir los resultados muy rápidamente. 

En el margen izquierdo de la pantalla hay una entrada de texto donde se puede introducir las palabras a buscar. A su derecha aparecen inmediatamente los resultados de la búsqueda, sean ficheros, e-mails o páginas web. 

Debajo de la entrada de los términos de búsqueda hay sendas ventanas que permiten ver un histórico de las interrogaciones que hemos ido haciendo y las sugerencias que el propio programa realiza dentro de lo que Aduna denomina Guided Exploration (Exploración Guiada). 

Autofocus1.gif (104949 bytes) Autofocus2.gif (91576 bytes)
AutoFocus mostrando dos de las posibles configuraciones: En ambas se aprecia a la izquierda y arriba el diálogo de búsqueda y debajo dos ventanas con el histórico de los términos entrados en la búsqueda y las sugerencias de nuevos términos que realiza el programa. A la derecha y arriba el mapa de agrupaciones o Cluster Map y debajo de el la información recuperada en una de dos configuraciones líneas de texto (estilo MS Explore, en la imagen de la izquierda) o con breves fichas al estilo de los buscadores tradicionales como Google (en la imagen de la derecha).
Los iconos que aparecen a la derecha del todo permiten cambiar la configuración de esquemas de colores y vistas del mapa.
Fuente: Captura de pantalla en el ordenador del autor.
Pulse sobre las imágenes para agrandarlas.

Guided Exploration quiere decir en un sentido amplio que el sistema te propone vistas, elementos o procedimientos que te ayudan (te guían) en la búsqueda. En el caso que nos ocupa implica que Autofocus encuentra una serie de palabras relacionadas estadísticamente con la que buscamos y las ofrece como sugerencias. Si escogemos una de dichas palabras la agrega a la búsqueda y en el gráfico aparecen los documentos que la contienen y su relación con los ya abiertos. El objetivo de todo esto es, obviamente, ayudarnos a refinar la búsqueda.

Los resultados se presentan tanto de forma textual como los clásicos hiperenlaces que nos conducen al fichero “pinchado” como en forma de visualización, utilizando un gráfico de agrupación (cluster map) interactivo que se despliega elegantemente mostrando los resultados de la interrogación en forma de óvalos que engloban a su vez otros círculos menores. 

Unos y otros pueden estar enlazados de forma que el óvalo se estrecha entre ambos (ver las figuras) simbolizando las relaciones que hay entre las agrupaciones de resultados. Ello nos permite tener una visión de conjunto de lo encontrado con la que podemos interaccionar moviendo los cúmulos, borrándolos (eliminando los resultados de nuestra búsqueda) o pulsando con el ratón para abrir los directorios o ficheros a los que hacen referencia

La interpretación de un “Cluster Map” no es inmediata aunque si fácil de entender. Básicamente cada agrupación (cluster) de resultados se conecta a uno o más de los otros grupos mediante uno o varios de los términos de búsqueda empleados. Aquel grupo que está conectado a todos los términos de búsqueda entrados es el conjunto de documentos que mejor representan lo que estamos buscando. 

Autofocus tiene dos versiones, Personal y Server. La primera actúa como un programa de uso particular, mientras que la versión servidor puede actuar como servidor de búsquedas en el seno de una Intranet o en un sitio web.

Como ocurre con Grokker, KarTOO o Vivisimo, ( véase el numero 138 ) Autofocus pretende llenar el vacío que nos separa de la masa de información de que disponemos, sea en nuestro disco o en Internet, mediante el uso de sofisticadas técnicas y visualizaciones avanzadas. Cada uno de ellos tiene una filosofía ligeramente distinta. 

A favor de AutoFocus está la velocidad impresionante a la que encuentra sus resultados, la búsqueda guiada y la elegancia de la visualización. A su favor está también la versatilidad de formatos que puede leer y tratar 

Formato ASCII  Web  Acrobat  MS Office MS Works Open Office  Wordperfect Rich Text Format 
Extensiones *.txt *.html, *.xml *.pdf *.doc, *.xls, *.ppt *.wks *.sx* *.wpd ... *.rtf

En su contra, la necesidad de hacer un barrido que puede durar bastante tiempo aunque la actualización es rápida una vez hecho el barrido inicial, aunque no tengo noticia de que se actualice automáticamente, 

Grokker es algo más lento pero no has de realizar el barrido inicial (al menos en lo que a Internet se refiere) y su visualización es, para mí, más intuitiva y fácil de entender sin necesidad de mayores explicaciones.

La búsqueda de formas de encontrar la información que necesitamos de una manera más intuitiva utilizando la potencia de los algoritmos de lingüística computacional combinados con la visualización tiene otro exponente en AutoFocus, avalado por la experiencia de Aduna. 

Sin embargo, creo que en todos los casos antes mencionados falta encontrar la visualización más intuitiva para el usuario normal, que es iletrado en materia de visualización y para quien hay que crear sistemas muy evidentes o no conseguiremos que se dé el salto que separa a los motores de búsqueda tradicionales de aquellos que realmente nos permitirán encontrar rápidamente lo que buscamos, de una forma clara e intuitiva. 


Quiero agradecer a Christiaan Fluit, de Aduna sus interesantes reflexiones sobre el tema y su ayuda con AutoFocus.

Enlaces de este artículo:

http://aduna.biz   Website de ADUNA
http://www.infovis.net/printMag.php?num=62&lang=1   Número 62 Visualizando la web semántica
http://www.infovis.net/printMag.php?num=26&lang=1   Número 26 sobre La Telaraña Semánica
http://aduna.biz/products/autofocus/personal/download.html   Página de descarga de Autofocus Personal
http://www.infovis.net/printMag.php?num=138&lang=1   Número 138 sobre Grokker, o la Navegación Visual
© Copyright InfoVis.net 2000-2014