lunes, 12 de mayo de 2008

OPENVIDEO

El proyecto OpenVideo se centra en muchas áreas relacionadas con el vídeo digital. Trata de recoger y digitalizar vídeos de investigadores para su posterior estudio y así facilitar la recuperación de información multimedia Por tanto hace disponible el contenido de vídeos digitalizados. Mediante los vídeos los investigadores estudian diversos problemas, como es el reconocimiento de rostro, resúmenes, temas relacionados con la descripción del vídeo.
Éste proyecto se inició en 1988, con la digitalización de unos 195 segmentos de vídeos. En esta etapa de proyecto incluyeron metadatos para cada segmento en una base de datos, y crearon la Web de Open- video para poder permitir a los investigadores el acceso a los vídeos disponibles.
En la próxima etapa del proyecto se va a tratar de añadir segmentos de video al repositorio, ampliación de los formatos (MPEG-1, MPEG-2, MPEG-4 y QuickTime) y caracteres del vídeo.

El acceso a este recurso se realiza a través de una búsqueda sencilla mediante palabras clave que introduce el propio usuario o también se puede realizar una búsqueda que consiste en la navegación mediante términos. Esta última consiste en elegir una categoría: género, duración, color, sonido o colecciones y a partir de aquí elegir el video que deseas ver buscando en todos los resultados o refinar tu búsqueda añadiendo otras opciones de búsqueda.
El acceso por materias consistiría por tanto en lo anterior, es decir tu podrás elegir entre las distintas materias (en este caso documental, educativo, efímero, histórico, lectura, otros, servicio público) y a partir de aquí si tienes suerte eliges el video directamente pero si esa materia contiene demasiados videos tendrás que refinar tu búsqueda y completarla por ejemplo añadiendo autor, año, título, etc.

Para nuestro trabajo hemos encontrado un recurso en el que nos ofrecen numerosos videos educativos, clasificados por materias, los cuales también se pueden buscar mediante una búsqueda sencilla. www.videoseducativos.com es un portal desde el que se puede descargar o visualizar material educativo de forma legal y gratuita. Sirve por tanto de apoyo a la labor docente que realizan cada día maestros, profesores, padres y tutores.

MACHINE TAGS

Qureremos destacar un tipo de etiquetas que es comúnmente utilizado, que son las machine tags. Se trata de etiquetas que usan una sintaxis especial la cual define información extra sobre la etiqueta. Estas etiquetas se componen de un namespace, un predicado y un valor. El namespace define una clase o faceta de la etiqueta, el predicado es el nombre de la propiedad para el namespace y el valor es sencillamente eso, el valor. Analizando el comentario del Flickr Bondi's Beach Side Resident en http://www.flickr.com/photos/spudmurphy/400671302/ podemos ver un ejemplo de machine tags:
geo:lat=-33.898311
geo:lon=151.276202
Como vemos nos muestran la latitud y longitud en la cuál se ha realizado la foto y a la cual se refiere el comentario y la imagen. Este dato es un dato extra, el cuál no podríamos conocer mediante una etiqueta normal

SERVICIOS WEB 2.0

Hemos analizado algunos servicios Web 2.0 y queremos destacar por tanto algunos de sus aspectos generales más importantes:
del.icio.us: es una colección de favoritos que se puede utilizar para:
- Mantener los enlaces a nuestros favoritos en diversos aspectos, como en artículos, blogs, música, comentarios, etc., y acceder a ellos desde cualquier ordenador en la web.
- Compartir favoritos con amigos, familiares, compañeros de trabajo, y la comunidad de del.icio.us.
- Descubrir cosas nuevas, ya podemos encontrar información de diversas materias que otras personas ya han marcado como favoritas propias.
- Es una especia de bookmark social el cual permite guardar los marcadores en línea y acceder a ellos desde cualquier ordenador y añadir favoritos desde cualquier lugar. La información se puede utilizar mediante etiquetas que organizan los marcadores.
- También se puede utilizar del.icio.us para ver enlaces y favoritos interesantes de otras personas y compartir con ellos información.
Furl : se trata de una página que trabaja con bookmarks y que permite que sea fácil guardar, compartir y explorar páginas web favoritas.
Furl ofrece tres funciones principales al usuario, que son que guarda las URLs favoritas, permite compartir URLs con otras personas y explora en nuevos contenidos para facilitar los que son de interés al usuario.
Connotea: Se trata de un sitio de referencia para investigadores clínicos y científicos. Este servicio web tiene unas características específicas, guarda y organiza los enlaces a las referencias que el investigador cree de interés, permite compartir estas referencias con colegas si así se desea, se puede acceder a estas referencias desde cualquier ordenador, es fácil de usar y no necesita descarga ni aprendizaje, permite exportar e importar referencias, no tiene límite de almacenamiento, etc.
CiteUlike: es un servicio gratuito que permite almacenar, organizar y compartir los documentos académicos que encuentras en la web y que son de interés para ti. Estos documentos se añaden a tu biblioteca personal. Extrae automáticamente los detalles del documento. La biblioteca se almacena en el servidor por lo que se puede acceder a ella desde cualquier ordenador con conexión a Internet. Además se puede compartir la biblioteca con otra gente lo que nos permite ver sus documentos y ellos los nuestros y así podemos obtener literatura pertinente a nuestro campo que todavía no conozcamos.
Flickr: Se trata de una famosa aplicación que se utiliza en todo el mundo para compartir fotos en línea y se centra en dos objetivos principales que son ofrecer apoyo al público para que éste pueda poner la información que desee a disposición de la gente que desee, ya se trate de un blog de momentos realizado por un usuario normal que lo que quiere es compartir sus imágenes y comentarios con amigos o familiares o ya sea para profesionales que tratan de mostrar su trabajo y que se sirven de este recurso para poder conseguirlo.
El otro objetivo consiste en habilitar nuevos modos de organizar fotos y videos, es decir ofrecer la mejor organización posible para facilitar el trabajo del usuario.
Tagzania: Si objetivo es unir etiquetas con lugares, permite ir añadiendo lugares a una cuenta personal y así ir creando sitios, mapas, etc. Añades una página web y la etiquetas con palabras clave. Por tanto surgirán además de los propios mapas del usuario, mapas compartidos entre usuarios que han creado diferentes etiquetas en determinados sitios web.
Youtube: es uno de los recursos líder del vídeo online que permite subir y compartir videoclips de una forma sencilla mediante sitios web, dispositivos móviles, blogs y correo electrónico. Cualquier persona puede visionar los vídeos que se encuentran esta página, aunque no sea un usuario de la misma. Sin embargo para poder subir tus propios videos y así compartirlos con el resto de personas del mundo, debes registrarte y pasar a ser usuario de la página, a partir de aquí podrás colgar tus videos siempre que quieras y agregar comentarios a cualquier otro video de otros usuarios de la misma

TAGS CLOUDS

Hemos analizado algunas Tag Clouds y hemos llegado a las siguientes conclusiones:
- En US Presidencial Speeches Aging Tag Cloud Timeline: http://chir.ag/phernalia/preztags/ podemos decir que el contenido que representa la nube de etiquetas se refiere a un discurso del presidente de los Estados Unidos George Bush, en el cual se tratan aspectos relacionados con el Estado de la Unión, y los aspectos influyentes en el mismo como la guerra, los terroristas, la inmigración, la violencia, la economía, etc.
- En Microsoft’s evolution, in keywords: http://blog.seattlepi.nwsource.com/microsoft/tags/ en este caso la nube de etiquetas trata de representar la evolución que ha sufrido Microsoft mediante palabras clave. Se trata de un discurso del presidente de Microsoft Bill Gates, en conversación con el presidente de entretenimientos de la misma empresa Robbie Bach. Se tratan los aspectos de la evolución digital, y todo esto se ve reflejado en este tags cloud ya que como podemos comprobar aparecen enormemente destacas palabras como Vista, Windows y Xbox y algo menos otras como media, hardware o digital, todas relacionadas directamente como ya hemos dicho con la revolución de las informática en los últimos tiempos

domingo, 11 de mayo de 2008

ANÁLISIS DE VOCABULARIOS "SKOSIFICADOS"

Desde http://www.w3.org/2001/sw/Europe/reports/thes/ hemos analizado algunos vocabularios en RDF que están en SKOS y vamos a dar una breve explicación de los siguientes:

SKOS Core RDF apoya la descripción del lenguaje orientado a los sistemas de organización del conocimiento (KOS) como tesauros, glosarios, vocabularios controlados, taxonomías y sistemas de clasificación.

SKOS Mapping es un vocabulario RDF para la descripción de los regímenes de asignaciones entre el concepto.

SKOS Extensiones contiene algunas extensiones de la SKOS vocabulario básico, útil para aplicaciones especializadas.

viernes, 9 de mayo de 2008

CSA ILLUSTRATA

CSA Illustrata: es una base de datos donde las búsquedas se realizan en la información contenida en tablas, gráficos, cuadros, fotografías, mapas y otras ilustraciones de investigación académica y literatura técnica sobre las ciencias naturales.
CSA Illustrata usa el llamado “indexado profundo” para categorizar datos, variables y otro contenido representado en las ilustraciones. Habitualmente una búsqueda se hace a nivel muy general, sin embargo, con CSA Illustrata, la búsqueda se hace a nivel más específico, dentro del contenido de todas las tablas y gráficos, permitiendo al investigador localizar información que de otra forma no podría recuperar en un sistema habitual de indexado a nivel de artículo. Los resultados de la búsqueda en CSA Illustrata pueden verse con el pie de foto, autor, fuente y términos de indexado para realizar otra búsqueda relacionada y en numerosos casos, van ligados a los documentos de texto completo. Con el impacto visual del resultado, el investigador puede encontrar datos relevantes de forma más rápida y determinar si requiere leer el documento fuente o no.
CSA Illustrata cuenta ya con 1 millón de imágenes. Se habla incluso de un nuevo paradigma: "indización por imágenes", pues los resultados pueden ordenarse por número de imágenes con lo cual, según la búsqueda, es muy fácil saber si determinado artículo interesa o no. Para hallar datos probablemente en forma de tabla, la rapidez de búsqueda es espectacular. Su frecuencia de actualización es mensual, con unas 150,000 ilustraciones cada vez.

miércoles, 7 de mayo de 2008

CONCEPTO DE TESAURO

Después de tanto hablar de tesauros, softwares para tesauros, etc., ha llegado el momento de explicar el concepto de tesauro:
El tesauro es un intermediario entre el lenguaje que encontramos en los documentos (lenguaje natural) y el que emplean los especialistas de un determinado campo del saber (lenguaje controlado).
La palabra tesauro, desde el punto de vista de las ciencias de la información y la Documentación, se refiere a un listado de palabras o términos empleados para representar conceptos, temas o contenidos de los documentos, para lograr una normalización terminólogica que permita mejorar el acceso a la información y la comunicación entre los usuarios y las Unidades de Información. Los términos que conforman el tesauro se interrelacionan entre ellos bajo tres modalidades de relación:
1. Relaciones Jerárquicas: Establece subdivisiones que generalmente reflejan estructuras de TODO/Parte.
2. Relaciones de Equivalencia: Controla la Sinonimia, Homonimia, Antonimia y Polinimia entre los términos.
3. Relaciones Asociativas: Mejoran las estrategias de recuperación y ayudan a reducir la polijerarquía entre los términos.

SOFTWARE PARA LA CONSTRUCCIÓN DE TESAUROS

A parte de ThManager hemos encontrado algunos software para construir tesauros como son
  • Wintertree Software Thesaurus:
    o Wintertree Report Engine para Java proporciona todo lo necesario para añadir un completo diccionario de sinónimos o buscador de capacidad para aplicaciones Java, applets, servlets y desarrollar
  • Multites
    o Es una herramienta para crear y manejar tesauros, taxonomías y otros tipos de vocabularios controlados. Permite la publicación de tesauros en Internet y soluciones personalizadas para las necesidades de las empresas. Sus productos de software incluyen: MultiTes Pro (de trabajo), MultiTes WDK, MultiTes EDK. Sus soluciones web gestionados le proporcionan los mecanismos para publicar tesauros en la web, sin tener que preocuparse por la administración de la red, la configuración del cortafuegos, servidor de gestión, intrusiones de hackers, etc.
  • Tesaurvai
    o Tesaurvai permite la extracción, anotación y organización de términos especializados tomados de una colección de textos digitalizados. Su diseño cumple los estándares internacionales para la construcción y gestión de un tesauro. La principal contribución es su capacidad de ordenación y selección de términos desde 1 a 10 palabras. Por un lado, es una herramienta para crear tesauros desde el principio, teniendo en cuenta la extracción de información, la creación, edición y anotación de los términos. Es fácil de usar para establecer relaciones entre términos y realizar búsquedas básicas o avanzadas de términos. Por otra parte, permite la importación y exportación de tesauros de textos a archivos XML. Por último, puede construir índices alfabéticos y jerárquicos, que pueden ser intercambiados para ser impresos o para ser exportados como informes. La herramienta ha sido desarrollada en Java y trabaja sobre una base de datos. Tesaurvai es compatible con cualquier gestor de base de datos dotado de conectividad Java Database (JDBC).

THMANAGER

Ventajas:
- Permite la creación de vocabularios en SKOS para representar sistemas de organización del conocimiento como tesauros, sistemas de clasificación, taxonomías, y otros tipos de vocabularios controlados.
- El almacenamiento de los registros de metadatos es administrado directamente a través del sistema de archivos, la aplicación se puede instalar en cualquier plataforma con el requisito mínimo de tener instalada una máquina virtual Java.
- Es Multilingüe, existen versiones en español y en Inglés.
- La descripción de tesauros se realiza por medio de metadatos basados en Dublín Core. Estos metadatos pueden ser visualizados en HTML o editados a través de un formulario.
- Permite la visualización de los conceptos del tesauro.
- Ofrece una interfaz de edición que permite modificar el contenido: creación de conceptos, eliminación de conceptos y actualización de propiedades.
- Ofrece ayuda on-line
En cuanto a los inconvenientes el principal que hemos encontrado es que tiene problemas en la importación ya que da errores y no permite importar

¿QUÉ ES ONTOPIA?

Ontopia, es una empresa dedicada a promover la información y conocer las soluciones de dirección basadas en estándares y Topic Map. Los Topic maps son estándares de mapas temáticos para la Web basado en el lenguaje XML que ofrece un conjunto de herramientas de gestión del conocimiento como Ontopia Topic Map Engine, Ontopia Navigator Framework y The Omnigator, entre otras. Todas ellas utilizan estándares que hacen posible el intercambio de información entre sistemas distintos.

Va dirigido para todo usuario que utilice mapas temáticos junto con otras herramientas de búsqueda como son los vocabularios controlados, tesauros, taxonomías, metadatos, clasificaciones, ontologías, etc. Ya que los Topic Maps permiten representar el conocimiento de tal forma que sea posible navegar por los temas, buscar y recuperar información, sirviendo a la organización y gestión interna de los documentos de la intranet de una organización determinada.
Ontopia ha creado Ontopia Topic Map Engine, un programa que desarrolla los temas de un mapa temático estándar y que permite el acceso y manipulación de los elementos que se encuentran en un mapa temático (temas, asociaciones y eventos). Con Ontopia Topic Map Engine se pueden crear tablas de contenido e índices temáticos para documentos individuales o conjuntos de documentos relacionados, un glosario o una taxonomía que pueden ser compartidos por más de un documento.

SOFTWARE PARA MAPAS CONCEPTUALES

Hemos analizado algunos software para mapas conceptuales y destacamos los siguientes:
- Cartografía Mental Computarizada es una forma muy visual y atractiva para los usuarios, más que CMaps Tools, muestra los contenidos de la página en un mapa inicial en el cual tú vas pinchando en donde quieres entrar y puedes navegar a través de este. Es una forma sencilla de resumir la información para poder acceder a ella inmediatamente.

-Inspiration que también es una herramienta de software para apoyar el pensamiento y aprendizaje visual. Las investigaciones realizadas han demostrado que el aprendizaje visual es una de las mejores técnicas para enseñar habilidades de pensamiento superior, ya que ayudan a los alumnos a aclarar su pensamiento, comprender conceptos e integrar información nueva. Muestra algunos ejemplos como Mapas de Ideas, Redes y Mapas de Conceptos. Des de nuestro punto de vista los Mapas de Concpetos son muy similares a CMap Tools por que incluye las relaciones que unen los conceptos, las Redes también son muy interesantes pero se basan más en la organización jerárquica, en una especie de organigrama. Y los Mapas de Ideas son como una mezcla de los de los dos anteriores, pero no especifica la relación existente entre conceptos.

-Por último destacamos el Blog de Conocimiento Global en el que se muestran ejemplos de mapas, pero más bien creemos que se pueden considerar como gráficos, aunque igualmente son de gran ayuda para el aprendizaje, son algo más escuetos que en CMaps Tools.

martes, 6 de mayo de 2008

ANALISIS DE BÚSQUEDAS EN EDNA

EDNA es un sistema de información digital temático de recursos donde la descripción se hace en función de metadatos específicos y de vocabularios normalizados que ayudan en la recuperación de información.
En EDNA la búsqueda avanzada es mucho más completa que la distribuida, existen más opciones de búsqueda para primera que para la segunda.
En la búsqueda distribuida se puede buscar a través de un término o varios términos, los cuales se pueden utilizarse como una frase, como palabras independientes o como dos o varias palabras que se deben encontrar en el mismo documento aunque aparezcan en distinto lugar del documento. Además la búsqueda distribuida te permite elegir el número de documentos que se vas a visualizar en los resultados, 100, 150 ó 200. Esta búsqueda posibilita también la utilización de los distintos repositorios con los que trabaja EDNA, se podrán elegir todos, alguno o varios especificos.
En cuanto a la búsqueda avanzada como ya hemos mencionado permite más posibilidades, a través de ésta se pueden utilizar operadores boleanos y determinar el campo en el que queremos que se busquen los términos que nos interesan. Podemos además elegir el grupo del que queremos obtener resultados como por ejemplo edna Events, o edna News, y elegir por otro lado el sector sobre el que queremos trabajar.
Es posible además buscar en todos los sitios o tan solo en sitios australianos y también elegir el tesauro que se quiere utilizar en la búsqueda (AGIFT, SCoT, ATED, VOCED)
Sobre la pregunta de que tienen que ver los metadatos en la búsqueda distribuida, pensamos que tienen mucho que ver ya que a través de los metadatos se pueden hallar las palabras que el usuario reclama, ya que los metadatos contienen las palabras más significativas de los documentos

APOYO EN NUESTRO TRABAJO

Para nuestro propio trabajo hemos pensado en realizar la extracción de términos a través de diversas herramientas como son los tesauros ya mencionados anteriormente, como el Tesauro de Educación Europeo o el de ERIC. Además estamos utilizando un diccionario especializado en Educación Infantil e índices de libros especializados en la materia que hemos obtenido a través de personas especializadas en la misma. Vamos a tratar de utilizar palabras que puedan servir al usuario tanto especializado como no especializado, utilizaremos las diversas relaciones posibles como de jerarquía, asociativas, etc., e intentaremos que la búsqueda por materias sea lo más cómoda posible

INDIZACIÓN EMBEBIDA EN PÁGINAS WEB

Para poder comprobar la indización embebida en el código fuente de varias páginas web, hemos optado por realizarlo mediante nuestras propias páginas web creadas para la asignatura de Sistemas Avanzados de Recuperación de Información y que son las siguientes:
http://es.geocities.com/paginasdoorway
http://es.geocities.com/palabrasclave
http://es.geocities.com/herramientaseo
Analizando su código fuente a través de Dc-Dot, hemos comprobado la gran utilidad de esta herramienta que permite la extracción de los metadatos de los recursos y a su vez la creación de los mismos también para recursos electrónicos ya que nos permite conocer las palabras clave, descripción, etc., de las etiquetas DublinCore que contienen las páginas web

TESAUROS, GLOSARIOS Y DICCIONARIOS

En el artículo TESAUROS, GLOSARIOS Y DICCIONARIOS DE
BIBLIOTECONOMÍA Y DOCUMENTACIÓN EN INTERNET
de la Revista Española de Documentación Científica, se recoge la principal información que se encuentra en Internet sobre tesauros, glosarios y diccionarios de nuestra materia.
Da acceso a directorios generales que nos ofrecen diversas herramientas como glosarios y directorios de tesauros que ofrecen listas de los diferentes tesauros existentes. Además realiza una recopilación de directorios de diccionarios, y los tesauros multidisciplinares, tesauros sobre biblioteconomía y documentación, listas de encabezamientos, etc. Todo ello es una información especialmente útil para nuestro trabajo
De toda esta información nos ha llamado especialmente la atención ERIC
http://www.ericfacility.net/extra/pub/thessearch.cfm cuyo tesauro contiene 10.812 términos en inglés sobre educación, agrupados en 41 categorías y del cuál podemos destacar la falta de un índice jerárquico para poder hacerse una mejor idea de su estructura.
El tesauro de la UNESCO http://www.ulcc.ac.uk/unesco/ es un tesauro multidisciplinar que también está muy desactualizado (1999), contiene siete áreas temáticas y mas de 4000 descriptores. Esta dividido en microtesauros a través de los que se deberán realizar las búsquedas online ya que carece de un buscador que facilite esta tarea.