Seminario 2 de maio

Fecha de publicación: 11-abr-2012 9:42:00

O vindeiro día 2 de maio a rede RELISCO organizará un seminario na Facultade de Informática da Universidade da Coruña. Proximamente incluiremos un programa detallado con todos os participantes e os horarios correspondentes. A continuación amosamos dous dos visitantes que intervirán e un resumo sobre o contido da súa conferencia:

Gaël Dias (University of Caen Basse-Normandi) co título "Information Digestion".

Resumo:

The World Wide Web (WWW) is a huge information network within which searching for relevant quality contents remains an open question. The ambiguity of natural language is traditionally the main reason, which prevents search engines from retrieving information according to users' needs. However, the globalized access to the WWW via weblogs or social networks has highlighted new problems. Web documents tend to be subjective, they mainly refer to actual events to the detriment of past events and their ever growing number contributes to the well-known problem of Information Overload. In this presentation, we present our contributions to digest information in real-world heterogeneous text environments (i.e. the Web) thus leveraging users' e fforts to encounter relevant quality information. Within this context, we will specifically focus on presenting language-independent methodologies to extract implicit and explicit knowledge from real-world texts, thus allowing to reach Multilingual Information Digestion.

Luis Pérez Freire (Gradiant: Centro Tecnolóxico de Telecomunicacións de Galicia) co título "Content-based multimedia information retrieval: current research challenges in high-level understanding"

Autores: Daniel González Jiménez, Luis Pérez Freire

Resumo:

Multimedia information retrieval is about the extraction of knowledge from all kind of multimedia contents.

Content-based multimedia information retrieval (CBMIR) is the field that addresses techniques for knowledge extraction from multimedia contents when tags or text annotations are not available. Even when text descriptions are available, CBMIR can increase accuracy and provide a deeper level of understanding. This talk will provide an overview of CBMIR techniques for audiovisual contents and the hottest research topics related to high-level understanding, mainly focusing on the analysis of human signals for inferring affective states, identity, demographics, and actions.

Milagros Fernández Gavilanes (Grupo COLE - Universidade de Vigo) "Un modelo de recuperación semántica conceptual"

Resumo: Introducimos un entorno de adquisición e representación de información a partir de técnicas de procesamento da linguaxe natural que permite a integración de coñecemento lingüístico nas aplicacións de recuperación de información en base a un modelo matemático ben definido. O obxectivo práctico é facilitar o mantemento da aplicación resultante, así como a súa trazabilidade, xenericidade, accesibilidade a todo tipo de usuarios e un comportamento predecible. A interpretación matemática da semántica descansa na noción de grafo conceptual, que servirá de base á indexación e posterior localización dos textos mediante un mecanismo de emparellamento aproximado de patróns baseado na proxección e xeneralización de grafos.

Adrián Blanco González (Grupo COLE - Universidade de Vigo) "Avaliación do modelo de RI conceptual"

Resumo:

Habitualmente, a consideración do modelo de recuperación de información conceptual xustificouse pola vantaxe que supón neste tipo de aplicacións a facilidade para integrar coñecemento lingüístico en base a un modelo matemático ben definido, así como a súa trazabilidade, xenericidade, accesibilidade a todo tipo de usuarios e un comportamento predecible. Sen embargo, tamén a miúdo a miúdo argumentouse que as expectativas estarían sobrevaloradas e que na práctica o rendemento non era o esperado, de maneira que o esforzo requerido para a súa implementación non se vía compensado. Neste traballo, tratamos de disipar a dúbida plantexada avaliando en detalle as características do modelo conceptual para demostrar que as capacidades operativas exhibidas son superiores ás dos modelos clásicos en uso ou, no peor dos casos, análogas.

Jesús Vilares Ferro (Grupo LYS - Universidade da Coruña) "Subword-Level Pseudo-Translation for CLIR Using Parallel Corpora"

Resumo:

Cross-Language Information Retrieval (CLIR) is a particular case of IR where queries and documents are in different languages, thus requiring the use of Machine Translation (MT) techniques for making matching possible. Word and phrase-level translation approaches have been commonly used in this context. However, translation at character $n-grams$ level ---or pseudo-translation, properly speaking--- appears as an alternative for retrieval purposes. This is a knowledge-light approach which avoids the need for word normalization during indexing or translation, and also dealing with out-of-vocabulary words. Moreover, since such a solution does not rely on language-specific processing, only needeing a parallel corpus as input, it can be used with languages of very different natures even when linguistic information and resources are scarce or unavailable.

Daniel Fernández González (Grupo COLE - Universidade de Vigo) "Análisis de dependencias basado en transiciones"

Resumo:

Unha das representacións sintácticas que suscitou maior interese dentro da comunidade do procesamento da linguaxe natural nos últimos anos foi a análise de dependencias. Baixo esta motivación, xurdiron diferentes analizadores de dependencias entre os que destacamos os analizadores basados en transicións. Ca fin de mellorar a precisión da análise ofrecida por estos últimos abordáronse dous enfoques diferentes. Por un lado, desenvolver analizadores non dirixidos baseados en transicións e, por outro, ampliar o conxunto de transicións dos analizadores.