TRENDMINER: Large-scale Cross-lingual Trend Mining of Real-time media streams

The recent massive growth in online media and the rise of user-authored content (e.g weblogs, Twitter, Facebook) has lead to challenges of how to access and interpret these strongly multilingual data, in a timely, efficient, and affordable manner. Scientifically, streaming online media pose new challenges, due to their shorter, noisier, and more colloquial nature. Moreover, they form a temporal stream strongly grounded in events and context. Consequently, existing language technologies fall short onaccuracy, scalability and portability. The goal of this project is to deliver.

MULTIMEDICA: Extracción de Información Multilingüe en Sanidad y su aplicación a documentación divulgativa y científica

El proyecto tiene como objetivo la definición y desarrollo de técnicas de extracción y búsqueda de información a partir de textos en el dominio biomédico, en particular, en dos líneas especiales: en primer lugar, el tratamiento de documentación científica en inglés sobre farmacología y en segundo lugar, el procesamiento de textos divulgativos sobre salud en idiomas como español y árabe.

BRAVO: Búsqueda de respuestas avanzada multimodal y multilingüe

El proyecto BRAVO está dedicado a investigar en tecnologías para mejora la búsqueda de respuestas tanto con entrada en texto como en voz y cuyo principal resultado es una plataforma para un sistema de búsqueda de respuestas modular que permita medir la mejora de distintas técnicas para clasificación de preguntas, extracción de respuestas, recuperación de pasajes, etc. Entre las técnicas desarrolladas en este proyecto se encuentra SPINDEL, un reconocedor de entidades independiente del idioma que aplica aprendizaje automático basado en boostraping.