Isabel Segura Bedmar (Projects)

Las personas con discapacidad sensorial (auditivas o visuales) se encuentran con graves barreras de comunicación en la sociedad y en el mundo que les rodea. Además, esta situación genera exclusión social y es uno de los motivos que impide a los discapacitados sensoriales alcanzar la igualdad de derechos. Estos derechos son reconocidos por la organización de las Naciones Unidas en su Convención Internacional sobre los Derechos de las Personas con Discapacidad.
En la actualidad, el alcance técnico y el desarrollo acelerado de la Sociedad de la Información constituyen, por otra parte, una realidad favorable para favorecer la accesibilidad de todos los ciudadanos. El aspecto técnico de este proyecto de investigación se refiere a la subtitulación para las personas sordas y con discapacidad auditiva, especialmente en el contexto actual en el que las clases se imparten por videoconferencia o streaming. Los contenidos audiovisuales accesibles permiten una clara mejora de la calidad de vida de todo el colectivo de personas sordas. Además, las clases impartidas por un profesor o profesores pueden ser grabadas para su posterior consumo por parte de los alumnos.

En este contexto, la subtitulación de conferencias y clases en directo, presenciales o a distancia, y la generación de una transcripción de calidad que sirva de apoyo a los alumnos para su posterior consulta es un reto tecnológico actual para la accesibilidad de la educación. La principal alternativa para el subtitulado masivo de eventos en directo son las herramientas basadas en el reconocimiento automático del habla. Actualmente, en el contexto educativo, los subtítulos en tiempo real no tienen gran precisión lingüística y presentan retrasos entre el audio del vídeo y el texto (subtítulos). Estas deficiencias empeoran la percepción de la actividad docente por parte de los alumnos, tengan o no una discapacidad.

Es difícil sincronizar los subtítulos en una clase en directo en el entorno educativo, ya que es imposible retrasar la imagen del orador para hacerla coincidir con los subtítulos. De este modo, el alumno perdería la capacidad de interactuar con el profesor. Sin embargo, gracias a este proyecto es posible mejorar la calidad de los subtítulos. Además, la posibilidad de integrar la generación automática de la transcripción completa de la clase dentro del mismo sistema, junto con su posterior simplificación, facilitará el acceso a las clases online en igualdad de condiciones. Aunque el marco está enfocado a las clases online, puede ser utilizado en las presenciales. En este escenario, la transcripción se genera y procesa de la misma manera que en el escenario online, generando los contenidos accesibles para los alumnos.

Por lo tanto, la idea del proyecto es abordar un problema importante al que se enfrenta la educación accesible en España para eliminar las barreras de comunicación, generando así una solución inclusiva para todos. Aunque los principales usuarios del proyecto son las personas sordas y con discapacidad auditiva, otros usuarios pueden beneficiarse de él. La posibilidad de mejorar las habilidades de lectura y escritura es un valor añadido a los servicios de subtitulado y transcripción. Por último, el público en general se beneficiará de las transcripciones generadas, los resúmenes y las versiones simplificadas. Además, el proyecto cuenta con cartas de intención de AICE, FIAPAS y la Escuela de Educación Especial de Olivos, que se interesan por los resultados del mismo.

 

  • Reference: TED2021-132182A-I00
  • Financing: Proyectos de Transición Ecológica y Transición Digital. Ministerio de Ciencia e Innovación
  • Project type: Público
  • State: Activo
  • Principal investigator: Jose Luis Lopez-Cuadrado, Israel González Carrasco
  • Other investigator: Belén Ruiz-Mezcua, Paloma Martínez, Lourdes Moreno, Isabel Segura Bedmar
  • Duration: -

Gracias a la investigación biomédica, se ha generado una gran cantidad de conocimiento sobre enfermedades raras en los últimos años. El elevado coste de los análisis moleculares y la existencia de una bibliografía reducida, en ocasiones inaccesible o dispersa, dificulta el avance en el diagnóstico y tratamiento de estas patologías. Frecuentemente, los pacientes afectos, a pesar de que sus condiciones son mortales o crónicamente incapacitantes, carecen de tratamiento. Aunque las bases genéticas hayan sido dilucidadas, en muchos casos la pérdida de función de los genes causantes no explica la complejidad fenotípica observada. Este es el caso de genodermatosis como la Epidermólisis bullosa distrófica (EBDR), síndrome de Kindler (SK) o Xeroderma pigmentoso (XPC). Estas enfermedades comparten manifestaciones clínicas y predisposición al cáncer, a pesar de tener diferentes bases genéticas. El proyecto tiene como objetivo aplicar técnicas de Procesamiento de Lenguaje Natural (PLN) para analizar la literatura biomédica con el fin de aumentar el conocimiento relativo a las enfermedades raras y desvelar relaciones complejas presentes en estas enfermedades. En concreto, esperamos identificar biomarcadores precisos, dianas terapéuticas de estas patologías, así como facilitar su diagnóstico a clínicos no especialistas. Además, se plantea como caso de uso, el análisis en estas tres genodermatosis (EBDR, KS y XPC) con el fin de correlacionar la información obtenida mediante PLN con los patrones de expresión génica provenientes de arrays moleculares de dichas enfermedades, publicados previamente por el grupo TERMeG.  La trayectoria conjunta de los integrantes del proyecto, su experiencia en los campos del PLN y enfermedades raras, así como su carácter multidisciplinar sumado al interés de los consorcios de investigación especializados (CIBERER) y de las asociaciones de pacientes implicadas (DEBRA), garantizan la viabilidad y el impacto de la propuesta.

  • Reference: NPL4RARE-CM-UC3M
  • Financing: Convocatoria del Programa de Apoyo a la Realización de Proyectos Interdisciplinares de I+D para jóvenes investigadores de la UC3M 2019-2020
  • Project type: Público
  • State: Activo
  • Principal investigator: Isabel Segura Bedmar, Sara Guerrero Aspizua
  • Other investigator: Lourdes Moreno, Cristóbal Colón Ruiz, Rodrigo Alarcón, Carlos León Canseco , Lucía Martínez Santamaría , José Bonafont Aragó, Esteban Chacón Solano
  • Duration: -

El objetivo es el desarrollo de un sistema para procesamiento del texto libre de las historias clínicas electrónicas (HCE) del Hospital Universitario Fundación de Alcorcón (HUFA) utilizando técnicas de procesamiento de lenguaje natural y métodos de deep learning. HUFA fue uno de los primeros hospitales de la Comunidad de Madrid en disponer de HCE, desde su apertura a finales de 1997. En la actualidad la Comunidad de Madrid tiene integradas más 5 millones de HCE de las que sólo se procesan los metadatos estructurados. El resto de la información, en formato no estructurado (texto libre), a día de hoy permanece sin ser poder ser explotada por procesos automáticos. El desarrollo de tecnología capaz de procesar y explotar información no estructurada en texto libre de la HCE en el contexto actual de big data, puede tener muchas aplicaciones tanto en la mejora de la práctica clínica (generación automática de resúmenes de episodios relacionados con un paciente, sistemas de ayuda a la decisión clínica para personalizar diagnósticos y tratamiento de enfermedades, alertas de enfermedades infecciosas, mejora de los sistemas de farmacovigilancia, etc.) como en investigación (semi-automatización de los estudios epidemiológicos, por ejemplo en la identificación de los cohortes de pacientes). En concreto, la realización de estudios epidemiológicos implica una ardua labor en la revisión manual de un elevado número de HCE, lo que a su vez conlleva un gran número de recursos humanos y una ingente cantidad de horas de trabajo. Por tanto es crucial promover el desarrollo de técnicas automáticas que permitan obtener información de forma más ágil, convirtiendo la información no estructurada en estructurada y procesable por algoritmos automáticos, y facilitando así la toma de decisiones estratégicas.
El objetivo del proyecto es el desarrollo de técnicas de PLN y método de deep learning para el análisis de la información no estructurada de la HCE, con el fin último del de reducir el coste, en tiempo y recursos, de los estudios epidemiológicos. El proyecto tiene dos centros participantes: (Subproyecto 1) Grupo LABDA de la UC3M que desarrollará el sistema automático para el procesamiento de la HCE y (Subproyeto 2) HUFA cuyo equipo está formado por especialistas de la unidad de Alergología, que serán los encargados de llevar a cabo un estudio epidemiológico a partir de los datos obtenidos de la HCE mediante al uso de PLN y métodos de deep learning. En concreto, el estudio epidemiológico tendrán como principal objetivo estudiar la prevalencia de la anafilaxia en la población definida como caso de uso de aplicación. Varios profesionales del servicio de informática de HUFA serán los encargados de anonimizar las HCE para garantizar la protección de datos de los pacientes.
Aunque el sistema será desarrollado sobre la HCE del HUFA, la tecnología que se pretende desarrollar en el proyecto solicitado, podría ser aplicada directamente a la HCE de cualquier otro hospital. Además, su adaptación al estudio epidemiológico de otras patologías distintas a la anafilaxia (cáncer de mama, ictus, etc) es relativamente sencilla ya que los enfoques (deep learning) que se quieren abordar durante el proyecto son independientes del problema a tratar.

  • Reference: TIN2017-87548-C2-1-R
  • Financing:
  • Project type: Público
  • State: Activo
  • Principal investigator: Paloma Martínez Fernández, Isabel Segura Bedmar
  • Other investigator: Jose Luis Lopez-Cuadrado, Israel González Carrasco, José Luis Martínez Fernández, Lourdes Moreno, Belén Ruiz-Mezcua, Cristóbal Colón Ruiz, Rodrigo Alarcón
  • Duration: -

El proyecto EASIER, del Grupo Human Language and Accessibility Technologies (HULAT), del departamento de Informática de la Universidad Carlos III de Madrid (UC3M) tiene como objetivo desarrollar una solución que mejore la accesibilidad a la información digital favoreciendo el acceso a las personas con discapacidad intelectual.

Las tecnologías de la información y la comunicación (TIC) en la sociedad de la información presentan barreras de accesibilidad, que afectan en mayor grado a las personas que tienen algún tipo de discapacidad. Son más conocidas las necesidades de las personas con discapacidad de tipo sensorial y física, pasando por alto las barreras cognitivas causadas por la difícil comprensión de los textos que afectan principalmente a las personas con discapacidad intelectual y personas mayores.

Con esta motivación se quiere proporcionar, por un lado, tecnología que dé soporte a los procesos de simplificación automática de contenido textual en español para mejorar la facilidad de lectura y, por otro lado, tecnología que genere interfaces de usuario accesibles que incluyan este contenido textual simplificado a los usuarios.

Para la simplificación léxica del contenido textual en español se tendrán en cuenta las pautas de accesibilidad (WCAG) relativas al lenguaje siguiendo legislación en España, así como las pautas de Lectura Fácil (UNE 153101: Lectura fácil. Pautas y recomendaciones para la elaboración de documentos) y Pautas de Lenguaje Llano (Plain Language). Como espacio de solución, se van a utilizar métodos de disciplinas que puedan dar soporte al cumplimiento sistemático de estos requisitos de accesibilidad cognitiva, tal es el caso de la disciplina de Procesamiento del Lenguaje Natural (PLN) y la Inteligencia Artificial.

  • Reference:
  • Financing: FUNDACION UNIVERSIA, INDRA
  • Project type: Público
  • State: Activo
  • Principal investigator: Lourdes Moreno
  • Other investigator: Rodrigo Alarcón, Paloma Martínez Fernández, Isabel Segura Bedmar
  • Duration: -
  • Sitio web Más fácil - EASIER

Public administrations are rapidly advancing towards the provision of basic and extended services for the citizen through the Web (EU eGovernment Report 2014). In addition to the decrement of costs, this effort will support all people’s civil right to have access to all public services (including people with disabilities and elderly people). For this reason the EU started diverse initiatives to “Meeting new societal needs by using emerging technologies in the public sector” in order to “foster efficient, open citizen-centric public services”. Efforts have been made for enhancing the usability and accessibility of public administrations’ websites but several studies revealed that this is not sufficient to support acceptable eGovernment applications. Other factors such as content/information quality and security are also required. Our overall objective is to produce a model-based software architecture for methodologically developing personalized inclusive public eServices that allow any user to interact with them in a satisfactory way, no matter the device used. This requires integrating appropriate user profiling and adaptation techniques into the model to tailor eServices to users’ characteristics, available technology, and service’s functionality. Hence, this project has a multidisciplinary nature and will be addressed through collaboration between researchers and experts in information technology and professionals of the eGovernment, combining diverse scientific backgrounds: • Modelling eGovernment services • Data mining to search for user patterns to feed user models • Human-computer interaction for user tailored interfaces, including universal accessibility and multidevice access • Natural language processing for accessible user interfaces • Model based software architectures for the methodological development of eGovernment applications. It is structured into two subprojects: Subproject 1, leaded by the EHU, will exploit real user interaction data from the eServices provided by Provincial Council of Gipuzkoa (PCG) to extract common usage patterns, anomalous usage of services, and accessibility barriers. Models of eServices will be built with the inclusion in the workgroup of experts on eGovernment (from the Quality Institute Netherlander Municipalities, the Service for Modernization of the PCG, and IZFE, a developer of applications for eAdministration). Starting from these models, user adaptive Web access will be provided by means of presentation, content and navigation adaptations. Subproject 2, leaded by UC3M, will create a software architecture for model-based development of eGovernment applications that includes support for accessibility and multidevice use (assisted by experts from the University of Lisbon). The definition of a model-based software architecture will be done in collaboration with the LoUISE research team from UCLM, which is currently developing a framework that can be extended to fit our needs. The results of the complete project will include models of: users of eGovernment applications; e-Services; and web adaptations required to ensure universal and multidevice accessibility. All of them will be integrated by the model-based architecture that will allow the creation of tools to develop fully accessible high quality eGovernment applications. In this way the project will contribute to increase citizens’ participation, to produce savings for governments and businesses, and to reduce administrative burden.

  • Reference: TIN2014-52665-C2-2-R
  • Financing: Ministerio de Economía y Competitividad
  • Project type: Público
  • State: Activo
  • Principal investigator: Paloma Martínez Fernández
  • Other investigator: Paloma Martínez Fernández, Lourdes Moreno, Isabel Segura Bedmar, José Luis Martínez Fernández, Belén Ruiz-Mezcua, Victor Suarez Paniagua, Israel González Carrasco, Jose Luis Lopez-Cuadrado
  • Duration: -
  • https://egovernability.wordpress.com

The recent massive growth in online media and the rise of user-authored content (e.g weblogs, Twitter, Facebook) has lead to challenges of how to access and interpret these strongly multilingual data, in a timely, efficient, and affordable manner. Scientifically, streaming online media pose new challenges, due to their shorter, noisier, and more colloquial nature. Moreover, they form a temporal stream strongly grounded in events and context. Consequently, existing language technologies fall short onaccuracy, scalability and portability. The goal of this project is to deliver. innovative, portable open-source real-time methods for cross-lingual mining and summarisation of large-scale stream media. TrendMiner will achieve this through an inter-disciplinary approach, combining deep linguistic methods from text processing, knowledge-based reasoning from web science, machine learning, economics, and political science. No expensive human annotated data will be required due to our use of time-series data (e.g. financial markets, political polls) as a proxy. A key novelty will be weakly supervised machine learning algorithms for automatic discovery of new trends and correlations. Scalability and affordability will be addressed through a cloud-based infrastructure for real-time text mining from stream media. Results will be validated in two high-profile case studies: financial decision support (with analysts, traders, regulators, and economists) and political analysis and monitoring (with politicians, economists, and political journalists). The techniques will be generic with many business applications: business intelligence, customer relations management, community support. The project will also benefit society and ordinary citizens by enabling enhanced access to government data archives, summarisation of online health information, and tracking of hot societal issues.

  • Reference: FP7-ICT 287863
  • Financing: European Commission
  • Project type: Público
  • State: Activo
  • Principal investigator: Paloma Martínez Fernández
  • Other investigator: Paloma Martínez Fernández, Lourdes Moreno, Isabel Segura Bedmar, Julián Moreno Schneider, María González García, María Herrero Zazo, Ricardo Revert Arenaz
  • Duration: -
  • https://cordis.europa.eu/project/id/287863

The aim of this project is to define and develop information extraction and retrieval techniques based on texts from the medical domain. This will be carried out following two basic tasks: firstly, processing scientific documents in English about pharmacology, and secondly, processing informative texts about health topics in other languages such as Spanish and Arabic. These information extraction techniques include domain entities recognition, pattern recognition, machine learning for extracting semantic relations, and the integration of lexical resources which are specific within the public health system (UMLS, SNOMED and so on) in order to improve applications. On the other hand, the information extracted from the processing task must be used to enrich the information retrieval tools. Thus, three prototypes of searching information will be created in order to show the feasibility of the proposed techniques. The first of them is an application oriented to pharmacists to extract knowledge about drug-drug interactions from scientific publications. The second prototype will be a tool focused on general public or patients to search information about illnesses and medicines. The third one will use the terminology extracted from the Spanish-Arabic parallel corpus to aid terminology teaching in the biomedical domain.

  • Reference: TIN2010-20644-C03-01
  • Financing: Plan Nacional de I+D, Ministerio de Ciencia e Innovación
  • Project type: Público
  • State: Activo
  • Principal investigator: Paloma Martínez Fernández
  • Other investigator: Paloma Martínez Fernández, Lourdes Moreno, Elena Castro Galán, Ana M. Iglesias Maqueda, Isabel Segura Bedmar, María Teresa Vicente-Díez, José Luis Martínez Fernández, Julián Moreno Schneider, Daniel Sánchez Cisneros, María Herrero Zazo
  • Duration: -
  • http://labda.inf.uc3m.es/multimedica/
  • Reference: CEN-20091026
  • Financing: DAEDALUS S.A dentro del SUBPROGRAMA DE APOYO A CONSORCIOS ESTRATÉGICOS NACIONALES DE INVESTIGACIÓN TÉCNICA (CENIT-E), CEN-20091026
  • Project type: Público
  • State: Activo
  • Principal investigator: Paloma Martínez Fernández
  • Other investigator: Paloma Martínez Fernández, Dolores Cuadra Fernández, Lourdes Moreno, Elena Castro Galán, Ana M. Iglesias Maqueda, Francisco Javier Calle Gómez, Harith Al-Jumaily, César De Pablo Sánchez, Isabel Segura Bedmar, María Teresa Vicente-Díez, David del Valle Agudo, José Luis Martínez Fernández, Jesica Rivero Espinosa, Daniel Sánchez Cisneros, María González García, María Herrero Zazo
  • Duration: -
  • http://www.cenitbuscamedia.es

The “Thuban” project is focused to develop a virtual attendant which interacts with the user and takes into account his position in the environment. This feature provides access to services such as: services relative to the position and trajectory (for example, notice), oriented services to manage these parameters (for example, tracking and guiding to fixed and moving objects) or the description of the situation and/or trajectory and in general, every available service in the system. The Spatio-Temporal database will be the technology used to handle the user tracking and guiding. This kind of database should be able to generate and manage spatio-temporal events. On the other hand, the system interaction must be oriented to imitate the human interaction (Natural Interaction) providing support to any sort of user. The Spatio-Temporal database and Interaction System integration are the fundamental basis for achieving the interaction platform. Therefore, Virtual Attendants development is feasible for different environments and applications, which will strengthen the Information Societies for all.

  • Reference: TIN2007-66660
  • Financing: Ministerio de Educación y Ciencia
  • Project type: Público
  • State: Activo
  • Principal investigator: Dolores Cuadra Fernández
  • Other investigator: Francisco Javier Calle Gómez, Harith Al-Jumaily, Isabel Segura Bedmar, David del Valle Agudo, Juan Ignacio Perea Moraleda, David Rodríguez Álvarez, Jack Mario Mingo Postiglioni, Manuel Velasco de Diego, Jesica Rivero Espinosa
  • Duration: -

BRAVO is devoted to research on technologies to improve the answers search in both text and voice, and the main result is a platform for a modular answers search system which allows to measure the improvement of different techniques for questions classification, answer extraction, passages retrieval, etc. SPINDEL is one of the techniques developed in this project, an entity recognizer which, regardless of language, applies machine learning based on bootstrapping. In the framework of BRAVO project, one of the current research areas is related to the location of drug names and interactions between them in the medical literature using UMLS, dictionaries and USAN rules of naming drugs. As a result, it is available automatically annotated corpus using the DrugNer system (developed by the Advances Databases Group) with generic drug names and other biomedical concepts and manually evaluated by a pharmacological expert. The system combines information obtained by the UMLS MetaMap Transfer (MMTx) program and nomenclature rules recommended by the World Health Organization (WHO) International Nonproprietary Names (INNs) Program to identify and classify pharmaceutical substances

  • Reference: TIN2007-67407-C03-01
  • Financing:
  • Project type: Público
  • State: Activo
  • Principal investigator: Paloma Martínez Fernández
  • Other investigator: Lourdes Moreno, Elena Castro Galán, Ana M. Iglesias Maqueda, César De Pablo Sánchez, Isabel Segura Bedmar, María Teresa Vicente-Díez, José Luis Martínez Fernández, Belén Ruiz-Mezcua, Julián Moreno Schneider, Mario Crespo
  • Duration: -

MAVIR Consortium is a research network co-funded by the Regional Government of Madrid under the IV Plan Regional de Investigación Científica e Innovación Tecnológica (IV PRICIT) integrating a multi-disciplinar team made of scientists, engineers, linguists and documentalists working together on two main areas:Human Language Technologies and Scientific Communication via WWW. The thematic network suggested includes 25 doctors organised in 6 research groups (UNED, UAM, UC3M, UEM, UPM and CINDOC) of the CM that from a multi-discipline perspective complement in various dimensions: academic vs. professional, research vs. services, resources’ generation vs. applications. Furthermore, there are 6 other national and international groups of research associated to the project as well as, among others, the following contributor organizations: RAE, Instituto Cervantes, Fuenlabrada Hospital, EFE Agency and DAEDALUS.

  • Reference: S-505/TIC/0267
  • Financing: IV Plan Regional de Investigación Científica e Innovación Tecnológica (IV PRICIT), Comunidad de Madrid
  • Project type: Público
  • State: Terminado
  • Principal investigator: Paloma Martínez Fernández
  • Other investigator: Paloma Martínez Fernández, Dolores Cuadra Fernández, Lourdes Moreno, Elena Castro Galán, Ana M. Iglesias Maqueda, Francisco Javier Calle Gómez, Harith Al-Jumaily, César De Pablo Sánchez, Isabel Segura Bedmar, María Teresa Vicente-Díez, David del Valle Agudo, Jesica Rivero Espinosa, Doaa Samy, Mario Crespo, Daniel Sánchez Cisneros, María Herrero Zazo
  • Duration: -
  • http://www.mavir.net

The aim is to research in technology based on automatic language processing for information location and retrieval from medical texts and other resources (reports, electronic medical records, scientific documentation, etc..) specially in Spanish language. Thus, we worked in browsers with different levels of complexity that integrate medical domain-specific resources and terminology (UMLS, SNOMED, etc.) and with different treatment of syntactic and semantic levels.

  • Reference: FIT-350300-2007-75
  • Financing: Ministerio de Industria, Comercio y Turismo
  • Project type: Público
  • State: Terminado
  • Principal investigator: Paloma Martínez Fernández
  • Other investigator: Paloma Martínez Fernández, Dolores Cuadra Fernández, Elena Castro Galán, Ana M. Iglesias Maqueda, Harith Al-Jumaily, César De Pablo Sánchez, Isabel Segura Bedmar, María Teresa Vicente-Díez, José Luis Martínez Fernández
  • Duration: -