Cristóbal Colón Ruiz (Proyectos)

Accesibilidad cognitiva y sensorial a los sistemas de videoconferencia (ACCESS2MEET)

Una gran parte de las tecnologías conlleva una interacción con las personas a través de interfaces de usuario, por ello es necesario diseñar interfaces de usuario accesibles, que aseguren el acceso y el manejo de los sistemas y sus contenidos de todas las personas independientemente de sus capacidades visuales, auditivas, cognitivas o motrices. Con esta motivación, este proyecto tiene como objetivo principal mostrar la viabilidad y aplicación de técnicas de accesibilidad para el diseño de sistemas interactivos de videoconferencia que aseguren el acceso a personas con discapacidad. Por la naturaleza de los requisitos de accesibilidad, se va a investigar con un enfoque multidisciplinar, basado en el conocimiento científico compartido que pueden ofrecer los métodos de áreas como la Inteligencia Artificial (AI) y la Interacción Hombre Máquina (HCI).

Hay usuarios con discapacidad sensorial como personas ciegas, con baja visión, sordas o con discapacidad auditiva, las cuales necesitan aplicaciones de videoconferencia que incluyan requisitos necesarios de accesibilidad como servicios de audio descripción de vídeos e imágenes, interfaces adaptados en relación a características sensoriales, servicios de subtitulado, manejo de aplicaciones por voz, o de lectores de pantalla. Además, están las barreras de accesibilidad cognitiva que afecta a personas con discapacidad intelectual, así como personas mayores las cuales necesitan un diseño intuitivo de las interfaces de usuario, servicios de simplificación de textos, y generación de resúmenes como herramientas de ayuda en la comprensión de los textos tal como se proponen en este proyecto.

Como contribuciones específicas se van a definir patrones de diseño de HCI para el diseño de interfaces de usuario adaptables y accesibles, junto con la exploración de técnicas de ingeniería semiótica. en los elementos interactivos de los interfaces de usuario. Además, se va a investigar en técnicas telemáticas de generación de subtitulado de calidad, y uso de técnicas de inteligencia artificial para la generación de trascripciones a través del postproceso de los subtítulos. En el ámbito de la AI y procesamiento de lenguaje natural se va en enfoques para la simplificación léxica de textos con la creación de corpus en el ámbito de la lectura fácil y lenguaje sencillo; así como en investigación de técnicas de deep learning para la generación de resúmenes de textos largos.

Referencia: PID2020-116527RB-I00
Financiación: Convocatoria 2020 Proyectos Generación del Conocimiento y Retos Investigación. MINISTERIO DE CIENCIA E INNOVACIÓN
Tipo de proyecto: Público
Estado: Activo
Investigador principal: Lourdes Moreno
Otros investigadores: Paloma Martínez, Belén Ruiz-Mezcua, Isabel Segura-Bedmar, Israel González Carrasco, Jose Luis Lopez-Cuadrado, José Luis Martínez Fernández, Rodrigo Alarcón, Cristóbal Colón Ruiz, Barbara Corsetti
Duración: 2021 - 2024
https://access2meet.uc3m.es/

Natural Language Processing for Rare Diseases (NLP4Rare)

Gracias a la investigación biomédica, se ha generado una gran cantidad de conocimiento sobre enfermedades raras en los últimos años. El elevado coste de los análisis moleculares y la existencia de una bibliografía reducida, en ocasiones inaccesible o dispersa, dificulta el avance en el diagnóstico y tratamiento de estas patologías. Frecuentemente, los pacientes afectos, a pesar de que sus condiciones son mortales o crónicamente incapacitantes, carecen de tratamiento. Aunque las bases genéticas hayan sido dilucidadas, en muchos casos la pérdida de función de los genes causantes no explica la complejidad fenotípica observada. Este es el caso de genodermatosis como la Epidermólisis bullosa distrófica (EBDR), síndrome de Kindler (SK) o Xeroderma pigmentoso (XPC). Estas enfermedades comparten manifestaciones clínicas y predisposición al cáncer, a pesar de tener diferentes bases genéticas. El proyecto tiene como objetivo aplicar técnicas de Procesamiento de Lenguaje Natural (PLN) para analizar la literatura biomédica con el fin de aumentar el conocimiento relativo a las enfermedades raras y desvelar relaciones complejas presentes en estas enfermedades. En concreto, esperamos identificar biomarcadores precisos, dianas terapéuticas de estas patologías, así como facilitar su diagnóstico a clínicos no especialistas. Además, se plantea como caso de uso, el análisis en estas tres genodermatosis (EBDR, KS y XPC) con el fin de correlacionar la información obtenida mediante PLN con los patrones de expresión génica provenientes de arrays moleculares de dichas enfermedades, publicados previamente por el grupo TERMeG. La trayectoria conjunta de los integrantes del proyecto, su experiencia en los campos del PLN y enfermedades raras, así como su carácter multidisciplinar sumado al interés de los consorcios de investigación especializados (CIBERER) y de las asociaciones de pacientes implicadas (DEBRA), garantizan la viabilidad y el impacto de la propuesta.

Referencia: NPL4RARE-CM-UC3M
Financiación: Convocatoria del Programa de Apoyo a la Realización de Proyectos Interdisciplinares de I+D para jóvenes investigadores de la UC3M 2019-2020
Tipo de proyecto: Público
Estado: Activo
Investigador principal: Isabel Segura Bedmar, Sara Guerrero Aspizua
Otros investigadores: Lourdes Moreno, Cristóbal Colón Ruiz, Rodrigo Alarcón, Carlos León Canseco , Lucía Martínez Santamaría , José Bonafont Aragó, Esteban Chacón Solano
Duración: 2020 - 2021

DeepEMR: Extracción de información clínica usando deep learning y técnicas de Big Data

El objetivo es el desarrollo de un sistema para procesamiento del texto libre de las historias clínicas electrónicas (HCE) del Hospital Universitario Fundación de Alcorcón (HUFA) utilizando técnicas de procesamiento de lenguaje natural y métodos de deep learning. HUFA fue uno de los primeros hospitales de la Comunidad de Madrid en disponer de HCE, desde su apertura a finales de 1997. En la actualidad la Comunidad de Madrid tiene integradas más 5 millones de HCE de las que sólo se procesan los metadatos estructurados. El resto de la información, en formato no estructurado (texto libre), a día de hoy permanece sin ser poder ser explotada por procesos automáticos. El desarrollo de tecnología capaz de procesar y explotar información no estructurada en texto libre de la HCE en el contexto actual de big data, puede tener muchas aplicaciones tanto en la mejora de la práctica clínica (generación automática de resúmenes de episodios relacionados con un paciente, sistemas de ayuda a la decisión clínica para personalizar diagnósticos y tratamiento de enfermedades, alertas de enfermedades infecciosas, mejora de los sistemas de farmacovigilancia, etc.) como en investigación (semi-automatización de los estudios epidemiológicos, por ejemplo en la identificación de los cohortes de pacientes). En concreto, la realización de estudios epidemiológicos implica una ardua labor en la revisión manual de un elevado número de HCE, lo que a su vez conlleva un gran número de recursos humanos y una ingente cantidad de horas de trabajo. Por tanto es crucial promover el desarrollo de técnicas automáticas que permitan obtener información de forma más ágil, convirtiendo la información no estructurada en estructurada y procesable por algoritmos automáticos, y facilitando así la toma de decisiones estratégicas.
El objetivo del proyecto es el desarrollo de técnicas de PLN y método de deep learning para el análisis de la información no estructurada de la HCE, con el fin último del de reducir el coste, en tiempo y recursos, de los estudios epidemiológicos. El proyecto tiene dos centros participantes: (Subproyecto 1) Grupo LABDA de la UC3M que desarrollará el sistema automático para el procesamiento de la HCE y (Subproyeto 2) HUFA cuyo equipo está formado por especialistas de la unidad de Alergología, que serán los encargados de llevar a cabo un estudio epidemiológico a partir de los datos obtenidos de la HCE mediante al uso de PLN y métodos de deep learning. En concreto, el estudio epidemiológico tendrán como principal objetivo estudiar la prevalencia de la anafilaxia en la población definida como caso de uso de aplicación. Varios profesionales del servicio de informática de HUFA serán los encargados de anonimizar las HCE para garantizar la protección de datos de los pacientes.
Aunque el sistema será desarrollado sobre la HCE del HUFA, la tecnología que se pretende desarrollar en el proyecto solicitado, podría ser aplicada directamente a la HCE de cualquier otro hospital. Además, su adaptación al estudio epidemiológico de otras patologías distintas a la anafilaxia (cáncer de mama, ictus, etc) es relativamente sencilla ya que los enfoques (deep learning) que se quieren abordar durante el proyecto son independientes del problema a tratar.

Referencia: TIN2017-87548-C2-1-R
Financiación:
Tipo de proyecto: Público
Estado: Activo
Investigador principal: Paloma Martínez Fernández, Isabel Segura Bedmar
Otros investigadores: Jose Luis Lopez-Cuadrado, Israel González Carrasco, José Luis Martínez Fernández, Lourdes Moreno, Belén Ruiz-Mezcua, Cristóbal Colón Ruiz, Rodrigo Alarcón
Duración: 2018 - 2020