Natural Language Processing for Rare Diseases (NLP4Rare)
Gracias a la investigación biomédica, se ha generado una gran cantidad de conocimiento sobre enfermedades raras en los últimos años. El elevado coste de los análisis moleculares y la existencia de una bibliografía reducida, en ocasiones inaccesible o dispersa, dificulta el avance en el diagnóstico y tratamiento de estas patologías. Frecuentemente, los pacientes afectos, a pesar de que sus condiciones son mortales o crónicamente incapacitantes, carecen de tratamiento. Aunque las bases genéticas hayan sido dilucidadas, en muchos casos la pérdida de función de los genes causantes no explica la complejidad fenotípica observada. Este es el caso de genodermatosis como la Epidermólisis bullosa distrófica (EBDR), síndrome de Kindler (SK) o Xeroderma pigmentoso (XPC). Estas enfermedades comparten manifestaciones clínicas y predisposición al cáncer, a pesar de tener diferentes bases genéticas. El proyecto tiene como objetivo aplicar técnicas de Procesamiento de Lenguaje Natural (PLN) para analizar la literatura biomédica con el fin de aumentar el conocimiento relativo a las enfermedades raras y desvelar relaciones complejas presentes en estas enfermedades. En concreto, esperamos identificar biomarcadores precisos, dianas terapéuticas de estas patologías, así como facilitar su diagnóstico a clínicos no especialistas. Además, se plantea como caso de uso, el análisis en estas tres genodermatosis (EBDR, KS y XPC) con el fin de correlacionar la información obtenida mediante PLN con los patrones de expresión génica provenientes de arrays moleculares de dichas enfermedades, publicados previamente por el grupo TERMeG. La trayectoria conjunta de los integrantes del proyecto, su experiencia en los campos del PLN y enfermedades raras, así como su carácter multidisciplinar sumado al interés de los consorcios de investigación especializados (CIBERER) y de las asociaciones de pacientes implicadas (DEBRA), garantizan la viabilidad y el impacto de la propuesta.