El grupo HULAT ha participado en la 4ª edición de la tarea TSAR (Readability-Controlled Text Simplification, https://tsar-workshop.github.io/shared-task/), celebrada conjuntamente con la 30ª edición del congreso EMNLP (Empirical Methods in Natural Language Processing, https://2025.emnlp.org/) en Suzhou, China. Esta tarea ha consistido en la simplificación de textos con control de legibilidad, con el objetivo de generar simplificaciones de textos en inglés que se ajusten a un nivel de legibilidad específico definido según el Marco Común Europeo de Referencia para las Lenguas (MCER).
El enfoque empleado se describe en el artículo publicado en las actas del congreso, "HULAT-UC3M at TSAR 2025 Shared Task A Prompt-Based Approach using Lightweight Language Models for Readability-Controlled Text Simplification" (https://aclanthology.org/2025.tsar-1.15/), presentado en formato póster por Jesús M. Sánchez-Gómez el 8 de noviembre de 2025. Concretamente, se basó en el uso de modelos de lenguaje (LLMs) ligeros, como LLaMA y Ettin Decoder, junto al desarrollo de dos estrategias diferentes de ingeniería de prompt (una reforzada y otra más concisa). Todo ello con el objetivo de simplificar textos originales de un nivel B2 o superior y adaptarlos a los niveles A1, A2 o B1, evitando el uso del fine-tuning y demostrando que los modelos más ligeros también pueden ser efectivos.
La experimentación llevada a cabo con los modelos seleccionados confirmaron el desafío de controlar los niveles MCER, ya que los LLMs tendían a generar niveles más complejos de los requeridos. Además, en la revisión manual se detectaron numerosos problemas en los textos simplificados por los modelos, como alucinaciones y repeticiones, entre otros. El modelo LLAMA 3 8B con el prompt ligeramente reforzado fue elegido como la propuesta final, situándose en el decimocuarto lugar en la clasificación general.
La participación de HULAT en esta tarea ha permitido, principalmente, ampliar los conocimientos sobre el uso de prompts para simplificación y sobre las debilidades de los LLMs en el control de la legibilidad. El grupo mantiene un firme y fuerte compromiso con el desarrollo de tecnologías de lenguaje accesibles y eficientes, y la experiencia adquirida se integrará en las líneas de investigación en curso sobre simplificación de texto, con el fin de avanzar hacia soluciones más robustas que garanticen que la información se adapte de manera más fiable posible a las necesidades de cada lector.
