Saltar al contenido principal

Prototipo de análisis textual ProText_GENTT

Uno de los resultados del proyecto HIPÓCRATES ha sido el desarrollo de un prototipo de análisis lingüístico, ProText GENTT, específicamente diseñado para el análisis de la comprensibilidad y legibilidad del CI en las tres lenguas de trabajo. ProText GENTT permite, asimismo, determinar cómo influyen los aspectos macro y microlingüísticos en la eficacia comunicativa del género. El prototipo incluye nuevas métricas de análisis o adaptaciones de métricas del idioma inglés al español y al catalán y listados léxicos especializados. Además, incorpora técnicas de inteligencia artificial (massive learning). Todas estas herramientas de análisis se han integrado en una pipeline desarrollada con el Centro Tecnológico de las Tecnologías de la Información y las Comunicaciones (CENTIC) y el catedrático de lingüística aplicada Pascual Perez-Paredes de la Universidad de Murcia. ProText_GENTT incorpora un conversor de textos a pdf y permite aplicar una batería de métricas seleccionadas, POS tags, variables textuales.

Docusaurus logo

Los resultados obtenidos en este bloque de trabajo han dado como deliverables tangibles los que se relacionan a continuación y han contribuido al avance del grupo en el conocimiento y explotación de herramientas y técnicas de inteligencia artificial:

  1. Analizador morfosintáctico propio, una herramienta para el análisis de consentimientos médicos para la determinación de su legibilidad y comprensibilidad desarrollada por el Centro tecnológico de las Tecnologías de la Información y la Comunicación de Murcia (CENTIC), ProText-GENTT.

  2. Informe previo sobre el corpus de catalán.

  3. Informe previo sobre el corpus de castellano y catalán. “A preliminary analysis of a corpus of consent forms in Spanish and Catalan”.