CAFECONMIEL
CORPUS AUTOMÁTICO Y FENÓMENOS DE CONTACTO EN MALLORCA: INTELIGENCIA, ENTRENAMIENTO Y LENGUA
P.I.:
David Sánchez
Coordinator: David Sánchez
Partners: UIB
Start date: Dec. 1, 2021
End date: Oct. 15, 2024
El presente proyecto tiene como objetivo avanzar en el conocimiento de la variedad de español en contacto con el catalán en Mallorca mediante la creación de un macrocorpus multiformato y la aplicación de herramientas de inteligencia artificial y sistemas complejos. El subproyecto COMEM se centra en la conservación, revalorización y estudio del patrimonio lingüístico de Mallorca. Hasta la fecha, el equipo ha compilado diferentes corpus centrados en una variedad o época; estos materiales se unirán en un marco conjunto para crear un gran corpus multiformato representativo de la variación en varios ejes: escrito y oral, diferentes registros, ss. XVII-XXI. Este macrocorpus, único en los estudios de contacto lingüístico, será lematizado y marcado y contará con herramientas de búsqueda especializadas; además, será de acceso libre y gratuito en internet. El subproyecto SICOVAL se encargará de analizar la variación lingüística del citado corpus, empleando modelos matemáticos aplicables a sistemas complejos y herramientas de aprendizaje profundo. Se usarán técnicas de procesamiento de lenguaje natural, dialectometría computacional, software de agrupamiento y jerarquización y análisis de procesos estocásticos. Los dos subproyectos estarán fuertemente imbricados, pues SICOVAL asistirá en las tareas de marcado y lematización mientras que COMEM seleccionará los rasgos que se analizarán computacionalmente. En definitiva, este proyecto estudiará con métodos interdisciplinares la variedad de español hablada en Mallorca, tanto su evolución interna como los rasgos debidos al contacto con el catalán, lo que permitirá alcanzar conclusiones que tendrán gran impacto en los estudios de contacto de lenguas.
Louf, T.; Sánchez, D.; Miguel Franco, R.
Scripta manent. Historia del español, documentación archivística y humanidades digitales (edited by Calderón Campos, M. and González Sopeña, I.), Peter Lang, 563-586 (2023)