CAFECONMIEL CORPUS AUTOMÁTICO Y FENÓMENOS DE CONTACTO EN MALLORCA: INTELIGENCIA, ENTRENAMIENTO Y LENGUA

  • P.I.: David Sánchez
  • Coordinator: David Sánchez
  • Partners: UIB
  • Start date: Dec. 1, 2021
  • End date: Oct. 15, 2024

El presente proyecto tiene como objetivo avanzar en el conocimiento de la variedad de español en contacto con el catalán en Mallorca mediante la creación de un macrocorpus multiformato y la aplicación de herramientas de inteligencia artificial y sistemas complejos. El subproyecto COMEM se centra en la conservación, revalorización y estudio del patrimonio lingüístico de Mallorca. Hasta la fecha, el equipo ha compilado diferentes corpus centrados en una variedad o época; estos materiales se unirán en un marco conjunto para crear un gran corpus multiformato representativo de la variación en varios ejes: escrito y oral, diferentes registros, ss. XVII-XXI. Este macrocorpus, único en los estudios de contacto lingüístico, será lematizado y marcado y contará con herramientas de búsqueda especializadas; además, será de acceso libre y gratuito en internet. El subproyecto SICOVAL se encargará de analizar la variación lingüística del citado corpus, empleando modelos matemáticos aplicables a sistemas complejos y herramientas de aprendizaje profundo. Se usarán técnicas de procesamiento de lenguaje natural, dialectometría computacional, software de agrupamiento y jerarquización y análisis de procesos estocásticos. Los dos subproyectos estarán fuertemente imbricados, pues SICOVAL asistirá en las tareas de marcado y lematización mientras que COMEM seleccionará los rasgos que se analizarán computacionalmente. En definitiva, este proyecto estudiará con métodos interdisciplinares la variedad de español hablada en Mallorca, tanto su evolución interna como los rasgos debidos al contacto con el catalán, lo que permitirá alcanzar conclusiones que tendrán gran impacto en los estudios de contacto de lenguas.

Researchers

  • Tobias Galla

    Tobias Galla

  • Jose Javier Ramasco

    Jose Javier Ramasco

  • David Sánchez

    David Sánchez

  • Thomas Louf

    Thomas Louf

Recent Publications

Entropy and type-token ratio in gigaword corpora

Rosillo-Rodes,Pablo;San Miguel,Maxi;Sanchez,David;
Submitted (2024)

Editorial: Complexity in language variation and change

Heinsalu, E.; Patriarca, M.; Sánchez, D.
Frontiers in Complex Systems 2, 1497038 (1-2) (2024)

Aproximación estadística al reparto de <b> y <v> en manuscritos latinos de autores hispanos

Miguel Franco, Ruth; Sánchez, David
Zeitschrift für romanische Philologie 140, 365-384 (2024)

Computational lexical analysis of Flamenco genres

Rosillo-Rodes, Pablo; San Miguel, Maxi; Sánchez, David
Submitted (2024)

Algoritmos de agrupamiento y lingüística de corpus: ortografía y léxico en documentos mallorquines del siglo XVIII

Louf, T.; Sánchez, D.; Miguel Franco, R.
Scripta manent. Historia del español, documentación archivística y humanidades digitales (edited by Calderón Campos, M. and González Sopeña, I.), Peter Lang, 563-586 (2023)

This web uses cookies for data collection with a statistical purpose. If you continue browsing, it means acceptance of the installation of the same.


More info I agree