CAFECONMIEL CORPUS AUTOMÁTICO Y FENÓMENOS DE CONTACTO EN MALLORCA: INTELIGENCIA, ENTRENAMIENTO Y LENGUA

  • I.P.: David Sánchez
  • Coordinador: David Sánchez
  • Partners: UIB
  • Fecha de inicio: 1 de Diciembre de 2021
  • Fecha de final: 15 de Octubre de 2024

El presente proyecto tiene como objetivo avanzar en el conocimiento de la variedad de español en contacto con el catalán en Mallorca mediante la creación de un macrocorpus multiformato y la aplicación de herramientas de inteligencia artificial y sistemas complejos. El subproyecto COMEM se centra en la conservación, revalorización y estudio del patrimonio lingüístico de Mallorca. Hasta la fecha, el equipo ha compilado diferentes corpus centrados en una variedad o época; estos materiales se unirán en un marco conjunto para crear un gran corpus multiformato representativo de la variación en varios ejes: escrito y oral, diferentes registros, ss. XVII-XXI. Este macrocorpus, único en los estudios de contacto lingüístico, será lematizado y marcado y contará con herramientas de búsqueda especializadas; además, será de acceso libre y gratuito en internet. El subproyecto SICOVAL se encargará de analizar la variación lingüística del citado corpus, empleando modelos matemáticos aplicables a sistemas complejos y herramientas de aprendizaje profundo. Se usarán técnicas de procesamiento de lenguaje natural, dialectometría computacional, software de agrupamiento y jerarquización y análisis de procesos estocásticos. Los dos subproyectos estarán fuertemente imbricados, pues SICOVAL asistirá en las tareas de marcado y lematización mientras que COMEM seleccionará los rasgos que se analizarán computacionalmente. En definitiva, este proyecto estudiará con métodos interdisciplinares la variedad de español hablada en Mallorca, tanto su evolución interna como los rasgos debidos al contacto con el catalán, lo que permitirá alcanzar conclusiones que tendrán gran impacto en los estudios de contacto de lenguas.

Investigadores

  • Tobias Galla

    Tobias Galla

  • Jose Javier Ramasco

    Jose Javier Ramasco

  • David Sánchez

    David Sánchez

  • Thomas Louf

    Thomas Louf

Publicaciones recientes

Algoritmos de agrupamiento y lingüística de corpus: ortografía y léxico en documentos mallorquines del siglo XVIII

Louf, T.; Sánchez, D.; Miguel Franco, R.
Scripta manent. Historia del español, documentación archivística y humanidades digitales (edited by Calderón Campos, M. and González Sopeña, I.), Peter Lang, 563-586 (2023)

Language dynamics within adaptive networks: an agent-based approach of nodes and links coevolution

Charalambous, C.; Sánchez, D.; Toral, R.
Frontiers in Complex Systems 1, 1304448 (1-12) (2023)

Modeling language ideologies for the dynamics of languages in contact

Rosillo-Rodes, Pablo; San Miguel, Maxi; Sanchez, David
Chaos 11, 113117 (1-16) (2023)

Complexity in Computational Sociolinguistics: Exploring the Interplay between Geography, Culture and the Social Fabric

Louf, Thomas (Supervisors: Ramasco, José J.; Sánchez, David)
PhD Thesis (2023)

American cultural regions mapped through the lexical analysis of social media

Louf, T; Gonçalves, B; Ramasco, JJ; Sánchez, D; Grieve, J
Humanities & Social Sciences Communications 10, 133 (2023)

Esta web utiliza cookies para la recolección de datos con un propósito estadístico. Si continúas navegando, significa que aceptas la instalación de las cookies.


Más información De acuerdo