Com poden ajudar-nos les tècniques computacionals a entendre una tradició musical centenària? Un nou estudi publicat a la revista ACM’s Journal on Computing and Cultural Heritage aplica processament del llenguatge natural i aprenentatge automàtic a les lletres del flamenc, per descobrir com se’n distingeixen els diferents gèneres (o palos) a través del llenguatge. La recerca, duita a terme a l’Institut de Física Interdisciplinària i Sistemes Complexos (IFISC, CSIC-UIB), explora l’estructura oculta darrere la tradició oral del flamenc, i té implicacions per a la conservació del patrimoni cultural i les humanitats digitals.
Els investigadors de l’IFISC Pablo Rosillo-Rodes, Maxi San Miguel i David Sánchez varen analitzar un corpus de més de 2.000 lletres de flamenc i hi varen aplicar un mètode d’aprenentatge automàtic que utilitza mètriques basades en freqüències de paraules per predir la categoria d’un text i distingir diferents palos basant-se únicament en el seu contingut lèxic (és a dir, basant-se en paraules). «Vàrem descobrir que, a més del ritme i la tonalitat, el mateix lèxic conté prou informació per classificar les cançons en el palo correcte amb una alta precisió», explica Pablo Rosillo-Rodes, autor principal de l’estudi i investigador doctoral a l’IFISC. «Aquest enfocament quantitatiu no només valida el coneixement tradicional, sinó que també revela noves relacions entre els estils flamencs».
Patrons lèxics en el flamenc
Utilitzant tècniques de lingüística computacional i anàlisi de xarxes, els investigadors varen identificar paraules característiques de cada gènere i varen traçar les relacions entre estils. «Per exemple, observàrem els estrets vincles històrics coneguts entre soleàs i buleries, i entre tientos i tangos, només a partir de les lletres», afegeix David Sánchez, investigador principal i professor titular de l’IFISC.
Més enllà de la classificació, l’estudi també revela patrons culturals profunds. Les lletres associades a les seguidilles són riques en vocabulari relacionat amb el dolor i l’espiritualitat, mentre que les alegries destaquen temes de celebració i geografia, en particular referències a la ciutat de Cadis. «El llenguatge del flamenc codifica les experiències viscudes, les lluites i les celebracions de les seves comunitats», afirma el professor emèrit de l’IFISC Maxi San Miguel.
A més, mitjançant el càlcul de distàncies lèxiques i l’aplicació de tècniques d’anàlisi de xarxes, l’estudi construeix un «arbre de relacions» entre els principals palos. En aquest arbre, les buleries emergeixen com un node central que connecta diferents branques estilístiques, com els cants malaguenys (fandangos i malaguenyes) i els estils d’origen gitano (seguidilles i soleàs).
Un pont entre intel·ligència artificial i patrimoni cultural
Aquest treball representa la primera anàlisi computacional a gran escala de lletres de flamenc i obre noves portes a la recerca de la música tradicional. «Aplicant l’aprenentatge automàtic al patrimoni cultural immaterial, podem preservar i comprendre millor les complexes històries que enclouen les tradicions orals», conclou Rosillo-Rodes.
Aquest estudi no només complementa la recerca qualitativa tradicional, sinó que també contribueix al nínxol de recerca en el camp de l’exploració de l’evolució del flamenc a través de mètodes basats en dades. En tendir un pont entre el patrimoni cultural i la intel·ligència artificial, obre interessants vies per a la recerca interdisciplinària i ofereix potents eines per preservar i comprendre millor una de les tradicions musicals més emblemàtiques d’Espanya, reconeguda per la UNESCO com a part del Patrimoni Cultural Immaterial de la Humanitat.
Esquerra: pintura d’una balladora de flamenc // Pixabay. Dreta: precisió de la classificació de diversos gèneres flamencs. Tangos (Ta) i tientos (Ti) es confonen a causa del seu origen afí.
Rosillo-Rodes, Pablo; San Miguel, Maxi; Sánchez, David. ACM J. Comput. Cult. Herit. (2025). DOI: https://doi.org/10.1145/3748729