UNIVERSIDAD DE SALAMANCA
Imagina que tienes miles de periódicos históricos de los siglos XVIII, XIX y XX consevados en una hemeroteca, y quieres encontrar toda la información sobre música que contienen. Hacerlo manualmente sería una tarea que tomaría décadas. Aquí es donde entra la Inteligencia Artificial: como un asistente incansable capaz de leer, analizar y extraer información de enormes cantidades de texto en cuestión de horas.
La IA no "piensa" como los humanos, pero sí puede reconocer patrones en el lenguaje. Cuando le damos instrucciones específicas ("prompts"), puede identificar qué textos tratan de música, extraer nombres de compositores, obras, instrumentos, géneros musicales, y mucho más. Es como tener un investigador especializado que puede procesar millones de palabras buscando exactamente lo que necesitamos.
LexiMus USAL es parte de un proyecto coordinado que utiliza estas capacidades de la IA para recuperar y analizar el patrimonio musical español a través de la prensa histórica digitalizada. Forma parte del proyecto nacional "LexiMus: Léxico y ontología de la música en español", junto al Instituto Complutense de Ciencias Musicales y la Universidad de La Rioja. En esta web encontrarás dos secciones fundamentales: la primera es un buscador de noticias musicales y la segunda está dedicada al análisis iniciales de estas ricas fuentes históricas.
Detección Automática de Contenido Musical
¿Qué encontrarás aquí? Una repositorio en constante crecimiento con noticias, anuncios y artículos sobre música extraídos automáticamente de periódicos históricos españoles. El contenido es posteriormente revisado y validado por musicólogos especializados en cada época histórica, garantizando así la precisión de la información presentada.
El proceso de extracción se realizó utilizando Claude Code, una herramienta de IA especializada en programación y análisis de documentos. El procedimiento fue el siguiente:
📂 Scripts de Análisis Disponibles
Todos los scripts Python utilizados para la extracción y análisis de estos datos están disponibles públicamente en:
Ver Scripts de Análisis en GitHub →
Incluye 23 scripts organizados en 4 categorías: análisis de revistas musicales, análisis de prensa, procesamiento y extracción de datos, y generadores de interfaces web.
Se trabajó con números de periódicos y revistas musicales digitalizados en formato PDF alojados en la Hemeroteca de la Biblioteca Nacional de España (BNE).
Para cada fuente histórica (Diario de Madrid, El Debate, España, El Sol, etc), se diseñaron instrucciones específicas adaptadas al estilo periodístico y características de cada publicación.
Claude Code analizó cada PDF, identificando automáticamente secciones, párrafos y menciones relacionadas con música: conciertos, óperas, críticas musicales, anuncios de partituras, biografías de músicos, etc.
La IA no solo detectó el contenido musical, sino que lo transcribió de forma completa, conservando información como fechas, nombres propios, lugares y contexto.
Descubrimiento de Patrones en Textos No Estructurados
¿Qué encontrarás aquí? Análisis computacionales que revelan tendencias, patrones y evolución del discurso musical español a través del tiempo.
Este análisis trabajó con textos no estructurados (es decir, textos completos sin clasificar ni etiquetar previamente) para que la IA encontrara patrones de forma autónoma:
Se utilizó Claude para procesar los corpus textuales completos. La IA identificó automáticamente:
Para complementar el análisis cualitativo de Claude, se utilizó esta plataforma especializada en análisis textual que ofrece:
Esta herramienta profesional de corpus lingüísticos permitió:
Este proyecto representa una nueva forma de acceder a los datos en musicología, donde la IA actúa como una lupa digital que nos permite ver patrones y tendencias que serían muy complicadas de detectar manualmente. Los resultados no solo nos muestran qué se escribió sobre música en la prensa histórica, sino cómo evolucionó el discurso musical español, qué obras y compositores dominaron cada época, y cómo se transformó el vocabulario musical a lo largo del tiempo. A partir de ahí el investigador puede interpretar esos datos de forma más precisa y completa en sus trabajos.
La web está en constante actualización, incorporando nuevos corpus y refinando los análisis para ofrecer una visión cada vez más completa del patrimonio musical español documentado en la prensa histórica.
Si utilizas las fuentes de este espacio en tu investigación, por favor cita:
Prensa musical e Inteligencia Artificial. Proyecto LexiMus: Léxico y ontología de la música en español (PID2022-139589NB-C33), Universidad de Salamanca.
Disponible en: https://leximus.usal.es
© 2025 Universidad de Salamanca.
Para facilitar el uso de estas herramientas por otros usuarios musicólogos, sin conocimientos de informática, hemos desarrollado los siguientes tutoriales de ayuda:
Guías paso a paso para utilizar las principales plataformas de análisis de corpus textuales:
Aprende a utilizar esta potente herramienta profesional de análisis lingüístico para estudiar corpus musicales.
Descubre cómo realizar análisis estadísticos y visualizaciones de datos textuales de forma intuitiva.
Guía completa para utilizar esta plataforma de lectura distante y análisis automatizado de textos.
Instrucciones detalladas para ejecutar scripts de análisis específicos, pensados para usuarios sin experiencia en programación:
Script sencillo para buscar y analizar la frecuencia de términos específicos en grandes corpus textuales.
Accede a todos los repositorios del proyecto con scripts, datos y documentación completa.
El proyecto LexiMus USAL está formado por un equipo multidisciplinar de investigadores e investigadoras especializados en musicología, humanidades digitales, etnomusicología y análisis de prensa histórica. Conoce a las personas que hacen posible este proyecto.