Análisis del Corpus de Ópera - Revista Iberia (1842)
Esta página proporciona acceso completo a todos los scripts, datos y recursos utilizados en el análisis del corpus de ópera de la Revista Iberia (1842). Todos los materiales están disponibles para descarga, reutilización y adaptación a otros proyectos de Humanidades Digitales.
Open Source Python 3 NLP Chart.js HTML5
# 1. Descargar el script
# 2. Configurar el directorio del corpus (línea 373)
directorio_corpus = "/ruta/a/tus/archivos/txt"
# 3. Ejecutar
python3 analizador_corpus_opera.py
# 4. Se genera automáticamente:
# resultados_analisis_opera_iberia_1842.json
# Python
import json
with open('resultados_analisis_opera_iberia_1842.json', 'r', encoding='utf-8') as f:
datos = json.load(f)
# Top 5 compositores
top5 = list(datos['compositores'].items())[:5]
for compositor, menciones in top5:
print(f"{compositor}: {menciones}")
# R
library(jsonlite)
datos <- fromJSON('resultados_analisis_opera_iberia_1842.json')
compositores <- datos$compositores
# Uso local:
1. Descargar index.html y resultados_analisis_opera_iberia_1842.json
2. Colocar ambos archivos en la misma carpeta
3. Abrir index.html en el navegador
# Publicar en servidor web:
1. Subir ambos archivos al servidor
2. Acceder vía URL del servidor
3. Funciona en cualquier hosting estático
Métodos principales:
__init__(directorio_base) - Inicialización con diccionarios de entidadesleer_corpus_completo() - Lee y unifica 34 archivos .txtnormalizar_texto(texto) - Normalización Unicode (NFC)buscar_menciones(patrones, texto) - Búsqueda con regexanalizar_compositores() - Identifica 24 compositoresanalizar_cantantes() - Identifica 14 cantantesanalizar_lexico_musical() - Clasifica en 8 categoríasanalizar_temas_principales() - Identifica 7 áreas temáticasextraer_bigramas_trigramas() - Colocaciones frecuentesgenerar_analisis_completo() - Ejecuta análisis completoguardar_resultados_json() - Exporta resultadosimprimir_resumen() - Muestra resumen en consolaEl script incluye diccionarios predefinidos para:
Todos estos diccionarios son fácilmente adaptables a otros corpus musicales.
Edita la línea 373 del script Python:
directorio_corpus = "/tu/ruta/a/archivos/txt"
Edita los diccionarios en el método __init__:
# Ejemplo: añadir compositores
self.compositores = {
'Bach': ['Bach', 'Johann Sebastian Bach', 'J.S. Bach'],
'Beethoven': ['Beethoven', 'Ludwig van Beethoven'],
'Brahms': ['Brahms', 'Johannes Brahms'],
# ... añade los tuyos
}
# En self.lexico_musical
'nueva_categoria': [
'término1', 'término2', 'término3'
]
Edita las variables CSS en index.html (líneas 15-24):
:root {
--primary-color: #8B0000; /* Tu color principal */
--background: #F5F5DC; /* Color de fondo */
--text: #2C2C2C; /* Color del texto */
}
Todos los archivos están disponibles en el repositorio oficial del proyecto.
🔗 Ver en GitHubSi utilizas estos recursos en tu investigación, por favor cita:
Prensa musical e Inteligencia Artificial. Proyecto LexiMus: Léxico y
ontología de la música en español (PID2022-139589NB-C33), Universidad
de Salamanca. Disponible en: https://LeximusUSAL.github.io/inicio
Proyecto financiado por el Ministerio de Ciencia e Innovación (MICIU/AEI) y Fondos FEDER.
© 2025 Universidad de Salamanca