Tutorial de Sketch Engine para Investigadores
Guía práctica para analizar corpus de textos sin conocimientos técnicos avanzados
¿Qué es Sketch Engine?
Sketch Engine es una herramienta online que te permite analizar grandes cantidades de textos (corpus) para estudiar cómo se usan las palabras en contextos reales. Es especialmente útil para investigadores de lengua, literatura, historia y humanidades digitales.
No necesitas saber programación para usarlo.
Antes de empezar
1. Crear una cuenta
- Visita www.sketchengine.eu
- Haz clic en “Try Sketch Engine for free” (Prueba gratuita de 30 días). En la Universidad de Salamanca contamos con licencia de uso, puedes entrar desde tu correo y usuario usal.es.
- Rellena el formulario con tu email académico
- Confirma tu cuenta por correo electrónico
- Inicia sesión en app.sketchengine.eu
- Verás el Dashboard (panel principal)
- Desde aquí accederás a todas las funciones
Las 4 funciones esenciales
🔍 1. CONCORDANCIAS - Buscar palabras en contexto
¿Para qué sirve?
Ver todas las veces que aparece una palabra en tu corpus, con el texto que la rodea. Es como un “Google” pero para tu colección de textos.
Paso a paso:
- Selecciona tu corpus
- En el Dashboard, haz clic en “Corpus” (menú izquierdo)
- Elige un corpus en español (ejemplo: “Spanish Web 2011”)
- O sube tu propio corpus (botón “Create corpus”)
- Buscar una palabra
- Haz clic en “Concordance” en el menú superior
- Escribe la palabra que quieres buscar (ejemplo: “ópera”)
- Presiona Enter o haz clic en el botón de búsqueda
- Interpretar resultados
- Verás líneas de texto con tu palabra resaltada en el centro
- A la izquierda y derecha aparece el contexto
- Puedes ordenar por palabra anterior o siguiente
Ejemplo práctico:
...la nueva temporada de ópera comenzará en octubre con...
...los amantes de la ópera italiana disfrutaron de...
...el teatro dedicado a la ópera moderna ha inaugurado...
Tips útiles:
- Usa el filtro “Filter” para refinar resultados
- Exporta los resultados con “Download”
- Cambia el número de resultados mostrados (10, 50, 100…)
📊 2. LISTAS DE FRECUENCIA - Palabras más usadas
¿Para qué sirve?
Descubrir qué palabras son las más frecuentes en tu corpus. Perfecto para identificar vocabulario especializado o temas principales.
Paso a paso:
- Acceder a la función
- Con tu corpus seleccionado, haz clic en “Word list” (menú superior)
- O busca “Frequency” en las opciones
- Configurar la lista
- Elige el tipo de palabras:
- “Lemma” = raíz de la palabra (piano, pianos → piano)
- “Word” = forma exacta (piano ≠ pianos)
- Selecciona cuántas palabras quieres ver (100, 500, 1000…)
- Analizar resultados
- Verás una tabla con:
-
| Palabra |
Frecuencia (número de veces) |
Por millón |
- Puedes ordenar de mayor a menor frecuencia
- Descarga la lista en Excel o CSV
Ejemplo práctico:
PALABRA FRECUENCIA POR MILLÓN
música 12,543 1,245.3
concierto 4,782 478.2
orquesta 3,921 392.1
teatro 3,654 365.4
Tips útiles:
- Filtra palabras vacías (artículos, preposiciones) con “Stop words”
- Compara listas de diferentes períodos temporales
- Busca nombres propios con “Proper nouns”
🎯 3. WORD SKETCH - Colocaciones y patrones
¿Para qué sirve?
Ver qué palabras suelen aparecer juntas. Por ejemplo, qué adjetivos acompañan a “música” o qué verbos se usan con “tocar”.
Paso a paso:
- Buscar un Word Sketch
- Haz clic en “Word Sketch” (menú superior)
- Escribe una palabra (ejemplo: “concierto”)
- Presiona Enter
- Explorar las categorías
- Verás secciones como:
- “Modifiers” = adjetivos que la describen (concierto benéfico, sinfónico)
- “Object of” = verbos que la acompañan (asistir a un concierto)
- “Subjects” = qué la realiza (la orquesta dio un concierto)
- Interpretar resultados
- Cada palabra tiene una puntuación (score)
- Puntuaciones altas = colocaciones muy frecuentes
- Haz clic en cualquier palabra para ver ejemplos en contexto
Ejemplo práctico para “ópera”:
ADJETIVOS (Modifiers):
- italiana (score: 10.45)
- lírica (score: 9.82)
- wagneriana (score: 8.91)
VERBOS (Object of):
- interpretar (score: 11.23)
- estrenar (score: 10.56)
- componer (score: 9.87)
Tips útiles:
- Usa “Word Sketch Difference” para comparar dos palabras similares
- Ideal para estudios de léxico especializado
- Detecta usos técnicos vs. coloquiales
🔑 4. KEYWORDS - Términos característicos
¿Para qué sirve?
Identificar qué palabras son exclusivas o especialmente frecuentes en tu corpus comparado con un corpus general. Perfecto para encontrar vocabulario especializado.
Paso a paso:
- Preparar la comparación
- Necesitas dos corpus:
- Corpus objetivo = tu colección especializada (ej: revistas musicales)
- Corpus de referencia = corpus general del español
- Sketch Engine ofrece corpus de referencia predefinidos
- Generar Keywords
- Haz clic en “Keywords” (menú superior)
- Selecciona tu corpus objetivo
- Elige un corpus de referencia (ej: “Spanish Web Corpus”)
- Haz clic en “Calculate”
- Analizar resultados
- Verás palabras ordenadas por “Keyness” (valor estadístico)
- Valores altos = palabras muy características de tu corpus
- Identifica terminología especializada automáticamente
Ejemplo práctico (revistas musicales):
KEYWORD KEYNESS FRECUENCIA
zarzuela 156.78 1,234
maestro 142.34 2,567
partitura 128.91 892
conservatorio 115.45 1,456
Tips útiles:
- Exporta la lista para crear glosarios temáticos
- Compara diferentes períodos de tu corpus
- Identifica evolución del vocabulario especializado
Consejos generales
✅ Buenas prácticas
- Empieza con corpus pequeños para familiarizarte
- Guarda tus búsquedas (botón “Save” en cada función)
- Exporta siempre los resultados para análisis posterior
- Usa filtros para refinar búsquedas complejas
- Consulta el manual si te atascas: Sketch Engine User Guide
🎓 Para investigadores de humanidades
Aplicaciones prácticas:
- Literatura: Estudiar el vocabulario de un autor o período
- Historia: Analizar documentos históricos y terminología
- Lingüística: Investigar cambios léxicos diacrónicos
- Musicología: Identificar términos musicales en prensa histórica
- Estudios culturales: Rastrear conceptos en discursos públicos
📚 Recursos adicionales
- Video tutoriales: YouTube - Sketch Engine Channel
- Webinars gratuitos: Consulta el calendario en la web oficial
- Comunidad: Foro de usuarios para resolver dudas
- Soporte técnico: support@sketchengine.eu
Glosario de términos
| Término |
Significado |
| Corpus |
Colección organizada de textos digitales |
| Concordancia |
Lista de apariciones de una palabra en contexto |
| Lema |
Forma canónica de una palabra (infinitivo, singular…) |
| Colocación |
Palabras que suelen aparecer juntas |
| Keyness |
Medida estadística de especificidad de una palabra |
| Token |
Cada palabra individual en un corpus |
| Type |
Palabra única (sin repeticiones) |
| KWIC |
Key Word In Context (palabra clave en contexto) |
Ejemplo completo de flujo de trabajo
Investigar “el uso del término ‘jazz’ en revistas musicales españolas”
Paso 1: Sube tu corpus de revistas musicales
Paso 2: Haz una Concordancia de “jazz” para ver contextos
Paso 3: Genera Lista de Frecuencia para ver su evolución temporal
Paso 4: Usa Word Sketch para ver qué adjetivos acompañan a “jazz”
Paso 5: Calcula Keywords comparando períodos (1920-1950 vs 1980-2010)
Preguntas frecuentes
¿Es gratis?
Hay versión de prueba de 30 días. Las instituciones académicas pueden tener licencias institucionales. La Universidad de Salamanca tiene licencia y permita ampliar el tamaño del corpus al número de palabras que se necesiten bajo petición.
¿Puedo analizar textos en español?
Sí, Sketch Engine soporta más de 90 idiomas, incluido el español.
¿Qué formato deben tener mis textos?
Acepta TXT, DOC, PDF, HTML, XML. Los TXT son los más recomendables.
¿Cuántos textos puedo subir?
Depende de tu plan. La versión de prueba permite corpus medianos (varios millones de palabras).
¿Necesito instalar algo?
No, es 100% online. Solo necesitas navegador web.
Creado por: María (LexiMus Research Project)
Fecha: Octubre 2025
Licencia: CC BY 4.0
¿Listo para empezar? ¡Visita app.sketchengine.eu y explora tu corpus!