tutorial-sketch-engine

Tutorial de Sketch Engine para Investigadores

Guía práctica para analizar corpus de textos sin conocimientos técnicos avanzados


¿Qué es Sketch Engine?

Sketch Engine es una herramienta online que te permite analizar grandes cantidades de textos (corpus) para estudiar cómo se usan las palabras en contextos reales. Es especialmente útil para investigadores de lengua, literatura, historia y humanidades digitales.

No necesitas saber programación para usarlo.


Antes de empezar

1. Crear una cuenta

  1. Visita www.sketchengine.eu
  2. Haz clic en “Try Sketch Engine for free” (Prueba gratuita de 30 días). En la Universidad de Salamanca contamos con licencia de uso, puedes entrar desde tu correo y usuario usal.es.
  3. Rellena el formulario con tu email académico
  4. Confirma tu cuenta por correo electrónico

2. Acceder a la plataforma

  1. Inicia sesión en app.sketchengine.eu
  2. Verás el Dashboard (panel principal)
  3. Desde aquí accederás a todas las funciones

Las 4 funciones esenciales

🔍 1. CONCORDANCIAS - Buscar palabras en contexto

¿Para qué sirve? Ver todas las veces que aparece una palabra en tu corpus, con el texto que la rodea. Es como un “Google” pero para tu colección de textos.

Paso a paso:

  1. Selecciona tu corpus
    • En el Dashboard, haz clic en “Corpus” (menú izquierdo)
    • Elige un corpus en español (ejemplo: “Spanish Web 2011”)
    • O sube tu propio corpus (botón “Create corpus”)
  2. Buscar una palabra
    • Haz clic en “Concordance” en el menú superior
    • Escribe la palabra que quieres buscar (ejemplo: “ópera”)
    • Presiona Enter o haz clic en el botón de búsqueda
  3. Interpretar resultados
    • Verás líneas de texto con tu palabra resaltada en el centro
    • A la izquierda y derecha aparece el contexto
    • Puedes ordenar por palabra anterior o siguiente

Ejemplo práctico:

...la nueva temporada de    ópera    comenzará en octubre con...
...los amantes de la       ópera    italiana disfrutaron de...
...el teatro dedicado a la ópera    moderna ha inaugurado...

Tips útiles:


📊 2. LISTAS DE FRECUENCIA - Palabras más usadas

¿Para qué sirve? Descubrir qué palabras son las más frecuentes en tu corpus. Perfecto para identificar vocabulario especializado o temas principales.

Paso a paso:

  1. Acceder a la función
    • Con tu corpus seleccionado, haz clic en “Word list” (menú superior)
    • O busca “Frequency” en las opciones
  2. Configurar la lista
    • Elige el tipo de palabras:
      • “Lemma” = raíz de la palabra (piano, pianos → piano)
      • “Word” = forma exacta (piano ≠ pianos)
    • Selecciona cuántas palabras quieres ver (100, 500, 1000…)
  3. Analizar resultados
    • Verás una tabla con:
      • Palabra Frecuencia (número de veces) Por millón
    • Puedes ordenar de mayor a menor frecuencia
    • Descarga la lista en Excel o CSV

Ejemplo práctico:

PALABRA          FRECUENCIA    POR MILLÓN
música           12,543        1,245.3
concierto        4,782         478.2
orquesta         3,921         392.1
teatro           3,654         365.4

Tips útiles:


🎯 3. WORD SKETCH - Colocaciones y patrones

¿Para qué sirve? Ver qué palabras suelen aparecer juntas. Por ejemplo, qué adjetivos acompañan a “música” o qué verbos se usan con “tocar”.

Paso a paso:

  1. Buscar un Word Sketch
    • Haz clic en “Word Sketch” (menú superior)
    • Escribe una palabra (ejemplo: “concierto”)
    • Presiona Enter
  2. Explorar las categorías
    • Verás secciones como:
      • “Modifiers” = adjetivos que la describen (concierto benéfico, sinfónico)
      • “Object of” = verbos que la acompañan (asistir a un concierto)
      • “Subjects” = qué la realiza (la orquesta dio un concierto)
  3. Interpretar resultados
    • Cada palabra tiene una puntuación (score)
    • Puntuaciones altas = colocaciones muy frecuentes
    • Haz clic en cualquier palabra para ver ejemplos en contexto

Ejemplo práctico para “ópera”:

ADJETIVOS (Modifiers):
- italiana     (score: 10.45)
- lírica       (score: 9.82)
- wagneriana   (score: 8.91)

VERBOS (Object of):
- interpretar  (score: 11.23)
- estrenar     (score: 10.56)
- componer     (score: 9.87)

Tips útiles:


🔑 4. KEYWORDS - Términos característicos

¿Para qué sirve? Identificar qué palabras son exclusivas o especialmente frecuentes en tu corpus comparado con un corpus general. Perfecto para encontrar vocabulario especializado.

Paso a paso:

  1. Preparar la comparación
    • Necesitas dos corpus:
      • Corpus objetivo = tu colección especializada (ej: revistas musicales)
      • Corpus de referencia = corpus general del español
    • Sketch Engine ofrece corpus de referencia predefinidos
  2. Generar Keywords
    • Haz clic en “Keywords” (menú superior)
    • Selecciona tu corpus objetivo
    • Elige un corpus de referencia (ej: “Spanish Web Corpus”)
    • Haz clic en “Calculate”
  3. Analizar resultados
    • Verás palabras ordenadas por “Keyness” (valor estadístico)
    • Valores altos = palabras muy características de tu corpus
    • Identifica terminología especializada automáticamente

Ejemplo práctico (revistas musicales):

KEYWORD          KEYNESS    FRECUENCIA
zarzuela         156.78     1,234
maestro          142.34     2,567
partitura        128.91     892
conservatorio    115.45     1,456

Tips útiles:


Consejos generales

✅ Buenas prácticas

  1. Empieza con corpus pequeños para familiarizarte
  2. Guarda tus búsquedas (botón “Save” en cada función)
  3. Exporta siempre los resultados para análisis posterior
  4. Usa filtros para refinar búsquedas complejas
  5. Consulta el manual si te atascas: Sketch Engine User Guide

🎓 Para investigadores de humanidades

Aplicaciones prácticas:

📚 Recursos adicionales


Glosario de términos

Término Significado
Corpus Colección organizada de textos digitales
Concordancia Lista de apariciones de una palabra en contexto
Lema Forma canónica de una palabra (infinitivo, singular…)
Colocación Palabras que suelen aparecer juntas
Keyness Medida estadística de especificidad de una palabra
Token Cada palabra individual en un corpus
Type Palabra única (sin repeticiones)
KWIC Key Word In Context (palabra clave en contexto)

Ejemplo completo de flujo de trabajo

Investigar “el uso del término ‘jazz’ en revistas musicales españolas”

Paso 1: Sube tu corpus de revistas musicales Paso 2: Haz una Concordancia de “jazz” para ver contextos Paso 3: Genera Lista de Frecuencia para ver su evolución temporal Paso 4: Usa Word Sketch para ver qué adjetivos acompañan a “jazz” Paso 5: Calcula Keywords comparando períodos (1920-1950 vs 1980-2010)


Preguntas frecuentes

¿Es gratis? Hay versión de prueba de 30 días. Las instituciones académicas pueden tener licencias institucionales. La Universidad de Salamanca tiene licencia y permita ampliar el tamaño del corpus al número de palabras que se necesiten bajo petición.

¿Puedo analizar textos en español? Sí, Sketch Engine soporta más de 90 idiomas, incluido el español.

¿Qué formato deben tener mis textos? Acepta TXT, DOC, PDF, HTML, XML. Los TXT son los más recomendables.

¿Cuántos textos puedo subir? Depende de tu plan. La versión de prueba permite corpus medianos (varios millones de palabras).

¿Necesito instalar algo? No, es 100% online. Solo necesitas navegador web.


Contacto y soporte


Creado por: María (LexiMus Research Project) Fecha: Octubre 2025 Licencia: CC BY 4.0


¿Listo para empezar? ¡Visita app.sketchengine.eu y explora tu corpus!