Abrir menú de navegación
AIDive
ES
Iniciar sesión
Volver al glosario

Qué son n-Grams

Procesamiento del lenguaje natural

Secuencias de palabras, caracteres o tokens vecinos usadas en el análisis del lenguaje.

Definición

n-Grams son secuencias de palabras, caracteres o tokens vecinos usadas en el análisis del lenguaje. En el trabajo práctico con IA, ayudan a relacionar un concepto con los datos, el comportamiento del modelo, las decisiones de producto y la evaluación. La pregunta útil no es solo qué significa el término, sino cómo afecta a la calidad, el coste, la fiabilidad y el riesgo en un flujo de trabajo real.

Ejemplo

Un sistema de texto o voz usa n-Grams para procesar la entrada del usuario y devolver una respuesta que se ajuste mejor a la tarea y al idioma.

Por qué importa

n-Grams importa porque las secuencias de palabras, caracteres o tokens vecinos usadas en el análisis del lenguaje pueden cambiar cómo los equipos construyen, evalúan o eligen sistemas de IA.

Cómo funciona

El texto o la voz se limpia, se segmenta y se representa como características o embeddings, y luego se usa para análisis, búsqueda o generación. En el caso de n-Grams, lo clave es vincular la definición con los datos de entrada, las suposiciones, los resultados medibles y los límites de despliegue.

Dónde se usa

  • Se usan en traducción, analítica de texto, búsqueda, extracción de entidades, clasificación, flujos de trabajo de voz y herramientas de escritura.

Limitaciones

Los sistemas de lenguaje pueden perder contexto, tener dificultades con términos de dominio, alucinar detalles o fallar con entradas ruidosas.

FAQ

¿Por qué es útil conocer n-Grams?

n-Grams importa porque las secuencias de palabras, caracteres o tokens vecinos usadas en el análisis del lenguaje pueden cambiar cómo los equipos construyen, evalúan o eligen sistemas de IA.

¿Cómo se deben evaluar n-Grams en la práctica?

Empieza por la tarea concreta y después revisa los datos, las suposiciones, las métricas, las limitaciones y el coste de los errores antes de confiar en el resultado.