Conjunto de caracteres

Un conjunto de caracteres es un sistema de codificación para que las computadoras sepan cómo reconocer un caracter, incluidas letras, números, signos de puntuación y espacios en blanco.

En épocas anteriores, los países desarrollaron sus propios conjuntos de caracteres debido a los diferentes idiomas utilizados, como los códigos Kanji JIS (por ejemplo, Shift-JIS, EUC-JP, etc.) para japonés, Big5 para chino tradicional y KOI8-R para ruso. Sin embargo, Unicode se convirtió gradualmente en el conjunto de caracteres más aceptable por su soporte de idiomas universal.

Si un conjunto de caracteres se usa incorrectamente (por ejemplo, Unicode para un artículo codificado en Big5), es posible que no vean más que caracteres rotos, que se llaman Mojibake.

Véase también

Codificación de caracteres en Wikipedia
Mojibake en Wikipedia
Glosario de MDN Web Docs
- Caracter
- Unicode