Conjuntos de caracteres

Configura la codificación de texto en MySQL: entiende los character sets (utf8mb4, latin1) y las collations que determinan cómo se ordenan y comparan las cadenas.

El manejo correcto de los conjuntos de caracteres y las collations es esencial para cualquier aplicación que almacene texto en MySQL, especialmente cuando ese texto incluye caracteres no ASCII como tildes, eñes, caracteres chinos, japoneses o emojis. Una configuración incorrecta puede provocar caracteres corruptos, comparaciones insensibles a mayúsculas cuando deberían ser sensibles, o la incapacidad de almacenar ciertos símbolos.

Esta sección explica la diferencia entre character set (el conjunto de caracteres que puede representar la codificación) y collation (las reglas que determinan cómo se ordenan y comparan las cadenas). Aprenderás por qué utf8mb4 es el character set recomendado en MySQL moderno en lugar del antiguo utf8 que solo soporta hasta 3 bytes, y cómo elegir la collation adecuada según tus necesidades: insensible a mayúsculas, sensible al acento, basada en el idioma, etc.

Esta configuración puede aplicarse a nivel de servidor, base de datos, tabla o columna individual, lo que da una gran flexibilidad. Entender estos conceptos te ahorrará problemas de codificación muy difíciles de diagnosticar a posteriori y es especialmente relevante para aplicaciones web en español o multilingüe.

Artículos