Etiqueta: utf-8

Cómo contar caracteres en UTF-8 en C++

15 de agosto de 2021 - 3 minutos de lectura

UTF-8 es una codificación de texto muy versátil y difundida. En particular para casos donde se necesita soportar cualquier caracter Unicode pero no se quiere pagar un costo alto de almacenamiento. Ya que Unicode es enorme no hay manera de codificar todas las posibilidades en un sólo byte. Al mismo tiempo, utilizar dos o cuatro bytes para cada caracter puede ser un desperdicio si la mayoría de los caracteres que usamos entrarán en uno o dos bytes.

drkbugs

Buscar

Etiquetas

Cómo contar caracteres en UTF-8 en C++