Tur de Rust Tabelle de contenete

Pri utf-8

Con plu e plu lingues usat in computatores, li munde besonat representar li caracteres usat in ili queles ASCII sol ne posset monstrar (1 byte possibilisat solmen 256 caracteres).

On introductet utf-8 con un byte-longore variant inter 1-4 bytes, creante un spacie por mult plu caracteres possibil.

Un avantage de caracteres con grandore variabil es que con li max comun caracteres (ASCII) on besonat solmen un sol byte mem in utf-8

Un desavantage es que caractere-serchada ne plu esset possibil con rapiditá (O(1) constant témpor) con un simplic indexation (p.ex. my_text[3] por trovar li 4im caractere). Nam in ti-ci exemple it es possibil que chascun caractere possede un largore diferent, e in li sequentie de bytes on ne posse garantir li loc ú it comensa e fini se.

Pro to noi deve iterar tra un sequentie de bytes in utf-8 por comprender ú comensa li caracteres unicode (O(n) lineari témpor).

Ferris: "Por mi parte yo es felici posser usar utf-8 por usar li emojis de mi amics submarin."

🐠🐙🐟🐬🐋

Mascot Ferris