دورة تعلم رست (Rust) جدول المحتويات

ماهو utf-8

نظرًا لاستخدام المزيد من اللغات على أجهزة الكمبيوتر، كان العالم بحاجة إلى تمثيل عدد أكبر من الأحرف النصية أكثر مما يسمح به ASCII (يسمح البايت الواحد بـ 256 حرفًا فقط).

utf-8 تم تقديمه مع طول بايت متغير يتراوح من 1 إلى 4 بايت مما أدى إلى زيادة نطاق الأحرف الممكنة بشكل كبير.

من مميزات الأحرف ذات الحجم المتغير أن النص لا يحتوي على بايتات غير ضرورية للأحرف الشائعة جدًا في ASCII (يتطلب بايت واحد فقط في utf-8).

الجانب السلبي للأحرف ذات الحجم المتغير هو أنه لم يعد من الممكن إجراء البحث عن الأحرف بسرعة (O(1) وقت ثابت) باستخدام فهرسة بسيطة (على سبيل المثال، my_text[3] للحصول على الحرف الرابع). وأنه من الممكن أن يكون للأحرف السابقة عرض متغير، مما يؤدي إلى تغيير المكان الذي يبدأ فيه الحرف الرابع فعليًا في تسلسل البايتات.

بدلاً من ذلك كله، فإنه يجب علينا عمل تكرار عبر تسلسل بايت utf-8 لمعرفة من أين تبدأ أماكان أحرف Unicode فعليًا (O(n) الزمن الخطي).

فيريس: "أنا سعيد في الغالب بوجود utf-8 لتمثيل الرموز التعبيرية لأصدقائي تحت الماء."

🐠🐙🐟🐬🐋

Mascot Ferris