Unicode

Unicode — istənilən simvol üçün platformadan, proqramdan, dildən asılı olmayan unikal bir koddur.

UNICODE <yunikod> – bütün milli əlifbaların simvollarını kodlaşdırmaq üçün ISO 10646 standartı. Bu kodda hər bir simvolu göstərmək üçün 16-bitlik (2-baytlıq) bənzərsiz kombinasiyadan istifadə olunur. Standartları təsdiq edilməsi ilə Unicode konsorsiumu məşğul olur. Yunikod’da simvolları kodlaşdırmaq üçün 1 112 064 (= 220 + 216 − 211) yer ayrılıb ki, hazırda onlardan 100 mindən çoxu istifadə olunur. Kod fəzası hər birində 65 536 (= 216) simvol olmaqla 17 "müstəviyə" bölünüb:

• 0 müstəvisi (0000–FFFF): Təməl çoxdilli müstəvi (Basic Multilingual Plane, BMP)

• 1 müstəvisi (10000–1FFFF): Əlavə çoxdilli müstəvi (Supplementary Multilingual Plane, SMP)

• 2 müstəvisi (20000–2FFFF): Əlavə heroqlif müstəvisi (Supplementary Ideographic Plane, SIP)

• 3 müstəvisi (30000–3FFFF): Üçüncü heroqlif müstəvisi (Tertiary Ideographic Plane, TIP)

• 4 – 13 müstəviləri (40000–DFFFF) istifadə olunmur

• 14 müstəvisi (E0000–EFFFF): Xüsusi təyinatlı əlavə müstəvi (Supplementary Special-purpose Plane, SSP)

• 15 müstəvisi (F0000–FFFFF) Xüsusi istifadəli əlavə A-sahəsi (Supplementary Private Use Area-A, SPUA-A)

• 16 müstəvisi (100000–10FFFF) Xüsusi istifadəli əlavə B-sahəsi (Supplementary Private Use Area-B, SPUA-B)

0 müstəvisində hazırda istifadə olunan bütün əlifbaların simvolları və çoxlu sayda xüsusi simvollar yerləşir. Cədvəlin böyük bir hissəsini Çin-yapon heroqlifləri və Koreya hərfləri tutur. Azərbaycan (Türk) əlifbasının özəl simvollarının Unicode qarşılıqları bunlardır:

ğ U+011f

Ğ U+011e

ı U+0131

İ U+0130

ö U+00f6

Ö U+00d6

ü U+00fc

Ü U+00dc

ş U+015f

Ş U+015e

ç U+00e7

Ç U+00c7

ə U+0259

Ə U+018F

Mahiyyətinə görə kompüterlər yalnız rəqəmlərlə işləyə bilir. Kompüterlərin yaddaşlarında hərfləri saxlamaq üçün hər bir hərfə (və ya simvola) müəyyən bir ədəd qarşı qoyulur. Unicode yaranmamışdan əvvəl dünyada müxtəlif növ simvol kodlaşdırmaları var idi, lakin onlardan heç biri bütün simvolları əhatə edə bilmirdi. Məsələn, Avropa Birliyi dillərinin əlifbalarına daxil olan hərflərin kodlaşdırılması üçün müxtəlif kodlaşdırmalardan istifadə edilirdi. Hətta ayrıca bir dili təyin etmək üçün də (məs. İngilis dilini) müəyyən bir standart kodlaşdırma sistemi yox idi ki, o adi hərfləri, işarə simvollarını və texniki simvolları özündə cəmləşdirsin. Bundan başqa, çox vaxt da bu kodlaşdırmalar arasında uyğunluq yox idi. Misal üçün, iki müxtəlif kodlaşdırma sistemi bir-birindən fərqli olan iki simvola eyni bir kod və ya eyni bir simvola müxtəlif kodlar verirdi. Belə vəziyyətdə istənilən bir kompüterdə, əsasən də, server kompüterlərdə müxtəlif kodlaşdırma sistemlərini saxlamaq lazım gəlirdi, lakin bu halda da informasıyanın digər patformaya ötürülməsi və ya digər kodlaşdırmaya çevrilməsi müəyyən risk tələb edirdi.

Unicode-un tətbiqi bütün bu problemləri həll edir. Unicode sistemi dildən, platformadan, proqramdan asılı olamayaraq istənilən simvola unikal bir kod mənimsədir. Unicode Apple, HP, IBM, JustSystem, Microsoft, Oracle, SAP, Sun, Sybase, Unisys kimi böyük kompüter şirkətləri (və digər başqaları) tərəfindən kodlaşdırma standartı kimi qəbul edilmişdir. XML, Java, ECMAScript (JavaScript), LDAP, CORBA 3.0, WML və s. kimi müasir texnologiyalar tərəfindən yalnız Unicode kodlaşdırması istifadə olunur. Unicode ISO/IEC 10646-nın rəsmi realizə sxemidir. Nəhayət ki, bu kodlaşdırma demək olar ki, bütün əməliyyat sistemləri (platformaları), bütün İnternet proqramları və digər proqramlar tərəfindən dəstəklənir. Unicode standartlarının hər yerdə tətbiq edilməsi və onu dəstəkləyən vasitələrin əldə olunmasının mümkünlüyü hal-hazırda proqram təminatlarının inkişafının ən vacib istiqamətlərindən biridir.

Client-Server strukturunda olan çoxtəbəqəli proqram təminatlarında və proqram paketlərində, eyni zamanda İnternet şəbəkəsində informasiyanın təqdim edilməsində Unicode-dan istifadə köhnə kodlaşmalardan fərqli olaraq proqram məhsullarının dəstəklənməsinə çəkilən xərclərin azaldılmasına gətirib çıxarır. Döğrudan da Unicode müxtəlif platformalar üçün vahid proqram təminatı və ya İnternet səhifəsi hazırlamağa imkan verir. Informasiya ötürülməsində Unicode-dan istifadə informasiyanın tam dəqiq və itkisiz ötürülməsinə zəmanət verir.