Povratak u IDN

FacebookLinkedinEmail
21.06.2016.
Povratak u IDN
Izvor: iana.org, freepik.com

Da li ste probali da koristite nazive internet domena napisane bilo kojim drugim pismom osim latinice?

Dok smo poslednje decenije prošlog veka svi uštimavali YUSCII na štampačima kako bi konačno „proštampali“ naša slova, krajem daleke 1996. godine predloženo je stvaranje IDN-ova. Implementacija je došla 1998. godine, kada je, posle mnogo predloženih standarda, IETF usvojio internacionalizaciju naziva domena u aplikacijama (engl. Internationalizing Domain Names in Applications – IDNA).

IETF (engl. Internet Engineering Task Force) je telo zaduženo za sve standarde na internetu, između ostalih i poznati standard IPv6.

Root Zone Database
Izvor: iana.org

Šta zapravo znači IDN?

Ova skraćenica označava internacionalizovane nazive domena (engl. Internationalized Domain Names).

U praksi, IDN predstavlja naziv domena ispisan bilo kojim pismom koje ne podržava ASCII kod (American Standard Code for Information Interchange), ili pored njega podržava i druga slova. Pismo koje koristi ASCII je engleska latinica, a kod nas postoje i drugi zanimljivi nazivi kao „ćelava latinica“, ali ćemo se mi zadržati na stručnom nazivu ASCII kod.

Sa druge strane, sva svetska pisma su sakupljena u jednu veliku tabelu pisama i standardizovana, a taj skup svih svetskih pisama se zove UNICODE (engl. unique, unified, universal encoding). Pri pisanju IDN nazivadomena koristi se UNICODE.

Uobičajeno je da se IDN oblik koristi bez www (engl. World Wide Web), koji upražnjavamo kod svih standardnih, to jest ASCII naziva domena. Razlozi za ovo su očigledni – izbegava se mešanje engleske latinice i ostalih pisama (među kojima je i naša ćirilica), a takođe i promena tastature sa latiničke na (u našem slučaju) ćiriličku prilikom pisanja veb adresa. Probajte i sami. Ukucajte sledeće primere u adresnu liniju u svom pregledaču:

рнидс.срб – IDN

www.рнидс.rs – ASCII naziv domena

I prvi i drugi primer su napisani u jednom pismu i, kada se ukucaju, vode vas na sadržaj sajta našeg Registra. Veoma često se ovakav pristup koristi da se korisnici koji su ukucali naziv domena na ćirilici vode na sajt čiji je sadržaj na ćirilici, a oni koji su ukucali naziv domena na engleskoj latinici vode na latiničku verziju sajta. Takva upotreba je jedna od najboljih za dva naziva domena na različitim pismima, koji pozivaju sadržaj na pismu na kome je i sam naziv domena.

Na kom si nivou?

Međutim, nije sve uvek ovako jednostavno. Vratićemo se na trenutak u 1998. godinu kada je usvojen IDNA i kada su internacionalizovani nazivi domena postali mogući. Prvi domen koji je usvojio IDNA standard bio je .COM. Usvajanjem standarda bilo je dozvoljeno da se koriste pisma koja nisu samo po ASCII kodu, pa je naziv domena mogao da ima oblik:

www.pantelija.com

Za ovakve domene kaže se da imaju IDN na drugom nivou domena (engl. Second Level Domain), to jest levo od .COM, pošto domen može da ima više nivoa (tri i više). Ovo je danas veoma rasprostranjena pojava, zbog prirode naziva domena najvišeg nivoa.

Najčešće su zemlje za nazive domena birale već postojeće međunarodne oznake pisane u ASCII kodu, te nije bilo potrebe da se menja naziv domena najvišeg nivoa, ali su u svom pismu imale slova drugačija od engleske latinice (dijakritici na primer), pa je tabela seta karaktera koja se koristi za naziv domena na drugom nivou proširena njihovim specifičnim slovima. Tipične primere za ovo nalazimo u Nemačkoj (.DE), gde se na drugom nivou mogu koristiti umlauti, a slično je i u Francuskoj (.FR) gde mogu da se koriste apostrofi, u Švedskoj, i u gotovo svim zemljama u kojima se koristi latiničko pismo.

Možda je najbolji primer za implementaciju IDN-a domen Evropske unije, koji podržava sve jezike i alfabete, a sam domen najvišeg nivoa je u dve varijante – latiničnoj (.EU) i ćiriličkoj (.EЮ), dok je u planu i domen na grčkom alfabetu. Ova tri pisma koriste zvanično sve zemlje koje su u sastavu EU.

Kako ovo funkcioniše?

Kako DNS jeste sistem koji koristi samo i isključivo ASCII, postavlja se veoma logično pitanje – kako je ovo sa IDN-om uopšte moguće? Suština IDN-a je u tome da se nazivi domena na bilo kom drugom pismu kao takvi samo prikazuju korisniku i omogućeno je da ih on tako unosi u pregledač. U stvari, oni su i dalje napisani ASCII latinicom, jer se u pozadini oni konvertuju iz UNICODE-a u ASCII. Oblik naziva domena koji se dobije putem konverzije naziva se punycode. Ako želite da isprobate ovu konverziju, to možete uraditi ovde, a evo kako izgleda рнидс.срб u ovom kodu:

xn--d1aholi.xn--90a3ac

Ovaj kod je prihvatljiv DNS sistemu, koji može da ga prevede u tačnu IP adresu i da pronađe traženi server kako bi vam prikazao traženi sajt.

A uz to i (ne) radi?

Iako je ove godine 20. godišnjica prvog predloga pisanja naziva domena na maternjem pismu, uvođenje IDN-a nije završeno. Još uvek se otvaraju domeni najvišeg nivoa na pismima iz UNICODE-a, a i sam UNICODE raste i menja se sa promenama u nacionalnim pismima u svetu.

Nama poznat primer je uvođenje dva nova slova u oba crnogorska pisma (latinicu i ćirilicu), koja moraju da prođu ISO sertifikaciju kako bi ušla u UNICODE, što može da traje i više od 5 godina. ASCII, sa druge strane, od kada je ustanovljen, nije pretrpeo promene. Zato se u praksi dešavaju greške kako u softveru, tako i na samim serverima, kada je IDN u pitanju. Ove greške nisu toliko brojne, ali čine IDN jednim nezaokruženim proizvodom. Za potrebe otklanjanja grešaka zadužena je specijalna radna grupa UASG (Universal Acceptance Steering Group), koja po ovim pitanjima sarađuje sa svim bitnim akterima.

FacebookLinkedinEmail