Повратак у IDN

FacebookLinkedinEmail
21.06.2016.
Повратак у IDN
Извор: iana.org, freepik.com

Да ли сте пробали да користите називе интернет домена написане било којим другим писмом осим латинице?

Док смо последње деценије прошлог века сви уштимавали YUSCII на штампачима како би коначно „проштампали“ наша слова, крајем далеке 1996. године предложено је стварање IDN-ова. Имплементација је дошла 1998. године, када је, после много предложених стандарда, IETF усвојио интернационализацију назива домена у апликацијама (енгл. Internationalizing Domain Names in Applications – IDNA).

IETF (енгл. Internet Engineering Task Force) је тело задужено за све стандарде на интернету, између осталих и познати стандард IPv6.

Root Zone Database
Извор: iana.org

Шта заправо значи IDN?

Ова скраћеница означава интернационализоване називе домена (енгл. Internationalized Domain Names).

У пракси, IDN представља назив домена исписан било којим писмом које не подржава ASCII код (American Standard Code for Information Interchange), или поред њега подржава и друга слова. Писмо које користи ASCII је енглеска латиница, а код нас постоје и други занимљиви називи као „ћелава латиница“, али ћемо се ми задржати на стручном називу АSCII код.

Са друге стране, сва светска писма су сакупљена у једну велику табелу писама и стандардизована, а тај скуп свих светских писама се зове UNICODE (енгл. unique, unified, universal encoding). При писању IDN називадомена користи се UNICODE.

Уобичајено је да се IDN облик користи без www (енгл. World Wide Web), који упражњавамо код свих стандардних, то јест ASCII назива домена. Разлози за ово су очигледни – избегава се мешање енглеске латинице и осталих писама (међу којима је и наша ћирилица), а такође и промена тастатуре са латиничке на (у нашем случају) ћириличку приликом писања веб адреса. Пробајте и сами. Укуцајте следеће примере у адресну линију у свом прегледачу:

рнидс.срб – IDN

www.rnids.rs – ASCII назив домена

И први и други пример су написани у једном писму и, када се укуцају, воде вас на садржај сајта нашег Регистра. Веома често се овакав приступ користи да се корисници који су укуцали назив домена на ћирилици воде на сајт чији је садржај на ћирилици, а они који су укуцали назив домена на енглеској латиници воде на латиничку верзију сајта. Таква употреба је једна од најбољих за два назива домена на различитим писмима, који позивају садржај на писму на коме је и сам назив домена.

На ком си нивоу?

Међутим, није све увек овако једноставно. Вратићемо се на тренутак у 1998. годину када је усвојен IDNA и када су интернационализовани називи домена постали могући. Први домен који је усвојио IDNA стандард био је .COM. Усвајањем стандарда било је дозвољено да се користе писма која нису само по ASCII коду, па је назив домена могао да има облик:

www.пантелија.com

За овакве домене каже се да имају IDN на другом нивоу домена (енгл. Second Level Domain), то јест лево од .COM, пошто домен може да има више нивоа (три и више). Ово је данас веома распрострањена појава, због природе назива домена највишег нивоа.

Најчешће су земље за називе домена бирале већ постојеће међународне ознаке писане у ASCII коду, те није било потребе да се мења назив домена највишег нивоа, али су у свом писму имале слова другачија од енглеске латинице (дијакритици на пример), па је табела сета карактера која се користи за назив домена на другом нивоу проширена њиховим специфичним словима. Типичне примере за ово налазимо у Немачкој (.DE), где се на другом нивоу могу користити умлаути, а слично је и у Француској (.FR) где могу да се користе апострофи, у Шведској, и у готово свим земљама у којима се користи латиничко писмо.

Можда је најбољи пример за имплементацију IDN-a домен Европске уније, који подржава све језике и алфабете, а сам домен највишег нивоа је у две варијанте – латиничној (.EU) и ћириличкој (.ЕЮ), док је у плану и домен на грчком алфабету. Ова три писма користе званично све земље које су у саставу ЕУ.

Како ово функционише?

Како DNS јесте систем који користи само и искључиво ASCII, поставља се веома логично питање – како је ово са IDN-ом уопште могуће? Суштина IDN-а је у томе да се називи домена на било ком другом писму као такви само приказују кориснику и омогућено је да их он тако уноси у прегледач. У ствари, они су и даље написани ASCII латиницом, јер се у позадини они конвертују из UNICODE-а у ASCII. Облик назива домена који се добије путем конверзије назива се punycode. Ако желите да испробате ову конверзију, то можете урадити овде, а ево како изгледа рнидс.срб у овом коду:

xn--d1aholi.xn--90a3ac

Овај код је прихватљив DNS систему, који може да га преведе у тачну IP адресу и да пронађе тражени сервер како би вам приказао тражени сајт.

А уз то и (не) ради?

Иако је ове године 20. годишњица првог предлога писања назива домена на матерњем писму, увођење IDN-а није завршено. Још увек се отварају домени највишег нивоа на писмима из UNICODE-а, а и сам UNICODE расте и мења се са променама у националним писмима у свету.

Нама познат пример је увођење два нова слова у оба црногорска писма (латиницу и ћирилицу), која морају да прођу ISO сертификацију како би ушла у UNICODE, што може да траје и више од 5 година. ASCII, са друге стране, од када је установљен, није претрпео промене. Зато се у пракси дешавају грешке како у софтверу, тако и на самим серверима, када је IDN у питању. Ове грешке нису толико бројне, али чине IDN једним незаокруженим производом. За потребе отклањања грешака задужена је специјална радна група UASG (Universal Acceptance Steering Group), која по овим питањима сарађује са свим битним актерима.

FacebookLinkedinEmail