Ћирилично емајлирање

Иако је код нелатиничних веб адреса ствар поприлично једноставна, код нелатиничних имејл адреса ствари су компликованије.

Имате назив домена који је написан на неком писму које није латиница. Како уз хостовање домена (због веб сајта) најчешће иду и имејл адресе у пакету, логично је да имате и комплетну имејл адресу на писму које није латиница. Да ли је тако?

Иако је код веб адреса ствар поприлично једноставна, код имејл адресе ствари које смо појашњавали у претходном тексту су компликованије. Слање имејлова користи сасвим један други сет протокола, али и друге сервере (такозване имејл сервере), па је било потребно да се изврши промена како би се IDN имејл послао.

IDNmail
Извор: pixabay.com и flickr.com

Јин и јанг

Најчешће се каже да имејл адреса има две стране, леву са корисничким именом и десну са називом домена, или два дела: локални и доменски. Та два дела (или две стране) су одвојена знаком @ (чита се „ет“, а неки га зову и "мајмунче"). На пример, адреса „pera@rnids.rs“ идентификује корисника по имену „pera“ на серверу „rnids.rs“. У ASCII облику све ради већ дужи низ година без проблема, али - да ли је могуће да се користе нелатинични карактери у имејл адреси?

За десну страну се назив сервера преузима из DNS система и заправо је назив домена, па је логично да та страна може да буде написана на неком другом писму осим латиничног. Као што смо видели у прошлом тексту, punycode је само ASCII презентација „нелатиничних“ карактера, тако да кроз интернет мрежу десна страна у ствари остаје у ASCII облику и нема никаквих проблема.

За леву страну је одувек важило да може да се користи само ASCII. Да би корисничко име било на било ком другом писму осим латиничног, било је неопходно да се промени стандард. Поред тога што мешање писама (лево ASCII латиница, а десно неко друго писмо) није баш по правопису, ствар је много компликованија од самог правописа и незгоднија за корисника. Замислите арапско писмо које се пише с десна улево – када бисте укуцавали овакву имејл адресу, ASCII корисничко име би било писано с лева удесно, док бисте назив домена писали с десна улево. Згодно? Није. Зашто онда не модификовати мало стандарде и омогућити људима пуну интернационализовану имејл адресу, са истим, не-ASCII писмом с обе стране знака @?

Нелогично је логично

Пратећи целу ову причу, лако се може (погрешно) закључити да се за корисничко име користи punycode. Приликом уноса и приказа користи се UNICODE, а кроз мрежу се и корисничко име преноси у ASCII формату, баш као и назив домена. И заиста, било је неколико покушаја да се ово изведе у пракси, најближи овоме је био THE BAT!, али није ствар дотерао до краја, јер није постојао стандард.

Институција надлежна за стандарде, IETF је усвојила сасвим друго решење. Према стандарду који је назван ЕАI (Email Address Internationalization) уведен је UNICODE за корисничко име. Истовремено, доменски део остаје у облику који регулишу стандарди за интернационализацију назива домена, тј. у punycode-у.

Прво се поставља питање – зашто тако?

Степеник који је био предвиђен за планирани прелазак са ASCII-ја на UNICODE у будућности, био је punycode. Иако ни ја лично нисам сагласан да се прескачу степеници у развоју Интернета, очигледна жеља аутора ових стандарда (RFC 6530RFC 6531RFC 6532 и RFC 6533) била је да се одмах пребацимо на UNICODE (UTF-8) и да се тиме приближимо будућем Интернету који уместо ASCII кода треба да користи пун UTF-8. Дакле, у системима који раде са EAI (познат и под другим именом IMA - Internationalized Mail Address) по први пут цели имејлови путују у UNICODE формату.

Мајсторска радионица

Пошто је у питању стандард који је донесен током 2013. године, а за његову пуну имплементацију потребне су опсежне преправке на разноразним нивоима, јер није компатибилан са постојећим ASCII Интернетом, још увек имамо овакве имејлове само у траговима. Наиме, да би се ово користило, потребно је да се ажурирају сви имејл клијенти (Outlook, Thunderbird…) али и софтвери на имејл серверима. Све ове промене иду веома споро, а многи развојни тимови још увек и не разматрају овај стандард. Најдаље се у његовој имплементацији стигло у Кини, где постоји око милион корисника који користе сервисе који енкодују UTF-8 у ASCII (чине слично што и punycode), чинећи ове имејлове компатибилним са остатком Интернета.

Такође, и без ЕАI имејлова, са обичним имејловима који користе нелатиничне карактере само у десном, доменском делу, већ постоје нагомилани проблеми. На пример, пробајте да, користећи такав имејл, резервишете хотелску собу или авио карту, отворите налог на неком сервису, или извршите онлајн куповину – у већини случајева нећете успети, иако развојни тимови сваког дана унапређују своје сервисе и сређују ове проблеме. Наравно, Интернет већ деценијама ради на енглеском алфабету, потребно је време да се и он навикне на UNICODE.