Это сайт — моя персональная записная книжка. Интересна мне, по большей части, история, своя жизнь и немного программирование.

почемужеонинеговорятпорусски

RFC 3492 «Punycode: A Bootstring encoding of Unicode for Internationalized Domain Names in Applications (IDNA)» описывает punycode, это такой способ кодирования национальных доменов, вроде «президент.рф» или «http://مركز-التسجيل.السعودية». На самом деле браузер идёт по кодированному адресу, который выглядит например так: «xn-​-d1abbgf6aiiy.xn-​-p1ai».

Так вот, в этом RFC есть примеры кодирования фраз на разных языках в punycode, есть и русский:

(I) Russian (Cyrillic):
       U+043F u+043E u+0447 u+0435 u+043C u+0443 u+0436 u+0435 u+043E
       u+043D u+0438 u+043D u+0435 u+0433 u+043E u+0432 u+043E u+0440
       u+044F u+0442 u+043F u+043E u+0440 u+0443 u+0441 u+0441 u+043A
       u+0438
       Punycode: b1abfaaepdrnnbgefbaDotcwatmq2g4l

А вот что там написано:

bolk-osx:~ bolk$ python -c 'print "xn--b1abfaaepdrnnbgefbaDotcwatmq2g4l".decode("idna")'
почемужеонинеговорятпорусски
20 комментариев
hshhhhh.name 2011

смешно :)

viy (v-i-y.livejournal.com) 2011

зачетно!

Максим Зотов (maxim-zotov.livejournal.com) 2011

По-испански: ¿Por qué no pueden simplemente hablar en Español?
google-переводчик: Почему они не могут просто говорить на испанском языке?

По-японски: なぜみんな日本語を話してくれないのか
google-переводчик: Или почему все делает и не говорит по-японски

Евгений Степанищев (bolknote.ru) 2011

Комментарий для maxim-zotov.livejournal.com:

Да, я подозревал, что там примерно одинаковые фразы :) Но всё равно же забавно.

Максим Зотов (maxim-zotov.livejournal.com) 2011

Хех, тоже не увидел сначала, а там всё чёрным по белому написано :)

The first several examples are all translations of the sentence «Why can’t they just speak in
<language>?» (courtesy of Michael Kaplan’s «provincial» page http://www.trigeminal.com/samples/provincial.html%29

Иронизируют над американцами, которые считают, что все должны говорить по-английски.

Максим Зотов (maxim-zotov.livejournal.com) 2011

Комментарий для maxim-zotov.livejournal.com:

Ой, закрывающую скобку за часть адреса посчитало.

Евгений Степанищев (bolknote.ru) 2011

Комментарий для maxim-zotov.livejournal.com:

Ой, закрывающую скобку за часть адреса посчитало.

Ну а как иначе?

Максим Зотов (maxim-zotov.livejournal.com) 2011

Комментарий для Евгения Степанищева:

Знак препинания (запятую, точку, точку с запятой, двоеточие и так далее, но кроме слеша) в конце URL не считать за часть URL, хотя по стандарту они и могут быть частью URL. Да, есть конфликт двух стандартов, на русский язык и на URL.

Но так как здесь пишется обычный текст, а не html-файл, то у правил обычного текста приоритет. Ставить лишний пробел после адреса — некрасиво и по-русски неправильно: «(смотрите страницу adress.html )»

Достаточно трудно самому догадаться, что адрес нужно обязательно брать в какие-нибудь кавычки или обязательно квадратные или угловые скобки, но ни в коем случае не круглые.

Это ни в коем случае не претензия, и даже не просьба усложнять парсер замороченными условиями, я не хочу сказать, что так, как сейчас сделано — неправильно, а так, как я написал — правильно, это просто заметка на полях :) Писал-писал интуитивно текст, а он вдруг распарсился неожидаемым для меня образом.

Евгений Степанищев (bolknote.ru) 2011

Комментарий для maxim-zotov.livejournal.com:

Знак препинания (запятую, точку, точку с запятой, двоеточие и так далее, но кроме слеша) в конце URL не считать за часть URL, хотя по стандарту они и могут быть частью URL. Да, есть конфликт двух стандартов, на русский язык и на URL.

В том-то и дело, что конфликт. Но запятую и точку (и точку с запятой) можно и отрубать, наверное. Я подумаю.

Ставить лишний пробел после адреса — некрасиво и по-русски неправильно: «(смотрите страницу adress.html )»

Скобку всё равно отрубать нельзя. Она часто встречается в адресах. Пример: http://ru.wikipedia.org/wiki/%D0%9A%D0%BE%D0%BD%D1%81%D1%82%D0%B0%D0%BD%D1%82%D0%B8%D0%BD_%28%D1%84%D0%B8%D0%BB%D1%8C%D0%BC%29

Достаточно трудно самому догадаться, что адрес нужно обязательно брать в какие-нибудь кавычки или обязательно квадратные или угловые скобки, но ни в коем случае не круглые.

Конечно трудно. Но этого делать не нужно, внизу ↓↓↓↓↓ есть «подсказка по написанию комментария». Её нужно прочитать.

Максим Зотов (maxim-zotov.livejournal.com) 2011

Комментарий для Евгения Степанищева:

Она часто встречается в адресах. Пример

О таком я не подумал. Тогда да, нельзя убирать скобку.

есть «подсказка по написанию комментария». Её нужно прочитать.

Не, ну кто ж читает подсказки?! :)
В крайнем случае, если что-то совсем не знаешь, как сделать, а о том, что думаешь, что знаешь, читать не пойдёшь. Инструкции читают только тогда, когда что-то не получается.

Максим Зотов (maxim-zotov.livejournal.com) 2011

Комментарий для maxim-zotov.livejournal.com:

На самом деле, я читал давно эту подсказку, видимо, когда она только появилась, но тонкости стерлись из памяти, только жирный шрифт и цитирование остались. Да и из нее ж не следует, что ссылку нужно обязательно брать в кавычки-скобки.

Евгений Степанищев (bolknote.ru) 2011

Комментарий для maxim-zotov.livejournal.com:

Да и из нее ж не следует, что ссылку нужно обязательно брать в кавычки-скобки.

Не следует, конечно. Я упрощённо писал.

Vladimir Moskva (fulc.ru) 2011

Комментарий для Евгения Степанищева:

Скобку можно обрубать, если в адресе есть единственная скобка, являющаяся закрывающей и стоящая на последнем месте.

Евгений Степанищев (bolknote.ru) 2011

Комментарий для fulc.ru:

Да, я всё ещё думаю на эту тему. Не нравится мне весь этот искусственный интеллект.

Максим Зотов (maxim-zotov.livejournal.com) 2011

Комментарий для Евгения Степанищева:

Вместо искусственного можно применить естественный: сделать редактирование комментариев :)

Человек увидит, что ссылка получилась кривая и что-нибудь поменяет, пробел поставит, в кавычки возьмёт.

Евгений Степанищев (bolknote.ru) 2011

Комментарий для maxim-zotov.livejournal.com:

Редактирование комментариев даёт возможность изменить комментарий (логично, да?), а пользователи, за это время, ответят на не отредактированный комментарий. Это даст троллям больше свободы.

Максим Зотов (maxim-zotov.livejournal.com) 2011

Комментарий для Евгения Степанищева:

Наложить дополнительные условия: нельзя редактировать спустя N минут или если есть новый комментарий.

Максим Зотов (maxim-zotov.livejournal.com) 2011

Комментарий для maxim-zotov.livejournal.com:

Хотя остается, конечно, race condition, когда отвечающий пишет ответ на неотредактированный комментарий, но не успевает отправить его до того, как первый участник отредактирует. И будет ответ на несуществующий уже текст.

Евгений Степанищев (bolknote.ru) 2011

Комментарий для maxim-zotov.livejournal.com:

Хотя остается, конечно, race condition, когда отвечающий пишет ответ на неотредактированный комментарий, но не успевает отправить его до того, как первый участник отредактирует. И будет ответ на несуществующий уже текст.

Когда пост только появляется или обсуждается горячая тема, такие ситуации нередки.

Евгений Степанищев (bolknote.ru) 2011

Комментарий для maxim-zotov.livejournal.com:

То есть я хочу сказать, что это не решение.