почемужеонинеговорятпорусски

RFC 3492 «Punycode: A Bootstring encoding of Unicode for Internationalized Domain Names in Applications (IDNA)» описывает punycode, это такой способ кодирования национальных доменов, вроде «президент.рф» или «http://مركز-التسجيل.السعودية». На самом деле браузер идёт по кодированному адресу, который выглядит например так: «xn--d1abbgf6aiiy.xn--p1ai».

Так вот, в этом RFC есть примеры кодирования фраз на разных языках в punycode, есть и русский:
   (I) Russian (Cyrillic):
       U+043F u+043E u+0447 u+0435 u+043C u+0443 u+0436 u+0435 u+043E
       u+043D u+0438 u+043D u+0435 u+0433 u+043E u+0432 u+043E u+0440
       u+044F u+0442 u+043F u+043E u+0440 u+0443 u+0441 u+0441 u+043A
       u+0438
       Punycode: b1abfaaepdrnnbgefbaDotcwatmq2g4l
А вот что там написано:
bolk-osx:~ bolk$ python -c 'print "xn--b1abfaaepdrnnbgefbaDotcwatmq2g4l".decode("idna")'
почемужеонинеговорятпорусски
21 июня 2011 10:53

hshhhhh.name (hshhhhh.name)
21 июня 2011, 13:18

смешно :)

viy (v-i-y.livejournal.com)
21 июня 2011, 14:35

зачетно!

Максим Зотов (maxim-zotov.livejournal.com)
21 июня 2011, 16:40

По-испански: ¿Por qué no pueden simplemente hablar en Español?
google-переводчик: Почему они не могут просто говорить на испанском языке?

По-японски: なぜみんな日本語を話してくれないのか
google-переводчик: Или почему все делает и не говорит по-японски

bolk (bolknote.ru)
21 июня 2011, 16:42, ответ предназначен Максим Зотов (maxim-zotov.livejournal.com):

Да, я подозревал, что там примерно одинаковые фразы :) Но всё равно же забавно.

Максим Зотов (maxim-zotov.livejournal.com)
21 июня 2011, 16:52

Хех, тоже не увидел сначала, а там всё чёрным по белому написано :)
The first several examples are all translations of the sentence "Why can't they just speak in
<language>?" (courtesy of Michael Kaplan's "provincial" page http://www.trigeminal.com/samples/provincial.html)
Иронизируют над американцами, которые считают, что все должны говорить по-английски.

Максим Зотов (maxim-zotov.livejournal.com)
21 июня 2011, 16:53

Ой, закрывающую скобку за часть адреса посчитало.

bolk (bolknote.ru)
21 июня 2011, 17:15, ответ предназначен Максим Зотов (maxim-zotov.livejournal.com):

Ой, закрывающую скобку за часть адреса посчитало.
Ну а как иначе?

Максим Зотов (maxim-zotov.livejournal.com)
21 июня 2011, 20:41, ответ предназначен bolk (bolknote.ru):

Знак препинания (запятую, точку, точку с запятой, двоеточие и так далее, но кроме слеша) в *конце* URL не считать за часть URL, хотя по стандарту они и могут быть частью URL. Да, есть конфликт двух стандартов, на русский язык и на URL.

Но так как здесь пишется обычный текст, а не html-файл, то у правил обычного текста приоритет. Ставить лишний пробел после адреса - некрасиво и по-русски неправильно: "(смотрите страницу adress.html )"

Достаточно трудно самому догадаться, что адрес нужно обязательно брать в какие-нибудь кавычки или обязательно квадратные или угловые скобки, но ни в коем случае не круглые.

Это ни в коем случае не претензия, и даже не просьба усложнять парсер замороченными условиями, я не хочу сказать, что так, как сейчас сделано - неправильно, а так, как я написал - правильно, это просто заметка на полях :) Писал-писал интуитивно текст, а он вдруг распарсился неожидаемым для меня образом.

bolk (bolknote.ru)
21 июня 2011, 20:46, ответ предназначен Максим Зотов (maxim-zotov.livejournal.com):

Знак препинания (запятую, точку, точку с запятой, двоеточие и так далее, но кроме слеша) в конце URL не считать за часть URL, хотя по стандарту они и могут быть частью URL. Да, есть конфликт двух стандартов, на русский язык и на URL.
В том-то и дело, что конфликт. Но запятую и точку (и точку с запятой) можно и отрубать, наверное. Я подумаю.
Ставить лишний пробел после адреса — некрасиво и по-русски неправильно: "(смотрите страницу adress.html )"
Скобку всё равно отрубать нельзя. Она часто встречается в адресах. Пример: http://ru.wikipedia.org/wiki/Константин_(фильм)
Достаточно трудно самому догадаться, что адрес нужно обязательно брать в какие-нибудь кавычки или обязательно квадратные или угловые скобки, но ни в коем случае не круглые.
Конечно трудно. Но этого делать не нужно, внизу ↓↓↓↓↓ есть «подсказка по написанию комментария». Её нужно прочитать.

Максим Зотов (maxim-zotov.livejournal.com)
21 июня 2011, 21:07, ответ предназначен bolk (bolknote.ru):

Она часто встречается в адресах. Пример
О таком я не подумал. Тогда да, нельзя убирать скобку.
есть «подсказка по написанию комментария». Её нужно прочитать.
Не, ну кто ж читает подсказки?! :)
В крайнем случае, если что-то совсем не знаешь, как сделать, а о том, что *думаешь*, что знаешь, читать не пойдёшь. Инструкции читают только тогда, когда что-то не получается.

Максим Зотов (maxim-zotov.livejournal.com)
21 июня 2011, 21:14

На самом деле, я читал давно эту подсказку, видимо, когда она только появилась, но тонкости стерлись из памяти, только жирный шрифт и цитирование остались. Да и из нее ж не следует, что ссылку нужно обязательно брать в кавычки-скобки.

bolk (bolknote.ru)
21 июня 2011, 21:58, ответ предназначен Максим Зотов (maxim-zotov.livejournal.com):

Да и из нее ж не следует, что ссылку нужно обязательно брать в кавычки-скобки.
Не следует, конечно. Я упрощённо писал.

Vladimir Moskva (fulc.ru)
22 июня 2011, 13:57, ответ предназначен bolk (bolknote.ru):

Скобку можно обрубать, если в адресе есть единственная скобка, являющаяся закрывающей и стоящая на последнем месте.

bolk (bolknote.ru)
22 июня 2011, 14:35, ответ предназначен Vladimir Moskva (fulc.ru):

Да, я всё ещё думаю на эту тему. Не нравится мне весь этот искусственный интеллект.

Максим Зотов (maxim-zotov.livejournal.com)
22 июня 2011, 16:55, ответ предназначен bolk (bolknote.ru):

Вместо искусственного можно применить естественный: сделать редактирование комментариев :)

Человек увидит, что ссылка получилась кривая и что-нибудь поменяет, пробел поставит, в кавычки возьмёт.

bolk (bolknote.ru)
22 июня 2011, 16:59, ответ предназначен Максим Зотов (maxim-zotov.livejournal.com):

Редактирование комментариев даёт возможность изменить комментарий (логично, да?), а пользователи, за это время, ответят на не отредактированный комментарий. Это даст троллям больше свободы.

Максим Зотов (maxim-zotov.livejournal.com)
22 июня 2011, 17:03, ответ предназначен bolk (bolknote.ru):

Наложить дополнительные условия: нельзя редактировать спустя N минут или если есть новый комментарий.

Максим Зотов (maxim-zotov.livejournal.com)
22 июня 2011, 17:10

Хотя остается, конечно, race condition, когда отвечающий пишет ответ на неотредактированный комментарий, но не успевает отправить его до того, как первый участник отредактирует. И будет ответ на несуществующий уже текст.

bolk (bolknote.ru)
22 июня 2011, 18:59, ответ предназначен Максим Зотов (maxim-zotov.livejournal.com):

Хотя остается, конечно, race condition, когда отвечающий пишет ответ на неотредактированный комментарий, но не успевает отправить его до того, как первый участник отредактирует. И будет ответ на несуществующий уже текст.
Когда пост только появляется или обсуждается горячая тема, такие ситуации нередки.

bolk (bolknote.ru)
22 июня 2011, 18:59, ответ предназначен Максим Зотов (maxim-zotov.livejournal.com):

То есть я хочу сказать, что это не решение.

Ваше имя или адрес блога (можно OpenID):

Текст вашего комментария, не HTML:

Кому бы вы хотели ответить (или кликните на его аватару)