почемужеонинеговорятпорусски
RFC 3492 «Punycode: A Bootstring encoding of Unicode for Internationalized Domain Names in Applications (IDNA)» описывает punycode, это такой способ кодирования национальных доменов, вроде «президент.рф» или «http://مركز-التسجيل.السعودية». На самом деле браузер идёт по кодированному адресу, который выглядит например так: «xn--d1abbgf6aiiy.xn--p1ai».
Так вот, в этом RFC есть примеры кодирования фраз на разных языках в punycode, есть и русский:
(I) Russian (Cyrillic):
U+043F u+043E u+0447 u+0435 u+043C u+0443 u+0436 u+0435 u+043E
u+043D u+0438 u+043D u+0435 u+0433 u+043E u+0432 u+043E u+0440
u+044F u+0442 u+043F u+043E u+0440 u+0443 u+0441 u+0441 u+043A
u+0438
Punycode: b1abfaaepdrnnbgefbaDotcwatmq2g4l
А вот что там написано:
bolk-osx:~ bolk$ python -c 'print "xn--b1abfaaepdrnnbgefbaDotcwatmq2g4l".decode("idna")'
почемужеонинеговорятпорусски
смешно :)
зачетно!
По-испански: ¿Por qué no pueden simplemente hablar en Español?
google-переводчик: Почему они не могут просто говорить на испанском языке?
По-японски: なぜみんな日本語を話してくれないのか
google-переводчик: Или почему все делает и не говорит по-японски
Комментарий для maxim-zotov.livejournal.com:
Да, я подозревал, что там примерно одинаковые фразы :) Но всё равно же забавно.
Хех, тоже не увидел сначала, а там всё чёрным по белому написано :)
Иронизируют над американцами, которые считают, что все должны говорить по-английски.
Комментарий для maxim-zotov.livejournal.com:
Ой, закрывающую скобку за часть адреса посчитало.
Комментарий для maxim-zotov.livejournal.com:
Ну а как иначе?
Комментарий для Евгения Степанищева:
Знак препинания (запятую, точку, точку с запятой, двоеточие и так далее, но кроме слеша) в конце URL не считать за часть URL, хотя по стандарту они и могут быть частью URL. Да, есть конфликт двух стандартов, на русский язык и на URL.
Но так как здесь пишется обычный текст, а не html-файл, то у правил обычного текста приоритет. Ставить лишний пробел после адреса — некрасиво и по-русски неправильно: «(смотрите страницу adress.html )»
Достаточно трудно самому догадаться, что адрес нужно обязательно брать в какие-нибудь кавычки или обязательно квадратные или угловые скобки, но ни в коем случае не круглые.
Это ни в коем случае не претензия, и даже не просьба усложнять парсер замороченными условиями, я не хочу сказать, что так, как сейчас сделано — неправильно, а так, как я написал — правильно, это просто заметка на полях :) Писал-писал интуитивно текст, а он вдруг распарсился неожидаемым для меня образом.
Комментарий для maxim-zotov.livejournal.com:
В том-то и дело, что конфликт. Но запятую и точку (и точку с запятой) можно и отрубать, наверное. Я подумаю.
Скобку всё равно отрубать нельзя. Она часто встречается в адресах. Пример: http://ru.wikipedia.org/wiki/%D0%9A%D0%BE%D0%BD%D1%81%D1%82%D0%B0%D0%BD%D1%82%D0%B8%D0%BD_%28%D1%84%D0%B8%D0%BB%D1%8C%D0%BC%29
Конечно трудно. Но этого делать не нужно, внизу ↓↓↓↓↓ есть «подсказка по написанию комментария». Её нужно прочитать.
Комментарий для Евгения Степанищева:
О таком я не подумал. Тогда да, нельзя убирать скобку.
Не, ну кто ж читает подсказки?! :)
В крайнем случае, если что-то совсем не знаешь, как сделать, а о том, что думаешь, что знаешь, читать не пойдёшь. Инструкции читают только тогда, когда что-то не получается.
Комментарий для maxim-zotov.livejournal.com:
На самом деле, я читал давно эту подсказку, видимо, когда она только появилась, но тонкости стерлись из памяти, только жирный шрифт и цитирование остались. Да и из нее ж не следует, что ссылку нужно обязательно брать в кавычки-скобки.
Комментарий для maxim-zotov.livejournal.com:
Не следует, конечно. Я упрощённо писал.
Комментарий для Евгения Степанищева:
Скобку можно обрубать, если в адресе есть единственная скобка, являющаяся закрывающей и стоящая на последнем месте.
Комментарий для fulc.ru:
Да, я всё ещё думаю на эту тему. Не нравится мне весь этот искусственный интеллект.
Комментарий для Евгения Степанищева:
Вместо искусственного можно применить естественный: сделать редактирование комментариев :)
Человек увидит, что ссылка получилась кривая и что-нибудь поменяет, пробел поставит, в кавычки возьмёт.
Комментарий для maxim-zotov.livejournal.com:
Редактирование комментариев даёт возможность изменить комментарий (логично, да?), а пользователи, за это время, ответят на не отредактированный комментарий. Это даст троллям больше свободы.
Комментарий для Евгения Степанищева:
Наложить дополнительные условия: нельзя редактировать спустя N минут или если есть новый комментарий.
Комментарий для maxim-zotov.livejournal.com:
Хотя остается, конечно, race condition, когда отвечающий пишет ответ на неотредактированный комментарий, но не успевает отправить его до того, как первый участник отредактирует. И будет ответ на несуществующий уже текст.
Комментарий для maxim-zotov.livejournal.com:
Когда пост только появляется или обсуждается горячая тема, такие ситуации нередки.
Комментарий для maxim-zotov.livejournal.com:
То есть я хочу сказать, что это не решение.