Пишу, по большей части, про историю, свою жизнь и немного про программирование.

Смайлик

Недавно узнал, что в стенограмме одной из речей американского президента Авраама Линкольна, которую напечатали в 1862 году в газете The New York Times, в 2004 году нашли некий знак, очень сильно похожий на обычный смайлик — ;)

К сожалению, непонятно что могло значить это сочетание символов в те годы и значило ли вообще хоть что-то. Некоторые историки считают его результатом обычной ошибки наборщика текста.

Стенограмма речи Авраама Линкольна в газете The New York Times за 7 августа 1862 года

Вероятно правды мы никогда не узнаем, но велик соблазн считать это сочетание смайликом с привычным нам значением, кроме того он очень удачно является частью скобок вокруг фразы, описывающей реакцию слушателей речи — «смех и аплодисменты».

Тем более, если считать это ошибкой, то непонятно почему наборщик использовал круглые скобки (обычно для реакции используются квадратные) и с какой целью точка с запятой отделена пробелом — не слишком ли много косячил наборщик в этом месте?

Правда, у меня есть ещё одна версия.

Полагаю, что исследователи, обнаружившие смайлик, работали с цифровой копией газеты, кусочек скана которой и кочует из статьи в статью про «смайлик Линкольна» по всему интернету. Я не знаю марку сканера, которая использовалась для сканирования газеты, но знаю, что некоторые сканеры когда-то использовали формат графики, который заменяет одни похожие символы в тексте на другие.

Насколько я помню, баг устранили, но где-то в мире всё ещё должны быть документы, в которых такие замены остались. Что если эту газету сканировали сканером с такой особенностью и точка с запятой и круглые скобки здесь — последствия такой замены?

Наверное можно попробовать связаться с каким-нибудь архивом, где сохранилась эта газета и попросить её пересканировать, но у меня душа не лежит этим заниматься.

3 комментария
Владимир 2020

А какой смысл сканировать старые газеты с использованием распознавания текста? Мне кажется, что главное здесь сохранить внешний вид, шрифт и т. д. При распознавании текста может не найтись именно того шрифта, который использовался полтора столетия назад и тогда, если я правильно понимаю, подставляется современный, наиболее похожий, шрифт.

Евгений Степанищев 2020

Формат не совсем так работает, как я по ссылке описал. Он не на буквы/цифры опирается, а на паттерны, то есть находит похожие символы, не зная что это за символы.

Spiridonov 2020

NY Times считает что там двоеточие

THE PRESIDENT’S SPEECH.

FELLOW-CITIZENS: I believe there is no precedent for my appearing before you on this occasion, [applause] but it is also true that there is no precedent for you being, here yourselves, (applause and laughter:) and I offer, in justification of myself and

Евгений Степанищев 2020

Я не очень понимаю в чём разница. Пусть двоеточие, что это меняет?

Spiridonov 2020

Наверное можно попробовать связаться с каким-нибудь архивом, где сохранилась эта газета и попросить её пересканировать, но у меня душа не лежит этим заниматься.

50 баксов репринт оригинала :) Я думаю что ошибка наборщика столько не стоит :)

Евгений Степанищев 2020

А репринт откуда берётся?