Этот сайт — моя персональная записная книжка. Интересны мне, по большей части, программирование, история и события из моей жизни.

Автостереограмма и роботы

На этой картинке я вижу четыре приподнятых участка

Давно хотел проверить идею нельзя ли защищаться от роботов, кодируя капчу в автостереограмму. Для людей она тоже не очень удобна, — даже умеющие их смотреть, не имеют навыка делать это быстро. Но если бы автостереограммы были последним бастионом, думаю, все научились бы за какое-то время.

Я сделал несколько автостереограмм с рисунками, надписями и абстрактными фигурами и попробовал спросить у ЧатГПТ 5.2 что там нарисовано «в глубине». Ожидаемо, кроме галлюцинаций ничего не получил.

Но потом оказалось, что если попросить нейросеть программно восстановить рисунок, она его успешно восстанавливает и не менее успешно разбирает. Казалось, затея сорвалась и мне даже было не жаль, — всё же разглядывать автостереограммы для некоторых людей мучительное занятие. Но потом я попробовал ещё одну идею.

Оказалось, что если карта глубины почти плоская и пятна на ней очень абстрактные (я использовал близко расположенные буквы), то я могу сосчитать сколько таких «пятен» я вижу на картинке, а ЧатГПТ считает, что «в глубине» ничего нет, пусто.

В общем, в этом что-то есть, вполне можно подобрать что-то такое, что роботы не смогут распознать.

5 комментариев
hsh 1 мес

напишите в гугл, они оценят эту идею для капчи!

Евгений Степанищев 1 мес

Гуглу зачем? У них есть возможность оценивать поведение пользователей на куче сайтов и обходиться одной галочкой.

xl 1 мес

Одноглазые люди скажут вам больше спасибо за такие идеи :)

Евгений Степанищев 1 мес

В комментариях в телеграмном канале уже сказали :-)

anton 1 мес

Можно ещё красно-зеленые и жёлто-зелёные капчи делать, чтобы дальтоники благодарны были.

Евгений Степанищев 1 мес

Но нейросети не дальтоники. Вообще у большинства капч есть альтернативные способы в виде звука, как правило.

hsh 1 мес

Гуглу зачем?

а им нравятся непроходимые капчи

Евгений Степанищев 1 мес

У них я что-то таких не припомню.

Владимир Новицкий 1 мес

Со временем ИИ научится распознавать всё. И любое изображение, и звук, и подбирать рифму, и т. д. Единственный более менее надежный способ — это двухфакторная аутентификация. И доступно любому человеку. Хоть одноглазому, хоть дальтонику.

Евгений Степанищев 1 мес

Понятное дело :-) Сейчас-то вообще можно просто попросить посчитать количество букв «r» в слове «strawberry» :-)