Это сайт — моя персональная записная книжка. Интересна мне, по большей части, история, своя жизнь и немного программирование.

Фильтры для спама

Все эти фильтры для спама на бесплатных веб-мылах — полная лажа. Я придумал ещё один способ бороться со спамом.

Предположим мы открываем новый веб-меил. Сразу резервирует у себя имена вида «vasya@sample.com», «dasha@sample.com», «evgeny@sample.com» и так далее. Спамеры первым делом перебирают мыло по словарю и лишь потом используют остальные, более трудоёмкие способы.

Через некоторое время на эти ящики начинает поступать письма. Поскольку ящики эти нигде не упоминались логично было бы преположить, что туда поступает спам. На эти спамовые письма можно натравить Bayes-фильтры или просто резать всю подобную почту.

32 комментария
mike 2004

a chto znachit «podobnuyu»?
kak ya ponimayu eto i est’ osnovnoj vopros fil’tracii…
Opyat’ taki, kakie shansy chto «prostoj adres» pereputayut prosto s kem nibud’?
A bazu po spam-mailam, dumayu, v luboj bol’shoj email-sisteme nabrat’ mojno mgnovenno i bez takh izvratov.
a esli lovit’ na jivca — skoree imeet smysl vzyat’ nechitaemyj adres (sot-1-ro-2-ku3@.. i zabrosit’ v spam bazu.. blago eto kak raz neslojno!

Евгений Степанищев (bolknote.ru) 2004

Комментарий для mike:

по порядку.
1) «подобный» — значит содержащийся в словаре.
2) шанс ничтожный. я провёл несколько таких экспериментов. спаммеры нашли мой ящик в mail.ru за три дня. все письма, которые туда идут — чистый спам.
3) забросить адрес в спам-базы не так просто как кажется. баз этих — великое множество и их «перемешиваение» очень низкое.

mike 2004

1) slovar’ — po opytu obhodyat slovarnye zashity legko.. ya napisanij nekoego lekarstva za poslednuu nedelu videl variantov 10, plus grafika i igry shriftami
2) esli imya prostoe.. to odna oshibka mojet chestnogo cheloveka v glazah sistemy sdelat’ spamerom.. odna iz osnovnyh prichin pochemu ser’eznaya peresylka cherez mail.ru nevozmojna — minimum 5% chestnyh pisem prihodyat kak «probable spam», a skok ne dohodyat?
3) esli dejstvovat’ namerenno… edinstveno eto budet ne mgnovennyj effekt. SORM ne dremlet, boty hodyat.. plus s osnovnogo yashika vzyat’ pis’ma i sdelat’ «unsubscribe»…

Евгений Степанищев (bolknote.ru) 2004

Комментарий для mike:

1) по-моему, вы невнимательно читаете. посмотрите в каком контексте я употребляю слово «словарь». я не затрагиваю словарные защиты.
2) я предложил идею. её легко довести до реализации. например, ошибку, о которой говорите вы легко свести к нулю, если не считать спамовыми те письма, которые пришли к не более, чем N абонентам.
3) да, «запуск» произойдёт медленне, ну и что? далее не понял.

РезиновыйЗапаЛ 2004

Болк — меня обижают спамеры. Я получаю спам на четыре ящике раз в три-четыре дня и не больше пяти писем совокупно. Че за хрень, не понял?

alexas 2004

То есть, ты хочешь собрать спам этими ящиками, чтобы потом натравить на этот сборник фильтр для самообучения?..

Евгений Степанищев (bolknote.ru) 2004

Комментарий для alexas:

да

mivlad 2004

А вот и не лажа. У меня вся почта через Яндекс проходит, получаю примерно одно «коммерческое предложение» в месяц. С другой стороны, вроде пока ничего не терялось.

Евгений Степанищев (bolknote.ru) 2004

Комментарий для mivlad:

У меня тоже есть ящик на Yandex. Спама через него проходит — жуть, правда сейчас поменьше стало, но 5—10 писем в день получаю.

G100m 2004

Идея не нова. Это называется «адреса-ловушки». Наиболее крупная сеть для анализа спама в реальном
времени организована компанией Brightmail www.brightmail.com.

Евгений Степанищев (bolknote.ru) 2004

Комментарий для G100m:

Отлично. Это отличное подтверждение тому, что идея работает. Интересно только почему российские службы её не используют.

G100m 2004

Цитата из  «Электронный журнал „Спамтест“ No. 35»:
Поддержание большого числа адресов-ловушек требует больших человеческих и административных ресурсов — это не должны быть «пустые» адреса, они должны активно функционировать — публиковаться на WWW-сайтах, форумах и конференциях, регистрироваться в онлайн-сервисах и прочим образом имитировать поведение обычного пользователя с точки зрения спамера. По всей видимости, данная технология применима только в условиях компании-разработчика антиспамерского ПО, либо в условиях крупного почтового сервиса. Создание подобной системы на базе только усилий волонтеров представляется маловероятным.

Евгений Степанищев (bolknote.ru) 2004

Комментарий для G100m:

Как показала практика (создание нескольких e-mail на mail.ru) ничего публиковать не надо. Спамеры очень быстро нашли первый ящик (3 дня) и чуть медленнее два остальных (неделя).

Ламер 2004

Bolk, а ты не пробовал заводить длинный нечитаемый адрес. За сколько его найдут? Пару лет назад, восьмисимвольную абракадабру обнаружили через пару недель.

А по поводу фильтрации у меня spampal + баесовский плугин к нему, пропускают где-то 1 письмо в неделю из 20—30 в день. Правда сначала пришлось прописать несколько белых адресов, а то договора резал :)

Евгений Степанищев (bolknote.ru) 2004

Комментарий для Ламер:

Неа, не пробовал. У меня вообще ощущение, что кто-то из mail.ru продаёт базу спаммерам. А по поводу плагина — удалять спам мне не трудно — я его определяю за какую-то ничтожную долю секунды, жалко за траффик платить.

motto 2004

А нефиг поп-ом пользоваться.
Что касается остального текста, то ты изобрел велосипед.
Что характерно, то велосипед этот уже не моден, а в части «кормления байеса», так и вовсе едет в другую сторону.

Евгений Степанищев (bolknote.ru) 2004

Комментарий для motto:

А с чего ты решил, что я POP3 пользуюсь?
Врядли я изобрёл именно велосипед — этот метод, как показывает практика, в России вообще никто не использует. Остальное комментировать не буду, потому что не вижу аргументации.

Ламер 2004

А что кроме pop есть? IMAP? Spampal его понимает.
А что касается модно/не модно, то, во первых, пока это работает, на моду мне плевать, а, во-вторых, кормлением байеса максимум можно получить что фильтр ответит — не знаю. После чего пойдет запрос в DNSBL.

G100m 2004

C mail.ru все дано известно. Это чекбокс в соглашении при регистрации (аля хочу получать письма от партнеров компании) и банальная продажа листов.

Ламер 2004

Ну на счет продажи листов не уверен. Думаю эта инфа сливается кем-то из сотрудников мимо собственно mail.ru

Паша 2004

Или еще проще:
запустили менты при помощи своего СОРМа сбор всех адресов, которые в проходящих письмах встречаются, и сидят, покуривают.
А потом за листы полноценных рабочих e-mail-ов нехилые денежки гребут!

Ламер 2004

Так они, в основном, только адреса тех кто уже есть в спам листах, плюс самих спамеров (т. е. левые) ну и еще сканирование спамерами серверов получат, не думаю что они это за дорого продадут ;)

mike 2004

A voobshe, tovarish Bolk, interesno poluchaetsya- na stranichke maily zakryty, a v rassylku kommentariev i mail idet i IP pisavshego.. Ili tak i planirovalos’?

Евгений Степанищев (bolknote.ru) 2004

Комментарий для mike:

Не знаю. Эту часть писал Дима Смирнов.

motto 2004

А с чего ты решил, что я POP3 пользуюсь?
-​-​
У меня тоже есть ящик на Yandex. Спама через него проходит — жуть, правда сейчас поменьше стало, но 5—10 писем в день получаю
Взял из этого, если, конечно у тебя не какой-то совсем уникальный спам. Ты кнопочку нажимаешь?

Врядли я изобрёл именно велосипед — этот метод, как показывает практика, в России вообще никто не использует. Остальное комментировать не буду, потому что не вижу аргументации.

  1. Используют, причем много кто. Точнее, почти все, хотя и не так, как предлагаешь ты.
  2. Аргументация: найди ответ на любой из двух вопросов:
    Чем занимается спаммерская машина, когда нет заказов?
    Что это за странный спам бывает, в котором сплошной мусор и купить нечего?
Евгений Степанищев (bolknote.ru) 2004

Комментарий для motto:

Какую кнопочку? Я Батом читаю. Кроме того, это один из пяти моих почтовых ящиков.

  1. «Много кто» — это название какой-то фирмы? :) Конретнее.
    2а. Я сам принимал участие в создании спам-машин. Может заниматься сбором открытых relays, proxy, адресов. Мало ли чем. Конкретнее. К чему вопрос.
    2б. Не видел такого спама. А.. ты наверное имеешь ввиду обход ящиков с рассылкой специальных писем, чтобы убедиться, что ящик работает? Ну и что? Причём здесь это? Это аргумент? К чему?
motto 2004

Болк, ты зачем разметку поломал?

  1. Ты определись, то ли «Я Батом читаю», то ли «А с чего ты решил, что я POP3 пользуюсь». Все это -​-​ к контексте почты яндекса, разумеется.
  2. Все три крупнейшие веб-почты в раше используют спамтрепы. Точно две, одна из трех с вероятностью больше половины.
  3. Понятно. Тебе везет и твой спам отстал от современной жизни. Радуйся :) Сейчас рассылается очень много мусора, именно для кормления спамтрепных байесов
Евгений Степанищев (bolknote.ru) 2004

Комментарий для motto:

  1. Если в контексте почты Yandex, то там я пользуюсь POP3. IMAP там нет, по-моему.
  2. Например? Ссылку на документ?
  3. Понял.
AL 2004

Можно эти адреса развесить по форумам, гостевым книгам, ну и т.д. Спама будет приходить ещё больше.

Евгений Степанищев (bolknote.ru) 2004

Комментарий для AL:

ага. но он может попасть в чью-то адресную книгу и честного человека посчитают спамером за попытку отправить письмо по этому ящику.

Сергей 2004

Во истину все знающий человек, и способ придумал лучший. И знает, как спаммеры создают спам листы, ура товарищи.

Евгений Степанищев (bolknote.ru) 2004

Комментарий для Сергей:

Я где-то написал, что «все знающий»? И что «способо придумал лучший»? Кстати, да, знаю как спаммеры создают спам листы. Занимался этим вопросом. Были заказы от спаммеров.