Это сайт — моя персональная записная книжка. Интересна мне, по большей части, история, своя жизнь и немного программирование.

Эге-ге-я

Для лиги ленивых: найдено 768 блогов, есть файл OPML.

Количество «Эгей», найденных различными поисковыми системами. Лидирует «Яндекс», отстаёт «Мейл»

Стало интересно прикинуть сколько существует блогов на движке «Эгея». Придумал два метода — один даёт стопроцентную точность, но низкий охват, у другого возможны ложноположительные срабатывания, но и охват выше.

Более надёжный способ не захватывает, например, мой блог. Статистика по этому способу видна на скриншоте — можно посмотреть относительную идексируемость блогов на «Эгее» различными поисковыми системами. Метод даёт список из 350 блогов и основан на поиске одной характерной строки на специальной странице, достижимой поисковыми системами.

Менее надёжный находит и мой блог тоже, и даёт 1068 ссылок. Если суммировать оба метода, то в совокупности получается 1288 записей, где бо́льшая часть — действительно блоги на «Эгее». Неидеальная точность проистекает из самого метода — я задаю строку поиска "Движок — Эгея" (стандартная строка, выводится стандартно на каждой странице), а это, очевидно, недостаточно уникальная строка.

Дальше список, полученный вторым методом, можно проредить скриптом — убрать все сайты, к которым не удаётся подсоединиться и те, которые не содержат стандартный «подвал» «Эгеи»:

while read url; do
    wget -T1 -t1 -q -O- "$url" |
    fgrep -q -m1 blogengine.ru &&
    echo "$url"
done < aegea-candidates.log

Если потом выкинуть варианты одного сайта через http и https, а так же с www и без, то останется 768 блогов.

Есть такое мнение, что блоги на «Эгее» ведут люди, в основном, неординарные, которых стоит читать. Для тех, кто в это верит, я собрал весь список в файл OPML, добавьте в свою любимую РСС-читалку.

9 комментариев
Максим Пономарёв 2020

Зачем вы это сделали, Евгений? Я добавил всех и теперь спать не буду, пока не разгребу.

Евгений Степанищев 2020

Сам не спал, читал-читал-читал, пока чуть за ноутом не уснул… )

Ilya Novikov 2020

Евгений, а как вы в Эгее делаете сноску на полях, вроде этой «Для лиги ленивых...»?

Евгений Степанищев 2020

В синтаксисе «Эгеи» есть возможность указать ЦСС-класс для блока (об этом можно подробнее на странице фич прочитать). Я создал в своей теме оформления класс «.remark» и помечаю им блок, который так надо вынести. Стиль легко увидеть в инспекторе любого современного браузера (Alt+Ctrl+I или Alt+Cmd+I).

Алексей 2020

Судя по тому, что мой блог в списки не попал, хоть и индексируется поисковиками, метод не всеобъемлющ. Возможно в моем случае дело в том что блог открывается в подразделе сайта /blog, а на корне домена висит статическая страница.
Спасибо за интересную идею, но скорее всего самая полная статистика у самого Бирмана, ведь он даже ведёт на своём сайте автособираемую ленту из постов блогов на эгее.

Евгений Степанищев 2020

Да, есть такой недостаток (про «/blog»), хотя это поправимо, но меня на это уже просто не хватило. Вряд ли лента автособираемая, так как Илья не знает сколько блогов на «Эгее» существует даже примерно.

Алексей 2020

Вот как лента у Биртмана собирается: https://ilyabirman.ru/meanwhile/all/kak-rabotayut-blogi/

Технически по умолчанию он видит уведомления о всех постах со всех публичных Эгей на свете в момент их публикации

Алексей 2020

Ах да, в Блоги сливаются посты с движков версии 2.7 и новее. Полной статистики нет и у Ильи, получается.

Евгений Степанищев 2020

Получается так. Но в принципе, если взять его список и соединить с моим, то получится полный.

Vlad 2020

Круть! Ещё бы этот список обновлялся как-то. То есть появился бы общий RSS со всеми-всеми блогами на Эгее типа официального, только без модерации. Или же официальный обновлялся бы регулярно...

Евгений Степанищев 2020

Можно попробовать с Ильёй договориться, чтобы его список вливать в этот.

Владимир 2020

Я создали в своей теме оформления класс «.remark» и помечаю им блок, который так надо вынести. Стиль легко увидеть в инспекторе любого современного браузера (Alt+Ctrl+I или Alt+Cmd+I).

Обычный текст я зацеэсесил нормально, но с картинками проблема. Они автоматом обёртываются в дивы и не реагируют на добавление своего класса (в Вашем случае .remark). Но, например, в статье про лавровый лист у Вас таки добавлена картинка в этот блок.
Каким образом?

Евгений Степанищев 2020

Обычным тегом. То есть я там написал голый ХТМЛ.

Владимир 2020

В смысле тегом img со ссылкой на файл?

Евгений Степанищев 2020

Да.

Владимир 2020

Я так и подумал. Надо будет помозговать, как автоматом это сделать. Но, что-то мне подсказывает, что на уровне собственной темы не получится.

Евгений Степанищев 2020

Это уровень парсера разметки, а он слабо расширяется. Если наворачивать что-то поверх, то в случае, если в парсере будут изменения, это «поверх» может сломаться.