Это сайт — моя персональная записная книжка. Интересна мне, по большей части, история, своя жизнь и немного программирование.

Habr, WTF?

Хабр не устаёт меня удивлять всё снижающимся качеством статей и кода. Ну вот что это:

if(strpos($name, 'fetchRowBy') === 0) {
      array_unshift($arguments, substr($name, 10));
      return call_user_func_array(array($this, 'fetchRowBy'), $arguments);
    }

Ещё бы регулярное выражение использовал, ей-богу!

39 комментариев
Азат Разетдинов (razetdinov.ya.ru) 2008

substr($name, 0, 10)?

Артём Курапов (kurapov.name) 2008

сервак не отвечает, хм

Евгений Степанищев (bolknote.ru) 2008

Комментарий для razetdinov.ya.ru:

strpos($name, ’fetchRowBy’) === 0

Евгений Степанищев (bolknote.ru) 2008

Комментарий для kurapov.name:

Хабр?

jimidini (jimidini.ya.ru) 2008

Комментарий для Евгения Степанищева:

а что не так с strpos? это самая эффективная проверка
substr() менее эффективен из-за дополнительной аллокации памяти под строку

Евгений Степанищев (bolknote.ru) 2008

Комментарий для jimidini.ya.ru:

substr_compare

FX Poster (blog.fxposter.org) 2008

Код не мой, я просто разместил его. :)

На самом деле — этот кусок был взят <a href=» http://svn.symfony-project.com/plugins/sfPropelFinderPlugin/lib/sfPropelFinder.php%22%3E%D0%BE%D1%82%D1%81%D1%8E%D0%B4%D0%B0%3C/a%3E (ctrl-c/ctrl+v, бездумно практически :)), и это, по-моему единственное, что делал не я, а Женя тут придирается. :)

Да и вообще:

<pre><code class=«php«>strpos($name, ’fetchAllBy’) === 0)
substr($name, 0, 10) === ’fetchAllBy’</code></pre>

На небольших строках разницы не вижу, а методов длинной в 10k символов я не видел. :)

FX Poster (blog.fxposter.org) 2008

Жень, добавил бы сюда поддержку html, что ли :)

Евгений Степанищев (bolknote.ru) 2008

Комментарий для blog.fxposter.org:

Нафига тут HTML? :)

Евгений Степанищев (bolknote.ru) 2008

Комментарий для blog.fxposter.org:

Не видишь разницу? :) Представь, что у тебя 10k раз это вызвалось, теперь разница заметна? :) Всякую фиговину в вебе надо представлять внутри ещё одного внешнего цикла, который создают пользователи.

FX Poster (blog.fxposter.org) 2008

Комментарий для Евгения Степанищева:

Представь, что у тебя 10k раз это вызвалось, теперь разница заметна? :)

Надо проверить ;)

david-m.livejournal.com 2008

substr_compare

Люблю, блин, php. Можно на нём десять лет писать, и всё равно новая функция где-нибудь вылезет.

david-m.livejournal.com 2008

Так, специально для любителей экономии на спичках. Миллион (!) оборотов цикла:

$str = «fetchRowByName»;
$pref = «fetchRowBy»;
$preflen = strlen($pref);

(strpos($str, $pref) === 0) — 0.45 сек
(substr($str, 0, $preflen) == $pref) — 0.68 сек
(substr($str, 0, $preflen) === $pref) — 0.55 сек (! — хозяйке на заметку)
(substr_compare($str, $pref, 0, $preflen) == 0) — 0.84 сек

FX Poster (blog.fxposter.org) 2008

Комментарий для Евгения Степанищева:

Ну вот, уже проверили :)

Евгений Степанищев (bolknote.ru) 2008

Комментарий для david-m.livejournal.com:

Неправильный метод тестирования. Нужно проверять два случая, а не один.

Евгений Степанищев (bolknote.ru) 2008

Комментарий для blog.fxposter.org:

Неправильно проверили.

Евгений Степанищев (bolknote.ru) 2008

Комментарий для david-m.livejournal.com:

Из-за «экономии на спичках» AdMe.ru хорошо работает на довольно среднем железе (у меня на предыдущем месте работы десктоп был мощнее того сервера).

arty (arty.name) 2008

Комментарий для david-m.livejournal.com:

в тесте не учтен случай с длинными строками, не содержащими префикса ; )

Евгений Степанищев (bolknote.ru) 2008

Комментарий для david-m.livejournal.com:

Так мануалы надо читать :)

Евгений Степанищев (bolknote.ru) 2008

Комментарий для blog.fxposter.org:

http://ez.no/fr/content/download/134087/853115/version/2/file/ez2006_high_perfromance_php.pdf

Кстати.

Евгений Степанищев (bolknote.ru) 2008

Комментарий для david-m.livejournal.com:

Кроме всего прочего, надо всё это запустить несколько раз и подсчитать среднее.

david-m.livejournal.com 2008

$str = «Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat volutpat. Ut wisi enim ad minim veniam, quis nostrud exerci tation ullamcorper suscipit lobortis nisl ut aliquip ex ea commodo consequat. Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi.»;
$pref = «fetchRowBy»;

(strpos($str, $pref) === 0) — 0.67
(substr($str, 0, $preflen) === $pref) — 0.58
(substr_compare($str, $pref, 0, $preflen) == 0) — 0.82

Ещё что-нибудь?

Евгений Степанищев (bolknote.ru) 2008

Комментарий для david-m.livejournal.com:

Версия PHP?

Видимо, Ilia Alshanetsky должен обновить свой документ.

Артём Курапов (kurapov.name) 2008

Да, хабр видимо в дауне был. Или с ДНСом у меня что-то не так.

Я бы использовал substr, и логичней и как показывает последний тест — побыстрей. Но скорость в таких случаях очень мизерная, ими можно принебречь на мелких проектах..
Пойду добавлять в  http://kurapov.name/technology/web/php/php_speed/

Евгений Степанищев (bolknote.ru) 2008

Комментарий для kurapov.name:

Я мелкими проектами уже много лет не занимаюсь, так что со своей колокольни сужу. Ни и во framework’ах надо аккуратнее быть — неизвестно в каких проектах они будут использоваться.

FX Poster (blog.fxposter.org) 2008

Комментарий для Евгения Степанищева:

http://ez.no/fr/content/downlo%E2%80%A6romance_php.pdf

Objet non disponible
L’objet que vous avez demandé n’est plus disponible pour le moment.

Выложи где-нибудь?

FX Poster (blog.fxposter.org) 2008

Комментарий для david-m.livejournal.com:

$str = «Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat volutpat. Ut wisi enim ad minim veniam, quis nostrud exerci tation ullamcorper suscipit lobortis nisl ut aliquip ex ea commodo consequat. Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi.»;

Такого метода быть не может ;)

fim (fim.ya.ru) 2008

Комментарий для blog.fxposter.org:

Может быть оно?
http://ilia.ws/files/frankfurt_perf.ppt

Owner (companyowner.myopenid.com) 2008

Комментарий для david-m.livejournal.com:

Полностью согласен. Это кстати общая тенденция большинства «geek»’ов, которую приходиться отучать, чтобы другие члены команды не страдали. Понапишут развёртавыемые циклы и функции по 1000 строк с названием «mtzv» и гадай потом что да как. Одна из главных целей в любом продукте — это лёгкость в поддержке, если код понятен, легко расширяем, значит направление верно. Из моего опыта в 90% случаях ботлнеками являются совсем другие вещи, чем мусоличть доли секунд при обработке миллиона операций.

Конечно, это всё относительно и дополнительные поблажки могут быть добавлены для малых проектов (команда 2-3 человека), но когда команды 5 человек и более и разработка идёт по agile, то надо интегрироваться в команду а не являтся её тормозом и переписывать работающие куски из-за того, что он работает на 0.05сек медленее
при 1m операций. Любой мэнеджер убил бы за такое. :)

По поводу железа... благо нынче он достаточно дешовое и тот же quad-core с несколькими гигабайтами памяти можно купить за приемлимые деньги (а уж тем более для тех кто планирует заниматься рекламой).

Евгений Степанищев (bolknote.ru) 2008

Комментарий для blog.fxposter.org:

Это известный PDF Ilia Alshanetsky об оптимизации PHP, он его каждый год выпускает, в инете сотни копий.

Евгений Степанищев (bolknote.ru) 2008

Комментарий для companyowner.myopenid.com:

О покупке часто речь не идёт. Выделенные сервера довольно часто арендуются. Это даёт массу плюсов при выходе оборудования из строя (к примеру, на adme винты летят от нагрузки раз в полгода).

Аренда хорошего сервера — это совсем уже другие деньги. Иногда, существенные, особенно, если арендуется не один сервер.

У меня тоже очень большой опыт устранения bottle necks, причём вполне успешный. Последние несколько лет я непрерывно, иногда в реальном времени занимался нагруженными и быстрорастущими проектами.

Евгений Степанищев (bolknote.ru) 2008

Комментарий для companyowner.myopenid.com:

Вы кстати, сейчас применили троллевский приём: приписать оппоненту какое-то действие и осудить его. Не нужно так делать.

david-m.livejournal.com 2008

Виноват, отходил. Версия PHP 5.2.0 (cli) под win32. Вообще, проверье сами, это же несложно:

<?php
$str = «fetchRowByLorem»;
$pref = «fetchRowBy»;
$preflen = strlen($pref);

$t =- microtime(true);
for($i=0;$i<1000000;$i++) {
(strpos($str, $pref) === 0);
//(substr($str, 0, $preflen) === $pref);
//(substr_compare($str, $pref, 0, $preflen) === 0);
}
$t += microtime(true);
echo $t.«\n»;
?>

Вообще, по моему опыту «спичечной» оптимизации php-кода, тормоза возникают в основном в интерпретируемом коде. То есть, библиотечные функции сами по себе работают очень шустро, но лишнее присваивание или лишняя переменная (в PHP-коде) в цикле может сильно просадить скорость. И второй момент — библиотеки в PHP тоже написаны… довольно фиговенько. Даже если есть специальная функция под какую-то задачу, _обычно_ гораздо шустрее бывает использовать более простую функцию, реализующую какой-нибудь классический алгоритм. Как здесь — поиск в строке. Это старая функция, явно использующая какой-то стандартный сишный код, поэтому я бы априори ожидал, что она будет самая скоростная. Так оно, в общем, и оказалось. Substr сам по себе мог бы быть ещё шустрее, но тут наружу надо доставать результат и сравнивать его уже в PHP. Это замедляет.

Так что, по-моему, в исходном коде гораздо больший потенциал «спичечной» оптимизации содержится во второй и третьей строках. Но искать альтернативы и проверять лень:)

Что касается последнего теста — вспоминаем специфику задачи. Там _всегда_ будут короткие строки.

Евгений Степанищев (bolknote.ru) 2008

Комментарий для david-m.livejournal.com:

Да я уже проверил. Зачем в вашем коде «$t =- microtime(true)»?

У PHP достаточно много слабых мест, по этой теме есть масса документов. Например, циклы достаточно медленные. С PHP 5.3.0 многое должно измениться.

Кстати, сколько прогонов перед усреднением вы делали?

Owner (companyowner.myopenid.com) 2008

Комментарий для Евгения Степанищева:

Не совсем понятно причём тут «троллевский приём», ну да ладно... я просто высказывал свою точку зрения и делился своим опытом.

Евгений Степанищев (bolknote.ru) 2008

Комментарий для companyowner.myopenid.com:

Я же расписал какой именно приём применён.

david-m.livejournal.com 2008

Да я уже проверил. Зачем в вашем коде «$t =- microtime(true)»?

В смысле, зачем? Чтобы float получить.

Кстати, сколько прогонов перед усреднением вы делали?

Прогонял раз по несколько. Это на домашней машине, она ничем другим не занималась, так что результат был стабильным ± единички во втором знаке.

5.3 — да, скорей бы уж.

Евгений Степанищев (bolknote.ru) 2008

Комментарий для david-m.livejournal.com:

«-=» зачем.

david-m.livejournal.com 2008

Комментарий для Евгения Степанищева:

$t =- microtime(true);

$t += microtime(true);

Для красоты внешнего вида, исключительно:)