А это, значит, тоже была гипотеза? Я то думал - императив!
Скажем, нечто среднее. Я предполагал, что лучше регэксп, но теперь видно, что, во-первых, возможно, не всегда это будет быстрее выполняться (я сначала представил несколько лучший вид конечного автомата, но потом вспомнил), да и premature optimization.
Да, про такой именно скрипт и речь.
Вообще это нехорошая традиция, к слову. Такие скрипты всё время тратят время на создание некоторой среды (а то и полновесного процесса ОС), инициализацию и освобождение ресурсов назад, тогда как вечно работающий веб-сервер может делать лишь то, что нужно, запустившись когда-нибудь давно и перезапускаясь много реже частоты обращений к нему. У кучи языков есть такие реализации, и, как мне сказали только что, на PHP тоже можно так написать (подробностей не спрашивал).
Не соглашусь, тут как достаточно простого рассуждения. Ведь что такое регулярка? Удобные правила поиска подстроки в строке. Поэтому ну никак они не могут работать быстрее обычного поиска строки.
Так вон для обсуждаемого изначально Ахо—Корасик возможен поиск без перебора каждой из искомых строк сразу всех из них. Если только найти хороший эквивалентный ДКА, будет всё ровно так же. Просто его,
скорее всего, при компиляции искать не будут.