Случайно наткнулся на статью про реализацию поиска в Google Code.

Автор Рас Кокс рассказывает как реализовать поиск по регулярным выражениям. Поднимаются вопросы безопасных регулярных выражений, как правильно готовить для продакшен систем, чтобы их нельзя было задедосить. Приводится пример построения инвертированного индекса и дается краткая историческая справка по этому методу. В конце даются инструменты командной строки для построения и поиска по индексу на локальной машине.