> Ошибаешься по всем пунктам...много поисковых систем-то видел вживую?
> По таким базам строят поисковые индексы
по каким "таким"? По "базе" копий всего интернета - никаких индексов обычно не строят. Она предназначена для кнопки "посмотреть сохраненную копию", и для внутренних проверок/ловли блох, а больше ни для чего. Потому что всегда есть оригинал, а если он изменился - то и тем более надо его использовать. Кнопку эту нажимают исключительно редко, обращений к этим архивам около нуля.
Даже clue snippets добываются, вероятнее всего, не оттуда, слишком долго и нудно, а лежат где-то отдельно, поближе к поисковому индексу.
> Для работы с СУБД всё равно нужен какой-то язык и SQL в качестве одного из ~ вполне
> подходит.
язык в котором нет нечеткого поиска - не считая специфических расширений - нафига он там нужен?
> Это в принципе ни к чему не обязывает,
не обязывает, но в тараканьей системе никакого другого языка нет. Что говорит нам о том, что байда использует ее где-то, где есть банальные табличные формы и удобны обычные sql-запросы. А судя по прослойкам совместимости - можно предположить, что для чего бы ее не использовали, но раньше ЭТО хранилось в postgres ;-) Это уж точно не поисковая база.
> Если бы было можно взять СУБД и сделать на основе FTS поиск по вебу
оно в первом приближении примерно так и сделано. Сюрпрайз, ага. (хотя скорее современные fts сделаны по мотивам, с опозданием на десять лет, а не наоборот)
Правда то что тебе, видимо, представляется при слове "субд", немножко непохоже на то, что там навернуто у тех, о ком кое-что мне известно. Но безусловно, это хоть и странная, но все ж таки база данных, и у нее есть management system.
Поверх этого есть алгоритмы ранжирования и фильтрации, но они именно поверх.
дохренища поисковиков мы не поимели (собственно, поимели, в далекие годы доткомов, только долго они не жили) потому что эта хреновина адово дорогая, и прокормить ее на свои деньги невозможно, а на деньги спекулянтов - сложно (потому что первое, о чем тебя спросят - а зачем давать деньги твоему ненадежному стартапу, когда можно просто прикупить акций гугля).
Ничего волшебного в поисковых системах нет. Поиск Рамблера написал один человек, без денег и ресурсов, злоупотребляя рабочим временем, просто потому что ему было интересно (потом уволился, и написал с нуля уже полноценно-морфологический, снова один. Потом, правда, умер.)