Алгоритм поиска по сайту
написал поиск по сайту, алгоритм БД следующий
tb_links
id || link
tb_word
id || word
tb_search
id_link || id_word || weight
соответственно в tb_link урлы страниц, в tb_word - слова, ну и tb_search tb_search - результирующая таблица урол, слово, вес по данному урлу
Но сталкнулся с проблемой что при 100 000 проиндексированных страниц в таблице tb_search порядка 15 млн записей и БД соответственно загибается, индексы расставлены, поиск ведется по ним, а запрос все равно тупит из-за агрегаток, но от них уйти при данной структуре не получается, т.к. в tb_search не уникальные id_link & id_word & weight
Скул запросы оптимизированны - могу выложить
Собсно вопрос, кто реализовывал поиск и какую логику использовал для построения БД
ЗЫ все написанно на Postgres, с btree индексами, триггерами и пользовательскими функциями
А почему ты решил готовые решения не использовать?
Цитата: alekciy
А почему ты решил готовые решения не использовать?
Не интересно - раз
Скорость меньше - два