Все для программиста!

Ваш аккаунт

Войти через:

Забыли пароль?
Регистрация

Информацию о новых материалах можно получать и без регистрации:

ВКонтакте

Последние темы форума

Музыка — 2019-04-26 23:59:43 (1)
Общалка :) / Кристина Ивлеева
Как внести числа в сгенерированный массив чисел СЛУЧМЕЖДУ — 2019-04-25 11:15:30 (0)
Visual Basic / wanx
рабочее зеркало гидры — 2019-04-22 13:27:49 (1)
Операционные системы / Tony_Montana
гидра анонимный — 2019-04-21 15:37:08 (0)
Низкоуровневое программирование / Tony_Montana
гидра браузер — 2019-04-21 11:49:42 (0)
Компьютерная безопасность / Tony_Montana
Закрытие главной формы из другой. — 2019-04-19 09:08:27 (1)
Borland C++ Builder / Lazy_Man
гидра оф сайт — 2019-04-18 13:15:50 (0)
Студентам / Tony_Montana
Информация про криптовалюту. — 2019-04-18 04:38:31 (6)
Общалка :) / PotapShavanov
ссылка на гидру зеркало — 2019-04-17 11:53:53 (0)
Базы данных / Tony_Montana
гидра сайт доверенных — 2019-04-16 13:58:20 (0)
Фриланс / Tony_Montana
Delphi Trichview замена текста — 2019-04-16 13:02:35 (0)
Delphi & Kylix / ale-sumkin
Реально ли заработать на ставках? — 2019-04-16 07:34:02 (5)
Общалка :) / Polernik

Показать новые сообщения »

Почтовая рассылка

Алгоритм поиска по сайту

304

29 мая 2009 года

707 / / 26.01.2005

Добрый,
написал поиск по сайту, алгоритм БД следующий

tb_links
id || link

tb_word
id || word

tb_search
id_link || id_word || weight

соответственно в tb_link урлы страниц, в tb_word - слова, ну и tb_search tb_search - результирующая таблица урол, слово, вес по данному урлу

Но сталкнулся с проблемой что при 100 000 проиндексированных страниц в таблице tb_search порядка 15 млн записей и БД соответственно загибается, индексы расставлены, поиск ведется по ним, а запрос все равно тупит из-за агрегаток, но от них уйти при данной структуре не получается, т.к. в tb_search не уникальные id_link & id_word & weight
Скул запросы оптимизированны - могу выложить
Собсно вопрос, кто реализовывал поиск и какую логику использовал для построения БД

ЗЫ все написанно на Postgres, с btree индексами, триггерами и пользовательскими функциями

Подписаться на вопросНеобходима регистрация

По порядку

Сначала полезные

Сначала решения

2 ответа

12

29 мая 2009 года

3.0K / / 13.12.2005

А почему ты решил готовые решения не использовать?

Цитировать

304

29 мая 2009 года

707 / / 26.01.2005

Цитата: alekciy

А почему ты решил готовые решения не использовать?

Не интересно - раз
Скорость меньше - два

Цитировать

Реклама на сайте | Обмен ссылками | Ссылки | Экспорт (RSS) | Контакты
Добавить статью | Добавить исходник | Добавить хостинг-провайдера | Добавить сайт в каталог