Определение критериев
Вопрос следующий
Может, он немного не в том разделе, но это только так кажется:)
Потмоу что разработка ведётся на Qt
Разрабатываем программу, аналог UpdateScanner'а в FireFox
Анализ сайта и выделение новых ссылок на html странице
Если пользователь часто посещает сайт, или долго сидит на нём - сайт добавляется в анализируемые
Получается, что на то, добавляется ли сайт в анализируемые, влияет 2 параметра
- Количество посещения сайта
- Длительность нахождения на сайте
Вопрос в том, что надо автоматизировать добавление сайта в анализируемые...
То есть необходим
- Определённый коэффициент для количества просмотров
- Определённый коэффициент для длительности просмотра
- Совокупный коэффициент, равный сумме (как вариант) вышеприведённых 2ух
- Порог для совокупного коэффициента
Собственно, проблему то я обозначил, а вот с решением туговато...
У кого-то есть опыт в решении подобных задач?
Буду очень признателен за любые ответы!
Почему, допустим, нельзя неделю "следить" за пользователем. Собрать базу данных по сайтам, сколько он времени на них пребывает при каждом визите. По истечению недели по статистике можно будет выделить самые посещаемые сайты. Взять усредненное (не среднее арифметическое, а значения из середины списка) значение, на которое и следует опираться.
Ну и вспомнить теорию вероятности и мат.статистику. Берёте утверждение "данный сайт с k% вероятностью является постоянно посещаемым". Для среднего значения потом строите доверительный интервал, основываясь на значении k.
Но у нас требование такое...Начальник не хочет лазить в интерфейс, и ему не хочется ждать неделю:)
допустим, он пооткрывал сайты, и всё - думает так, что этот сайт уже в топе..
А то же самое, но не раз в неделю, а раз в день делать не подойдёт?
Раз в день тоже редко, но идея с запуском по времени хороша, с этим, пожалуй, вопросов нет
У каждого браузера есть "история". Если данная информация доступна из плагина, то проблем не вижу. При первом запуске просмотреть историю и выяснить наиболее часто открываемые сайты.
Думаю, это единственный оптимальный способ собрать статистику сразу при старте программы. Или рассмотреть ручной ввод.
Если собирать по истории, там может не быть времени, проведённого на сайте.