Чем лучше сделать парснг html и перегон результатов в нейросеть?
Необходимо парсить выдачу поисковика (html-страницы целиком) и пересылать результат в каком-либо формате в нейросеть на обработку. Всё должно выполняться в рамках одного приложения. На каком языке или связке языков это лучше всего было бы сделать(с точки зрения удобства и скорости выполнения)?
С помощью Javascript в браузере и какого-нибудь фреймворка, типа jQuery/
на php можно, на perl можно, на c++ можно
К примеру, выберем ники всех написавших в этой ветке:
Код:
$.each($('.caq_author_card a:odd'), function(){
console.log($(this).text());
});
console.log($(this).text());
});
Цитата: mfender
jQuery просто заточен для парсинга. На PHP можно, но там много костылей изобретать нужно для удобства хотя бы. В jQuery уже всё написано до нас.
К примеру, выберем ники всех написавших в этой ветке:
А теперь то же самое на PHP. Даже напрягаться не хочется.
К примеру, выберем ники всех написавших в этой ветке:
Код:
$.each($('.caq_author_card a:odd'), function(){
console.log($(this).text());
});
console.log($(this).text());
});
Есть ли возможность выполнять js или php скрипты в рамках программы на С++?
Цитата: Kuzya
на php можно, на perl можно, на c++ можно
Можно подробнее про возможности С++ в этой сфере? Библиотек заточенных под задачу я не нашёл, из всех средств языка годных на это, знаю только про регулярные выражения
Цитата: kerosin4ik
Есть ли возможность выполнять js или php скрипты в рамках программы на С++?
Ну, к примеру, если под Windows писать, создаём в потоке объект Internet Explorera, загружаем нужный документ, который нужно распарсить, далее встрамляем jQuery и скрипт, который собственно распарсит всё это, в результате получим в window всё что нам нужно, и это уже отправляем куда следует в виде JSON-объекта например. Примерно как это сделать с примером на Delphi можно прочитать ТУТ, реализовать можно так же на чём угодно.
Хаскелем, хаскелем его.