Главная > BlogBot > Заставляем плагин ExpressParse парсить еще больше.

Заставляем плагин ExpressParse парсить еще больше.

express-parseBlogBot обладает тремя разными фильтрами для выборки статей из html-кода. Когда один фильтр не справляется со своей задачей на помощь приходит второй и т.д. Самый жадный из этих фильтров под номером 2, обычно он берет много, но иногда хватает то, чего не следовало бы. Появился данный фильтр только в BlogBot версии 2.0. При этом я понятия не имею, почему предыдущие два фильтра в ранних версиях BlogBot’a были пронумерованы, как 1 и 3.

Плагин ExpressParse создавался еще для версии 1.3 и соответственно данный фильтр там отсутствовал. Из-за этого некоторые наши клиенты жаловались на то, что плагин работает почти также как и сам паук. Отчасти они были правы, но только отчасти, потому что пытались сравнивать парсинг по ВЧ, где контента довольно много. Но, если сравнивать по НЧ, то получается, что стандартный паук выберет все статьи с первых страниц поисковой выдачи и будет ждать, пока появится что-то новое, а плагин будет лезть в глубину, пока не пособирает все, что можно.

Собственно, теперь о том, как включить дополнительный фильтр. Очень просто, все кто купил плагин, могут скачать обновленную версию у себя в аккаунте и переписать файлы.

На этом все, удачного вам парсинга.

Popularity: 2%

BlogBot

  1. Комментариев пока нет.
  1. Трекбеков пока нет.