Главная > BlogBot, Руководства > Методы работы с BlogBot

Методы работы с BlogBot

Часто в аське приходится объяснять пользователям BlogBot принцип работы с ним. Приходится делать это довольно часто. Сегодня один из клиентов посоветовал описать все это в посте на блоге. Что я решил и сделать. Статья получилась очень большой, но прочитать будет полезно всем владельцам BlogBot, а также тем, кто планирует купить систему.

Создание сателлитов на том же хостинге, где установлен BlogBot
  Инсталляция блога
  Категории и поисковые запросы
  Поиск релевантного контента при помощи операторов поиска Google
  Расписания для парсинга выдачи
  Расписание для публикации постов
Создание сателлитов на сторонних хостингах
  Создание сателлитов встроенными средствами BlogBot
    Экспорт контента через файл экспорта
    Установка на блоге плагина wp-o-matic или похожего для парсинга RSS лент
    Настройка RSS-лент в BlogBot’е для автоматического обновления блога
  Создание сателлитов дополнительными средствами BlogBot

Создание сателлитов на том же хостинге, где установлен BlogBot

Этот принцип довольно простой и почти все, кто покупает BlogBot используют только его. Заключается он в установке блога на том же хостинге и наполнении его контентом.

Алгоритм следующий:

  1. Инсталляция блога из сборки BlogBot.
  2. Создание категорий с поисковыми запросами в разделе «Категории и ключевые слова».
  3. Создание расписания для парсинга выдачи.
  4. Создание расписание для публикации постов на установленный блог.

Теперь подробней остановимся на каждом пункте.

Инсталляция блога

Инсталляция блога – здесь все просто. Единственное затруднение может вызвать разве что определение абсолютного пути к папке домена. Есть очень простой способ узнать этот путь, чтобы не рыскать по панели управления хостингом в поисках пути к домашней папке и т.д.

Итак, создаем файлик с именем path.php и текстом <?php echo __FILE__; ?>, кладем данный файлик в папку домена и запускаем через браузер. Например, если у вас домен domain.ru, то к файлику обращаемся по адресу http://domain.ru/path.php. На экране будет абсолютный путь к файлу path.php, то есть все, что будет до path.php и будет абсолютным путем к папке домена.

Категории и поисковые запросы

Когда вы создаете категории для контента учтите, что эти же названия категорий будут в последствии названиями рубрик на конечном блоге. Поэтому составляйте нормальные названия.

Здесь же при создании категории выбираются словари для синонимизации собираемого контента, поэтому не забывайте выделять те словари, которыми вы хотите пользоваться.

В категориях вы указываете поисковые запросы. Не нужно сюда пихать список ключевиков как при создании дорвея. На одну категорию вполне хватит 3-7 запросов, но такие, которые максимально уточняли, что вы хотите найти в Google.

Очень часто пользователи BlogBot добавляют ключевики, которые являются частью друг друга, то есть, например: «окна», «пластиковые окна», «купить пластиковые окна» и т.д. В этом случае, если нужно много контента про «окна», то будет достаточно только запроса «окна», сюда войдут и «пластиковые окна» и деревянные и все, которые найдутся в гугле. Если же нужен контент только про «пластиковые окна», то тогда нужно удалить запрос «окна», иначе будет много мусора. Оптимизируйте ваши запросы, чтобы лишний раз не перегружать свой хостинг и не собирать лишний мусор. Лучше делать качественные сателлиты, чем пытаться сделать их как можно больше.

Поиск релевантного контента при помощи операторов поиска Google

Есть еще способ оптимизировать запросы так, чтобы контент собирался именно тот, который вы ожидаете увидеть. Способ заключается в использовании поискового синтаксиса Google. Познакомиться с синтаксисом можно на странице http://www.google.ru/support/websearch/bin/answer.py?answer=35890.

Но, чтобы вы лучше поняли смысл этого синтаксиса, приведу несколько примеров. Например, мы ищем статьи о тех же пластиковых окнах. Подбираем такие поисковые запросы, по которым в поиске выдаются ссылки на статьи. Обращаю ваше внимание, именно ссылки на статьи, а не на главные страницы сайтов.

Так если в поиске ввести: пластиковые окна, то все 10 ссылок будут ввести на главные страницы сайтов. Но, если ввести, допустим, эксплуатация пластиковых окон, то большинство ссылок уже будет ввести именно на статьи.

А теперь, если применить оператор intitle:эксплуатация пластиковых окон, то качество результата будет еще лучше. Этим оператором мы указали Google возвращать только те страницы, где в заголовках присутствуют слова из запроса. Эффективность данного метода проявляется тогда, когда вы задаете общие поисковые запросы, типа «молодость», «легко похудеть» и т.д. Такие слова общие и очень часто встречаются в текстах статей, которые не имеют ничего общего с тем, что вы ищете, а если эти же слова будут в заголовках статей, то есть очень большая вероятность, что это именно то, что вы хотели найти.

Кроме оператора intitle: есть и другие. Весь список операторов:

  • intitle:запрос – одно или все слова присутствуют в заголовке страницы (обратите внимание, что между оператором и запросом не должно быть пробелов),
  • allintitle:запрос – все слова из запроса присутствуют в заголовке страницы (обратите внимание, что между оператором и запросом не должно быть пробелов),
  • запрос site:.domain.ru/path/ – поиск на определенном сайте, при этом символ точка (ставить не обязательно) означает поиск на всех поддоменах домена domain.ru, а если вы указываете путь, то поиск будет осуществляться только на страницах, которые содержат данный путь,
  • слово1 слово2 OR слово3 – результат вернет странице, где будет найдены связки слов слово1 и слово2 или слово1 и слово3,
  • "слово1 слово2 слово3" – поиск вхождения словосочетания, выделенное кавычками,
  • запрос -слово – символ «минус» перед словом без пробела означает минус-слово, то есть включив такое слово в запрос, вы отсеете страницы из результата с этим словом, как пример: пластиковые окна –купить, — отсеиваем объявления о продаже окон.

Используйте данные операторы и качество собираемого контента будет намного выше.

Расписания для парсинга выдачи

Когда вы проинсталлируете блог и создадите нужные вам категории, чтобы начал собираться в них контент, надо настроить задания на парсинг выдачи в расписании BlogBot’a. На каждую созданную вами категорию вам нужно создать по одному заданию на «парсинг выдачи». Здесь может возникнуть вопрос, с какой период запуска лучше ставить? BlogBot запускается каждую минуту и обрабатывает всего 3 http-запроса, другими словами, за один запуск BlogBot сможет обработать всего три ссылки: обработать 3 страницы поисковой выдачи, распарсить три статьи или скачать три картинки. Поэтому если у вас мало категорий, а нужно много контента, то можете выставлять интервал 5 минут. Если заданий накопилось уже много и постоянно выстраивается очередь из заданий, то увеличивайте постепенно интервал, пока очередь заданий не исчезнет.

Расписание для публикации постов

Чтобы статьи публиковались на установленном блоге, нужно еще создать задания на публикацию постов в Расписании BlogBot. Делается это в разделе «Расписание» — «Создать» — «Тип задания: Публикация постов».

Обратите внимание, что автоматически публиковать контент на блоге надо именно так. В разделе «Контент» вы можете выделить нужные вам статьи выбрать блог и опубликовать их, нажав на соответствующую кнопку, но статьи опубликуются в оригинале.

Какой здесь выбирать интервал? Ориентируйтесь на то, как часто вы хотите публиковать статьи на блоге. Если вам нужно максимально быстро наполнить блог контентом, то выставляйте минимальный период, если вы поддерживаете блог, то 1-5 статей в день будет достаточно.

Вроде бы все основные моменты при создании сателлитов на том же хостинге осветил. Можно переходить к другим методам

Создание сателлитов на сторонних хостингах

Данный принцип построения сателлитов немного сложнее, чем предыдущий, но более безопасный. Безопасность заключается в том, что вы можете раскидать маленькие порции сателлитов по разным хостингам, и, если одна маленькая сеточка все-таки уходит в небытие, остальные продолжают здравствовать.

Принцип заключается в следующем: BlogBot устанавливается на мощный хостинг для генерации контента, а сателлиты раскидываются группами по более дешевым хостингам.

Для работы по такому принципу BlogBot имеет встроенные средства: формирование RSS лент и формирование файлов экспорта, и дополнительные – плагины: Express Parse и RpcPoster.

Создание сателлитов встроенными средствами BlogBot

Работая только лишь со встроенными средствами алгоритм будет такой:

  1. формирование категорий и поисковых запросов для контента,
  2. формирование заданий на парсинг выдачи в Расписании,
  3. экспорт контента в файл экспорта WP для начальной загрузки блога контентом,
  4. установка на блоге плагина wp-o-matic или похожего для парсинга RSS лент,
  5. настройка RSS-лент в BlogBot’е для автоматического обновления блога.

Теперь рассмотрим алгоритм более детально.

Создание категорий и заданий в расписании ничем не отличается от предыдущего принципа, поэтому эти шаги пропускаем.

Экспорт контента через файл экспорта

Экспорт контента в файл экспорта WP позволит вам быстро перенести контент на ваш сателлит для начальной его загрузки. Другими словами, вы можете на пустом сателлите сразу опубликовать 300 или больше статей. При этом статьи будут раскиданы по времени.

Делается файл экспорта в разделе «ЕЩЕ» — «Создание сателлита на продажу». В данном разделе вам нужно заполнить простую формочку, где указать, с каких категорий брать контент, в каком количестве, адрес сайта, на который переноситься контент, путь к изображениям, настройки уникализации и другие простые опции. В итоге вы получите архив, где будут находиться файл экспорта – это XML файл и папка с картинками images.

Если вместо архива вы получаете 500 или 404 ошибку, то уменьшите количество статей, которые берутся из категорий.

Полученный архив распакуйте у себя на компьютере. Папку images по FTP загрузите на сателлит по тому пути, что вы указали в форме. По умолчанию – это /wp-content/uploads/, то есть вам нужно загрузить images в папку /wp-content/uploads/.

После этого в админке блога перейдите в раздел «Управление» — «Импорт», выберите Импорт из файла экспорта WordPress и в появившуюся форму загрузите XML файл. Затем можете перейти на блог, чтобы убедится, что импорт прошел успешно.

При импорте контента на сателлит может получиться так, что некоторые статьи не опубликуются сразу, а получат статус «отложенная публикация». Это может произойти в том случае, если при формировании файла экспорта вы укажите начальную дату, близкую к текущей и большой период. Например, вы импортируете по 50 статей из 6 категорий, в общей сумме у вас получается 300 статей. Вы ставите начальную дату 01.01.2010 и период 8 часов. 300 статей умножить на 8 часов и поделить на 24 часа, то есть сутки, и в итоге мы получаем 100 дней или 3 месяца на то, чтобы все наши статьи опубликовались. Получается, что статьи с датой до 19.02.2010 опубликуются, а остальные будут публиковаться по мере подхода их даты публикации.

Таким образом, вы можете создавать самообновляющиеся сателлиты с отложенной публикацией.

Но, если вы хотите, чтобы переносимый контент опубликовался на сателлите моментально, то вам лучше указать начальную дату и конечную дату, а интервал оставить пустым, BlogBot сам раскидает статьи по этому интервалу.

Установка на блоге плагина wp-o-matic или похожего для парсинга RSS лент

Смысл этого плагина заключается в том, что вы скармливаете этому плагину ссылки на RSS-ленты с контентом, а он в зависимости от своего расписания постит статьи из RSS к вам на блог. Таким образом, в автоматическом режиме можно обновлять свои сателлиты, также как будто они установлены на том же хостинге, что и BlogBot.

Сразу хочу предупредить, что данный плагин устанавливается на сам блог и работает он только на WP.

Этот же механизм вы можете использовать и для других CMS, например, DLE или Ucoz, но там нужно использовать свои механизмы.

Скачать плагин WP-o-matic можно здесь.

Почитать дополнительную литературу по настройке данного плагина можно на следующих сайтах:

Теперь о том, какие RSS ленты скармливать данному плагину. Ленты, которые создает BlogBot.

Настройка RSS-лент в BlogBot’е для автоматического обновления блога

Сформировать ссылку на RSS-ленту можно в разделе «Контент». Если нажать на большую иконку RSS рядом с фильтрами, то вы попадете на RSS ленту. При помощи фильтров вы можете отсеять из RSS ленты лишние категории или тематики.

Пример. У вас есть 20 категорий, но для конкретного сателлита вам нужно публиковать статьи только из 5 определенных категорий. Если эти категории относятся к одной тематике и в этой тематике больше нет других категорий, то выбирайте ее из фильтра, кликайте по RSS – в ленте будут только посты из данных категорий. Если категории не привязаны к одной тематике, то вам придется сделать 5 лент для каждой категории, то есть выбрать по очереди каждую категорию в фильтре и скопировать ссылки на RSS.

Данные ссылки надо будет в последствии скормить плагину WP-o-matic на конечном сателлите.

Когда вы получите ссылку на RSS, то она будет иметь множество разных параметров, например:

http://bb.ru/rss.php?key=Ключ{&category=ID}{&subcat=ID}{&limit=N}{&synonymize}{&dict[]=словарь&dict[]=словарь...&dict[]=словарь}{&rewrite}

Здесь параметры:

  • сategory – ID категории, если выбрать фильтр, то ссылка ID подставится автоматически, взаимоисключает тематику.
  • subcat – ID тематики, если выбрать фильтр, то ссылка ID подставится автоматически, взаимоисключает категорию.
  • limit – кол-во статей, которые выбираются за одно обращение,
  • key – ключик безопасности, чтобы кроме вас никто не смог воспользоваться RSS, формируется автоматически,
  • synonymize – синонимизировать или нет контент,
  • dicts – перечень словарей,
  • rewrite – пропускать или нет через рерайтер.

Фигурные скобы {} означают, что параметр в них не обязателен. То есть если вы хотите использовать только синонимизированные статьи, вам нужно в конец ссылки добавить параметр &synonymize и, если вы используете пользовательские словари, то &dicts[]=userdict1&dicts[]=userdicts2 и т.д., столько сколько у вас есть словарей.

После выполнения данных махинаций ваш сателлит на стороннем хостинге будет также наполнятся контентом, как-будто он работает на том же хостинге, где и BlogBot.

Создание сателлитов дополнительными средствами BlogBot

Как я уже сказал дополнительные средства – это плагины Express Parse и RpcPoster. Первый быстро собирает контент, второй быстро его постит на стороннем сателлите по средством протокола XML-RPC.

Алгоритм может быть следующим:

  1. настройка Express Parse для сбора контента в категории в раздел «Контент», в настройках плагина списком указываются категории и к ним поисковые запросы,
  2. настройка расписания публикации в плагине RpcPoster на сателлиты.

Это самый простой способ быстро добавить категории и начать наполнять сателлиты контентом.

Плагин RpcPoster работает со стандартным протоколом XML-RPC, поэтому пока что поддерживает только те движки, которые используется такой протокол без изменений. Тесты проводились на движке WordPress и сервисе Wordpres.com

При этом вы можете использовать как встроенные средства BlogBot, так и дополнительные совместно. То есть, например, при помощи файла экспорта переносить контент на сателлит, а затем через плагин RpcPoster уже поддерживать сателлит.

Постскриптум

В данной статье я попытался ответить на часто задаваемые вопросы пользователей BlogBot. Надеюсь, статья поможет улучшить качество ваших сателлитов и понять принципы работы с данным комбайном. Удачи.

Popularity: 5%

BlogBot, Руководства

  1. Alexander
    20 Фев 2010 из 2:35 | #1

    Здравствуй, Денис!
    Я заметил, что при создании сателлита на продажу, экспортируемые статьи по-прежнему остаются неопубликованными, то есть:
    допустим, ББ напарсил 1000 статей, мне из них нужно извлеч 4 болга по 250 статей. Вопрос:
    будут ли дублироватся статьи в этих 4 блогах?

  2. Александр
    20 Фев 2010 из 17:48 | #2

    Спасибо.. Отличный обзор… Попробую настроить все по Вашим рекомендациям…

    Кстати хотелось увидеть подробное описание по подбору хостинга под ВВ.

    Примеры работ. Достижения…

    Удачи..

  3. Александр
    20 Фев 2010 из 19:49 | #3

    Вы рекомендуете для парсинга RSS лент именно WP-o-matic, а не WPRobot или FeedWordPress?

  4. 21 Фев 2010 из 15:26 | #4

    @Александр
    WP-o-matic более продвинутый, остальные попроще, но выбирать вы можете любой, каким вам будет удобно пользоваться.

  5. Oz
    21 Фев 2010 из 17:58 | #5

    Привет, Seobucks.
    Вопрос по апгрейду. Когда будет функция массового удаления и фильтры для максимально быстрого поиска?

  1. Трекбеков пока нет.