Всем привет. Сегодня статья будет посвящена автоматическому наполнению контентом, сайтов работающих на cms wordpress. Существует несколько способов автоматического наполнения, из них мы рассмотрим два наиболее популярных: автоматическое наполнение при помощи плагинов — грабберов и наполнение контентом сайтов при помощи граббер скриптов.
Рассмотрим первый способ наполнения блога контентом с помощью wordpress плагинов — RSS граберов. Два наиболее популярных RSS-граббера это: FeedWordpress и Wp-0-matic. Дальше по-немногу о каждом.
RSS-граббер FeedWordpress.
Это плагин использует RSS для того, чтобы выуживать оттуда данные, и автоматически оформлять их в виде отдельного поста.
Возможности плагина FeedWordpress:
- Без проблем грабит различные новостные ленты формата — RSS и Atom.
- Распределяет сграбленные заметки по категориям блога.
- Автонаполнение блога настраивается по расписанию, Вам не понадобится настраивать крон.
- Позволяет публиковать анонсы сграбленных статей, так и новость полностью со ссылкой на источник.
Итак, теперь переходим к установке и детальной настройке плагина FeedWordpress. Скачиваем плагин FeedWordpress. Устанавливаем и активируем на WordPress плагин RSS-агрегатор FeedWordPress. Здесь каких-то особенностей нет. Все делаем по стандартной схеме.
Поле установки FeedWordPress в админ панели блога появляется раздел «Syndication». В нем выбираем подраздел «Syndicated Sites» в этом подразделе в поле: Website feed URL добавляем адрес фида, который будем грабить к примеру мой: /feed и жмем кнопку Add:
Теперь переходим к настройкам фида, на изображении ниже все это показано в деталях:
Первый блок настроек отвечает за обновление – автоматическое или вручную. Выбираем автоматическое.
Устанавливаем интервал проверки фидов «Update scheduling:» на 60 минут (или как Вам нравится). Устанавливаем «Publication:» в «Hold syndicated posts for review; mark as Pending». Т.е. новые посты будут публиковаться не сразу а помечаться как отложенные для публикации. Зачем это надо. Дело в том что синонимайзер не всегда отрабатывает. Зачастую он отказывается работать с постами в которых есть картинки. Или посты бывают ну совсем не в тему. Да и заголовки не мешает иногда подправлять. Но если Вы хотите полную автоматизацию не взирая на недостатки устанавливайте «Publication:» в режим «Publish syndicated posts immediately».
После того, как я все настроил, последний штрих – захожу в раздел Syndication и жму кнопку Update. Импортирование по расписанию началось.
Rss — граббер плагин Wp-0-matic
- Поддерживает все известные форматы RSS.
- Позволяет объединять несколько лент в одну категорию.
- Запускается либо в ручном режиме, либо автоматически, но требует настройки Cron.
Найти ленты с которых можно грабить новости, не составит труда. Можно пройти по блогам. Либо, взять известные ленты, такие как liverss.ru или rssportal.ru
Этот плагин не лучше и не хуже предыдущего – он просто другой. У обеих плагинов есть свои преимущества и недостатки. Только опытным путем можно определиться с выбором плагина, поэтому попробуйте оба.
А теперь давайте приступим непосредственно к установке и настройке плагина WP-O-Matic. Скачиваем плагин WP-O-Matic. Установка плагина стандартная.
Заходим в Настройки/WP-o-matic и сщздаем новую компанию и жмем submit.
Далее, после создания новой компании выбираем вкладку Feeds и заполняем четыре адреса которые будем грабить. Во вкладке Categories, устанавливаем куда будут размещаться сграбленные статьи. Теперь, переходим на вкладку Rewrites. Здесь, можно прописать те слова которые мы хотим заменить в сграбленных статьях. Во вкладке Options поставьте галочку напротив строчки Cache images. Сохраните.
В отличии от плагина FeedWordPress, вам не нужно публиковать статьи, они уже автоматически опубликованы, а синонимайзер их уникализировал.
Статья взята из открытых источников: http://goldserfer.ru/grabber-wordpress-sajtov/#comments