Автоматические парсеры информации :

Все больше и больше требуется информации для современного сайта. Частые обновления позволяют повысить отыскиваемость сайта в поисковиках и, следовательно, поднять посещаемость.

Но что делать, если хочется, чтобы сайт сам наполнялся контентом?

Можно поставить хитрый движок и нанять человека для того, чтобы он писал статьи на сайт.

Можно поставить особый скрипт, который будет периодически наполнять ваш сайт информацией.

А что делать, если у вас уже есть работающий сайт, который не хотелось бы сильно менять, но свеженького контента хочется?

У меня есть ответ на этот вопрос: Надо скачать с этого сайта и установить на свой несколько скриптов.

Найти их можно, щелкнув мышкой по кнопке "Грабберы".
Но сначала прошу вас дочитать текст этой странички до конца.

Что же такое грабберы и парсеры?

Интересным направлением в последнее время стали разнообразные грабберы и парсеры. Их применение - получение информации с других сайтов.

В интернет-терминалогии граббер - это скрипт, позволяющий "вытягивать" данные с других сайтов на свой. А парсер может распознавать нужную информацию в файле скачанных данных и обработать ее в соотвествии с задачей. В настоящее время оба названия используются как равнозначные.

Для чего нужны грабберы и парсеры?

    1. Для автоматического обновления страниц вашего сайта.
      Редкообновляемый сайт так же редко посещается. Посетителю, побывавшему у вас на сайте может стать не интересно. Сайты с не актуальной информацией называют "мертвыми". В этом случае и можно использовать автоматическое добавление статей, новостей по тематике сайта и другого контента с разных ресурсов похожей тематики с помощью специальных скриптов - парсеров или грабберов контента.

    2. Для актуальности информации.
      Например, посетителям вашего сайта очень важно знать прогноз погоды. Каждый раз менять его вручную не очень удобно, так как это требует ежедневного внимания к сайту. Можно использовать погодный информер, но они, чаще всего используют java-скрипты, что нежелательно для современного сайта. Да и не всегда подходит тот дизайн, что предлагают информеры. А что делать если информация меняется быстро и не равномерно. Если важно, чтобы на сайте всегда находилась самая свежая информация без ручного вмешательства, то лучшим решением будет использование скриптов граббера или парсера.

    3. Для объединения информации.
      В глобальной сети множество страниц с важной информацией. Но чаще всего она разрозненна. Используя скрипты грабберов, можно объединить всю полезную информацию и разместить её на одной странице. Очень удобно, когда вся информация с разных источников объединена в один. Например новости: посетитель с большим энтузиазмом зайдет на сайт, где в одном месте находятся новости с разных новостных сайтов, да еще и структурированые по тематике, чем станет открывать каждый из новостых сайтов по отдельности. При таком использовании грабберов и парсеров обычно и не скрывают источник информации. Цель - удобство, а значит и большая посещаемость.

А что же вы можете найти на этом сайте?

Исходя из вышесказанного, мои скрипты одновременно и грабберы и парсеры.

Хочу обратить ваше внимание на тот факт, что мои грабберы тянут информацию не с RSS лент, а прямо с сайта-источника. Это намного лучше, т.к. парсеров RSS очень много, а это приводит к появлению множества дубликатов.

А дальше прошу вас читать внимательно.

Сразу хочется развеять миф - мол, с грабберами при создании сайтов не нужно работать над сайтом, что это джинн, делающий за вас всю работу, - это не так.

Если вы налепите на свой сайт множество грабберов и всевозможных импортеров RSS лент, то вас очень быстро пессимизируют поисковики. Ибо они сейчас не любят дубли сайтов. Просто склеят с сайтом оригиналом, как зеркало и ваши потенциальные посетители пойдут на оригинал.

Вам это надо? Я думаю, что нет.

Как же этого избежать?

Да очень просто!

Надо наполнять свой сайт таким образом, чтобы своего(уникального) контента было представлено как можно больше. Чем больше, тем лучше. Перемешивайте его с грабберами, RSS лентами, освежайте информацию и поисковики полюбят ваш сайт.

В идеале, у вас должен уже быть сайт, наполненный оригинальным контентом, а грабберы просто добавят часто обновляемый, свежий контент.

Придерживайтесь этих принципов и вы не будете разочарованы.

На данный момент доступны грабберы для этих ресурсов:

  • http://top.rbc.ru/
  • http://rokf.ru/news/
  • http://newsru.com/
  • http://news.onru.ru/
  • http://3dnews.ru/
  • http://efamily.ru/
  • http://news.ferra.ru/hard/tape/
  • http://soft.cnews.ru/
  • http://zoom.cnews.ru/ru/publication/
  • Список грабберов будет пополняться. Заходите сюда ещё :-)

    Любой вебмастер знает, как сложно бывает наполнять свой сайт контентом. Но недавно появился очень удобный сервис, помогающий авторам заработать на написании текстов для вебмастеров.


    Встречайте Advego - систему покупки и продажи контента (сообщений, комментариев) для сайтов, форумов и блогов.


    Rambler's Top100 Рейтинг@Mail.ru