Автоматические парсеры информации :
Все больше и больше требуется информации для современного сайта. Частые обновления позволяют повысить отыскиваемость сайта в поисковиках и, следовательно, поднять посещаемость.
Но что делать, если хочется, чтобы сайт сам наполнялся контентом?
Можно поставить хитрый движок и нанять человека для того, чтобы он писал статьи на сайт.
Можно поставить особый скрипт, который будет периодически наполнять ваш сайт информацией.
А что делать, если у вас уже есть работающий сайт, который не хотелось бы сильно менять, но свеженького контента хочется?
У меня есть ответ на этот вопрос: Надо скачать с этого сайта и установить на свой несколько скриптов.
Найти их можно, щелкнув мышкой по кнопке "Грабберы".
Но сначала прошу вас дочитать текст этой странички до конца.
Что же такое грабберы и парсеры?
Интересным направлением в последнее время стали разнообразные грабберы и парсеры. Их применение - получение информации с других сайтов.
В интернет-терминалогии граббер - это скрипт, позволяющий "вытягивать" данные с других сайтов на свой. А парсер может распознавать нужную информацию в файле скачанных данных и обработать ее в соотвествии с задачей. В настоящее время оба названия используются как равнозначные.
Для чего нужны грабберы и парсеры?
- Для автоматического обновления страниц вашего сайта.
Редкообновляемый сайт так же редко посещается. Посетителю, побывавшему у вас на сайте может стать не интересно. Сайты с не актуальной информацией называют "мертвыми". В этом случае и можно использовать автоматическое добавление статей, новостей по тематике сайта и другого контента с разных ресурсов похожей тематики с помощью специальных скриптов - парсеров или грабберов контента. - Для актуальности информации.
Например, посетителям вашего сайта очень важно знать прогноз погоды. Каждый раз менять его вручную не очень удобно, так как это требует ежедневного внимания к сайту. Можно использовать погодный информер, но они, чаще всего используют java-скрипты, что нежелательно для современного сайта. Да и не всегда подходит тот дизайн, что предлагают информеры. А что делать если информация меняется быстро и не равномерно. Если важно, чтобы на сайте всегда находилась самая свежая информация без ручного вмешательства, то лучшим решением будет использование скриптов граббера или парсера. - Для объединения информации.
В глобальной сети множество страниц с важной информацией. Но чаще всего она разрозненна. Используя скрипты грабберов, можно объединить всю полезную информацию и разместить её на одной странице. Очень удобно, когда вся информация с разных источников объединена в один. Например новости: посетитель с большим энтузиазмом зайдет на сайт, где в одном месте находятся новости с разных новостных сайтов, да еще и структурированые по тематике, чем станет открывать каждый из новостых сайтов по отдельности. При таком использовании грабберов и парсеров обычно и не скрывают источник информации. Цель - удобство, а значит и большая посещаемость.
А что же вы можете найти на этом сайте?
Исходя из вышесказанного, мои скрипты одновременно и грабберы и парсеры.
Хочу обратить ваше внимание на тот факт, что мои грабберы тянут информацию не с RSS лент, а прямо с сайта-источника. Это намного лучше, т.к. парсеров RSS очень много, а это приводит к появлению множества дубликатов.
А дальше прошу вас читать внимательно.
Сразу хочется развеять миф - мол, с грабберами при создании сайтов не нужно работать над сайтом, что это джинн, делающий за вас всю работу, - это не так.
Если вы налепите на свой сайт множество грабберов и всевозможных импортеров RSS лент, то вас очень быстро пессимизируют поисковики. Ибо они сейчас не любят дубли сайтов. Просто склеят с сайтом оригиналом, как зеркало и ваши потенциальные посетители пойдут на оригинал.
Вам это надо? Я думаю, что нет.
Как же этого избежать?
Да очень просто!
Надо наполнять свой сайт таким образом, чтобы своего(уникального) контента было представлено как можно больше. Чем больше, тем лучше. Перемешивайте его с грабберами, RSS лентами, освежайте информацию и поисковики полюбят ваш сайт.
В идеале, у вас должен уже быть сайт, наполненный оригинальным контентом, а грабберы просто добавят часто обновляемый, свежий контент.
Придерживайтесь этих принципов и вы не будете разочарованы.
На данный момент доступны грабберы для этих ресурсов:
Список грабберов будет пополняться. Заходите сюда ещё :-)
Любой вебмастер знает, как сложно бывает наполнять свой сайт контентом. Но недавно появился очень удобный сервис, помогающий авторам заработать на написании текстов для вебмастеров.
Встречайте Advego - систему покупки и продажи контента (сообщений, комментариев) для сайтов, форумов и блогов.
