Зачем массово качаются сайты? Сходу можно указать две причины. Кому-то Ваш сайт очень понравился и этот “кто-то” нашел на нем много полезной для себя информации. Вот и хочется человеку сделать себе локальное “зеркало” этого сайта, для того, чтобы не выходя в Интернет как следует изучить информацию на нем.
В другом случае кто-то также нашел сайт интересным, но не в плане информативности, а в плане заработка. Такие субъекты, массово выкачивая сайты со структурой каталогов, медиа-контентом и прочим содержимым, создают потом “зеркала” этого сайта в Сети на каком-то ином хостинге, а проще говоря, крадут сайт целиком чтобы на этом потом заработать.
Уверен, что ни одному владельцу сайта не будет легче ни от первой причины, ни, тем более, от второй, когда его сайт начинают копировать подчистую. Как минимум, это процесс доставляет технические неудобства. Появляется излишняя нагрузка на сервер, расходуется излишний трафик, а если трафик этот в лимите, то еще и излишние деньги за превышение лимита трафика. Обычно веб-мастера, видя как нещадно с их сайта выгружаются один за одним страницы со скоростью, с которой нормальный человек не может серфить по сайту, опускают руки и оставляют все на самотек. Ведь если посмотреть с другой стороны, как-бы если твой сайт кто-то решил скопировать, значит он у тебя действительно полезен. Можно вроде бы этим гордиться?
Еще до того как этот блог был обновлен до версии Wordpress 2.7, для защиты от спама в форму комментариев я использовал очень хороший плагин - Trencaspammers от . Но, к сожалению, автор его по всей видимости забросил и больше не поддерживает и с WP 2.7.x Trencaspammers несовместим. Плагин был не очень популярным, возможно потому что его установка требовала вмешательства в основные файлы движка, а именно, в wp-comments.php и в wp-comments-post.php. Это было не очень удобно, так как после каждого апгрейда WP до новой версии, нужно было не забыть вновь отредактировать эти файлы под плагин, иначе никто не смог бы оставить коммментарии в блоге.
SABRE - это мощный инструмент для предотвращения автоматических регистраций, который к стандартной форме регистрации посетителя сайта Wordpress добавляет вида captcha (проверочный код на картинке) или же небольшое математическое задание вида “сколько будет три плюс десять?“. Плагин этот имеет массу настроек и довольно прост в использовании. Идеальное решение для тех, у кого на сайте включена открытая регистрация посетителей и кого достали спам-боты. Работает плагин на Wordpress 2.3.x и 2.5.x Но версия плагина, приведенная здесь, работает только на WP 2.5.x. Что касается Wordpress 2.3.x, то на странице автора плагина имеется версия Sabre 0.6.3…
В очередной раз достали спамеры. Не в комментариях, как бывает обычно. Для комментариев у меня капча (изображение с кодом) прикручена еще с самого начала существования сайта. А вот регистрационная форма Wordpress такой защиты не имеет. Регистрация на сайте открытая, регистрироваться может кто пожелает. И стал я замечать последние несколько недель, что появляются новые пользователи с бессмысленными никами. Ну, например: Pharmacyonline, vincabbaway, twfordrtwruinfo, aspedatupiess, nrferrarinrfee и т.д. Даже выговорить некоторые из них сложно. Адреса e-mail в регистрационной информации большей частью используются на @mail.ru. После тщательного изучения логов сервера, стало понятно, что после регистрации с бредовым ником “клиентский браузер” авторизовывается на сайте и сразу топает на какую-либо страницу, где есть форма комментариев. Пытается запостить какой-то текст. Однако тут обламывается, потому что проверочный код с изображения для зарегистрированных пользователей тоже обязателен (даже для администраторов и редакторов) при отправке любого комментария.
В принципе, можно было и не обращать особого внимания на регающихся ботов, но со временем ситуация обернулась с другой стороны. Боты то ли “стали тупее”, то ли страх потеряли, но начали использовать при регистрации несуществующие e-mail адреса. Мне повалили отлупы с того же mail.ru и прочих серверов. По 10-15 в день. Так недолго и в какой-нибудь RBL загреметь, тем более если боты начнут использовать реально существующие “не свои” адреса. Решение напрашивалось само собой.
CAPTCHA [ˈkæptʃə] (от англ.«Completely Automated Public Turing test to tell Computers and Humans Apart» —полностью автоматизированный публичный тест Тьюринга для различения компьютеров и людей)— торговая марка Университет Карнеги-Меллона, компьютерный тест, используемый для того, чтобы определить, кем является пользователь системы: человеком или компьютером. Термин появился в 2000 году. Основная идея теста: предложить пользователю такую задачу, которую легко решает человек, но которую невозможно (или крайне трудно) научить решать компьютер. В основном это задачи на распознавание образов. CAPTCHA чаще всего используется при необходимости предотвратить использование интернет-сервисов ботами, в частности, для предотвращения автоматических отправки сообщений, регистрации, скачивания файлов, массовых рассылок и т.п.