Mar 30

Способ может и не новый, но столкнулся с ним впервые.

Вообще как обычно делают рекламные рассылки по icq, регистрируют аккаунт, и пользуясь поиском находить контакты, и уже им рассылать рекламный текст. Правда тут есть несколько заслонов,

1) пользователи могут в настройках аськи требовать активации.

2) У меня например стоит антиспам модуль который выдает следующее: Читать далее »

Теги: ,

Mar 13

Интересно сколько в интернет разновидностей капч? У кого нибудь есть достаточно большой список этих самых капч? Какой процент капч, достаточно сложных, т.е. для которых сложно написать программу распознавания?

Всем известно, что капчи делают для того, чтобы защитить свои гостевые, комментарии, посты в форумах и так далее от автоматического (программного) распространяемого текста в котором обычно есть ссылка на продвигаемый в поисковых системах ресурс. Еще капчами защищают отправку sms, проведение платежей, регистрацию в почтовых сервисах, скачивание файлов, регистрацию в бесплатных хостингах, гугл требует ввести капчу, когда вы добавляете свой сайт на индексацию.

Есть конечно сайты имеющие одну и ту же разновидность капчи, обычно это или один и тот же движок со своей стандартной капчей (как вариант стандартной модифицированной) или сайт пользуется каким нибудь провайдером капча защиты.

Хотя владельцев сайтов которые защищают свои ресурсы полный интернет, им противостоят те кто зарабатывает на продвижении сайтов в поисковых системах. Наверное, когда нибудь в будущем поисковики перестанут ранжировать сайты опираясь на количество ссылающихся на них других сайтов. Будет очень весело. А пока оптимизаторы имея деньги, пользуются специальными ресурсами по ручному распознаванию капч (цены от 1 доллара за 1000 картинок). Еще для распространенных капч, заказывают программы распознавания капчи. Программный подход распознавания капчи очень легко реализуем в первую очередь для уязвимых картинок.

Разработчики защиты на основе картинок зачастую не понимают каким образом можно сделать программное распознавание текста на картинке, им это кажется очень сложным даже невозможным. Поэтому и разработанные ими капча защиты легко распознаваемы программно.

Итак какие существуют уязвимости капч:

  • Использование одного единственного шрифта
  • Размер шрифта всегда одинаковый
  • Количество символов на картинке всегда одинаковое
  • Символы легко можно очистить от фона
  • Примитивные помехи в виде линий или точек
  • Символы не вращаются, хотя если символы повернуты на какой нибудь рандомный угол тоже ерунда
  • К символам и их частям не применяются эффекты деформирования
  • Символы не слипшиеся

Самая востребованная и высоко ценимая капча, конечно же Гугловская - она использует всего два последних пункта в полной мере, еще у них меняются шрифты и возможно есть небольшое вращение символов.

Виды капч по своей сложности:

  1. Самые примитивные капчи, это капчи использующие один шрифт, одного размера, всегда одинаковое количество символов на картинке, без поворотов символов, без каких либо деформаций символов, зачастую символы находятся на одной линии, размытие не используется. Возможно присутствуют визуальные помехи в виде точек, линий и других фигур. Причем помехи легко можно убрать.
  2. Более сложные капчи обычно все также используют один единственный шрифт, символы разного размера, используется вращение символов, иногда используется эффект размытия, всевозможные помехи, которые также легко убрать.
  3. Средне сложные капчи имеют сложный иногда градиентный фон, используется 2 или 3 шрифта. Символы разных размеров и вращение символов может использоваться или не использоваться. Помехи не очень легко убрать.
  4. Используют несколько шрифтов. Применяется искажения как всей строки, отдельного символа, также какой то части символа. Символы касаются друг друга, т.е. слипшиеся.
  5. Может быть не самые сложные, но имеющие свою изюминку. Например: флеш капчи, gif анимированные капчи.

Примеры:

Очень примитивно

Они что думают, что красный фон нельзя убрать? Легко, убираем все кроме черного цвета.

Повернутые символы, разного размера, фон легко убирается

Слипшиеся символы, разноцветные. Кстати разноцветность символов помогает их разделить

Один шрифт, но применяется эффект деформации, символы слипшиеся.

Сложный фон

Разный шрифт, помехи легко убрать

Анимированный gif. Символы которые нужно набрать тоже двигаются, хотя траектория движения поможет в распознавании.

Теги: ,

Mar 01

В последнее время, в моей работе PHP программистом, возникает потребность делать большие по времени обработки данных. Иногда скрипт должен работать день или два, думаю дальше будет больше. Делать такие дела в браузере невозможно, по причине того, что скрипт вылетает по тайм-ауту. Выход конечно же запускать скрипт через крон. Но у данного метода есть свои недостатки. Например мне не нужно запускать скрипт через определенные промежутки времени, а нужно разово. Пробовал дробить задание на части, выход конечно, но пускать эти части на обработку например через каждые 5 минут тоже меня не устраивает, потому что задание может выполниться за 2 минуты, следующее стартует через 3 минуты, получается на каждом цикле задержка 3 минуту, а это плохо. Также плохо, когда задание выполняется за больше чем 5 минут, задания накапливаются занимая процессор сервера. Можно конечно проверять запущено ли задание, ведь это не проблема, но тогда все равно у общего процесса обработки будут простои.
Решение, которое меня полностью устраивает сделал так: запускаю небольшие по времени обработки прямо в браузере, а следующее задание стартую javascript-ом. Таким образом запустив задание на удаленном Windows хосте в браузере в самые короткие сроки получу выполнение задания.

Теги: