Исследователи из Мэрилендского университета и компании Vicarious опубликовали реализации двух различных методов обхода средств отсеивания интернет-ботов на основе капчи, в том числе позволяющих обойти защиту популярного сервиса reCaptcha. Методы интересны различиями в подходах - первый проект легко реализуем при помощи существующих сервисов, а второй потребовал существенных исследований в области распознавания образов и машинного обучения.
Первый проект получил название unCaptcha (http://uncaptcha.cs.umd.edu/) и позволяет восстановить цифровой код reCaptcha, предлагаемый для ввода в режиме звуковой капчи. Метод позволяет определить капчу с точностью 85.15%, на распознавание уходит приблизительно 5 секунд, что сопоставимо с длительностью предлагаемой звуковой последовательности. Реализация опубликована (https://github.com/ecthros/uncaptcha) на GitHub под лицензией MIT.Суть метода сводится к записи продиктованных цифр, разделения отдельных слов и передачи каждого слова одновременно в шесть online-сервисов распознавания речи (IBM, Google Cloud, Google Speech Recognition, Sphinx, Wit-AI, Bing Speech Recognition). Далее из распознанных фраз выделяются цифры или слова по произношению близкие к цифрам (например, true/to/too воспринимается как 2, tree/free как 3, sex как 6 и т.п.) и на основе оценки частоты совпадений выбирается наиболее вероятное значение.
Второй проект (https://www.vicarious.com/2017/10/26/common-sense-cortex-and... использует методы (http://science.sciencemag.org/sites/all/libraries/pdfjs/web/... машинного обучения и распознавания образов для выбора правильной картинки при работе с различными капчами. Для распознавания используется специально разработан алгоритм RCN (Recursive Cortical Network), эталонная реализация которого опубликована (https://github.com/vicariousinc/science_rcn) под лицензией MIT.
В условиях распознавания обычного текста RCN обеспечивает точность на уровне 90% и в отличие от традиционно применяемых для подобных задач свёрточных нейронных сетей (CNN, Сonvolutional Neural Network) требует существенно меньшего объёма данных для обучения, обеспечивая при этом отличную адаптацию к искажениям символов, наклону, наложению и размытию, не требующую дополнительного обучения.Например, cеть RCN позволила добиться точности в 66.6% распознавания фраз на каптче reCAPTCHA, при этом использовав для обучения всего 500 изображений. Для каптч BotDetect точность распознавания составил 64.4%, Yahoo - 57.4% и PayPal - 57.1% (капча считается ненадёжной при возможности автоматического подбора с точностью в 1%). При оптимизации модели под конкретный стиль удалось добиться точности распознавания на уровне 90%. Построенная компанией Google свёрточная нейронная сеть обеспечила уровень распознавания reCAPTCHA в 89.9%, но потребовала обучения на базе из 2.3 млн изображений капч и
продемонстрировала снижение точности до 38.4% при простом изменении на 15% пространства между символами, в то время как RCN легко адаптируется к изменениям в стиле, так как осуществляет разбор на уровне отдельных символов.
В RCN задействованы методы, сходные с работой человеческого зрения.
Работа RCN напоминает поведение нейронов в коре головного мозга, одна часть которых осуществляет выделение контуров объектов, а другая занимается изучением поверхности и текстур, сообща решая задачу распознавания образа. В RCN одна часть сети осуществляет выделение контуров объектов, другая часть анализирует наложения разных объектов, а третья выполняет операции классификации выделенной иерархии объектов с учётом стиля и угла зрения, на последнем этапе осуществляется сопоставление с формами стандартных букв или цифр. Для каждой из букв алфавита формируется набор шаблонов, учитывающих разные начертания, наклон, растяжение и другие виды искажений. Сопоставление осуществляется с использованием генеративной вероятностной модели (https://en.wikipedia.org/wiki/Generative_model), выделяющей наиболее вероятную связь исходного объекта с объектами из базы сопоставлений.
URL: https://www.theregister.co.uk/2017/10/31/uncaptcha_research_.../
Новость: https://www.opennet.ru/opennews/art.shtml?num=47477
Дожили, программы(боты) распознают капчи лучше чем люди.
запилите уже browser extension, разгадывающий за меня эту херню, кто-нибудь!
Можно даже - с привлечением внешней нейронной сети - все равно владелец капчи уже всю инфу про меня слил, уже не жалко поделиться еще с одним.
Для каких браузеров делают экстеншионы на смеси Python и C++?
С приходом WASM, ещё похлеще будут.
Для любых. Но без обвязки на javascript не обойтись.
Отдельный демон (а то и онлайн-сервис) + минимальное расширение, которое хватает содержимое и этому демону/сервису отсылает - совершенно очевидная архитектура.
Скоро будешь решать интегралы вместо каптчи.
Под водовку и картофанчик.
Больше всего доставляет:
> Google Cloud, Google Speech Recognition"Окей, гугл, а теперь рюхни-ка рекапчу!"
это уже было в симпсонах^W^W на двачах
все это значит что капчи станут еще менее читаемыми. печально
Всё это значит, что капчи скоро перестанут существовать, потому что боты станут такими же умными как мы и получат равные с нами права ;)
Пора писать ботов которые при помощи нейросетей будут определять человек ты или бот.
А потом пилить ботов которые при помощи нейросетей будут обманывать их, выдавая себя за человека.
> будут обманывать их, выдавая себя за человека.Это баянище, alicebot на*бывал еще пользователей IRC. При чем тут были нейросети? Они были источниками материала для алгоритма.
я бы за человека не считал того, кто примет alice за человека
Оно изначально набирало базу фраз из того что люди говорят. Если на месяцок выпустить в IRC канал с полсотней чатлан - клоны и доразвитие alice начинали жечь напалмом.
>> будут обманывать их, выдавая себя за человека.
> Это баянище, alicebot на*бывал еще пользователей IRC. При чем тут были нейросети?
> Они были источниками материала для алгоритма.Потому что сложность алгоритма должна постоянно возрастать.
нет, капчи перестанут существовать потому, что вместо каптч будет идентификация личности, социальный рейтинг и оплата в соответствии с рейтингом. Не идентифицировал личность - пошёл на %¥№.
> нет, капчи перестанут существовать потому, что вместо каптч будет идентификация личности,
> социальный рейтинг и оплата в соответствии с рейтингом. Не идентифицировал личность
> - пошёл на %¥№.А чего это у тебя написано "Аноним"? Догадаешься что делать дальше? По твоему же рецепту :). А так то было бы забавно - устроить координированную акцию по сливу тебе репутации, так что потом тебя даже сортиры мыть не возьмут.
Ну хватит уже дурнопахнущей фантастики из сериалов.
мы уже гораздо умнее тебя, так что хрен тебе, а не равные права, раб!
Скоро запретят программировать (коментировать), чтобы ботов не создавали;)
> все это значит что капчи станут еще менее читаемыми. печальноСовсем скоро в магазинах вашего города - https://i.imgur.com/TggXiRo.png
Ага, а после ошибка 503
Если честно, то давно было известно, что капчу придумали не для людей. :D
... и не для роботов.
Лучше бы они написали код определяющий автомобили, мосты, витрины и дорожные знакиа, и наконец-то эта дичь ушла бы в прошлое.
Ещё проще :)
>автомобили, мосты, витрины и дорожные знакиа, и наконец-то эта дичь ушла бы в прошлое.В будущем о котором ты мечтаешь нет места для автомобилей, мостов, витрин и знаков?
Мне всегда было интересно, а снятся ли луддитам жестяные овцы?
Тест Тьюринга провален.
Там, куда мы летим, не нужны автомобили, мосты и витрины.
> В будущем о котором ты мечтаешь нет места для автомобилей, мостов, витрин и знаков?Дорожные знаки скорее всего отомрут. Вероятно еще при твоей жизни - man m2m.
> Вероятно еще при твоей жизни - man m2m.Т.е. в течении 50-70 лет? Вряд ли. Дорожные знаки, они ведь не только для водителей.
Напомнило анекдот про ГАИ.
> Т.е. в течении 50-70 лет? Вряд ли.Меньше.
> Дорожные знаки, они ведь не только для водителей.
Это не важно.
Давно уже сделали. Эта статья как раз развитие той.
Это сколько же условных китайцев останется без работы?
да нисколько, они все по уши загружены дорожными знаками, автомобилями и витринами.
символьные рекапчи уже не используются практически
Капчу набрал клавой за 3 секунды и все.А отмечать дорожные знаки меня бесит. Пусть сдохнет кто прибумал... Горит в аду.
Гугл. По крайней мере использовать стал один из первых гугл точно. Подсказать, где штаб-квартира?
>А отмечать дорожные знаки меня бесит. Пусть сдохнет кто прибумалНе было мысли, что ты используешься гуглом как бесплатный OCR для гугломапов?
Причём да, скоро и эту задачу человеки сольют славным роботам...
не было мысли, что причина горения в аду автора этой идеи — не помощь грядущему ИИ, а поганая реализация этой помощи?
> Причём да, скоро и эту задачу человеки сольют славным роботам...Хорошо.
Однажды узнаешь, что работал на нейросеть какого-нибудь гугломобиля.
Без матановой капчи никак
Во время движения авто автомобиля гугл: укажите где красный сигнал светофора.Вы слишком долго думаете, мы уже проехали на красный сигнал светофора.
(Еще пару секунд)
С вашего телефона снят штраф за проезд на красный смешал светофора в сумме ... Руб
Гугл и так не даёт искать через Tor, потому что "с вашего IP было подозрительно много запросов". А теперь не даст в этом случае даже капчу набрать!
> "с вашего IP было подозрительно много запросов"Так ты используй поисковик а не поделку студентов, которая стала популярна по всему миру из-за отсутствии конкуренции.
Это какой поисковик? sputnik что ли?
> Гугл и так не даёт искать через Tor, потому что "с вашего
> IP было подозрительно много запросов". А теперь не даст в этом
> случае даже капчу набрать!Зато у duckduckgo есть даже свой .onion. Почувствуйте разницу.
>Суть метода сводится к записи продиктованных цифр, разделения отдельных слов и передачи каждого слова одновременно в шесть online-сервисов распознавания речи (IBM, Google Cloud, Google Speech Recognition, Sphinx, Wit-AI, Bing Speech Recognition).Гугл делает капчу, потом гугл её же распознаёт. Пока гуглоинженеры в обоих проектах тужатся над улучшением алгоритмов, все их усилия взаимоуничтожаются одним скриптом :)
AI часто дают играть самому с собой. Люди слишком медленные и глупые.
дорожные знаки, автомобили и витрины придумали для обучения нейросетей. Теперь они сами себя будут учить
Вообще-то ещё самая первая текстовая рекапча была тоже для обучения. Распознавалок текста.
> Вообще-то ещё самая первая текстовая рекапча была тоже для обучения. Распознавалок текста.А это видимо для обучения гугл автопилота. Номера домов, витрины, знаки, реки, горы... палюбас будет универсальный автопилот. Спасибо за тренировку нейросети.
Жду появление капчи в виде вопроса "В чом смысл жызни?"
так ведь многие знают что ответ: 42
Чтоб она сдохла эта проклятая reCaptcha! Заколебала по 5 (а то и больше) наборов картинок с дорожными знаками, магазинами и прочей фигнёй заставлять тыкать на каждом шагу. Некоторое время назад моё терпение кончилось и я просто забил из-за этого на Гугл и перешёл на DuckDuckGo, но к сожалению она встречается и на некоторых других сайтах.
это делается намеренно в том числе и для обучения нейросетей и для ещо некоторых задач вне ит индустрии. по возможности лучше сразу закрывать такие сайты не пытаясь чтото вводить там.
> в том числе и для обучения нейросетейИногда такое ощущение, что основная мотивация - тонкое издевательство над пользователем (т.к. такая капча вполне может раз 5-7 меняться, выдавать "разгадайте еще", подгружая все новые и новые картинки).
Да и вылезают эти дeбиль^W автомобильно-дорожные капчи почему-то только из под TOR (и максимально анонимизированного браузера). Совпадение, однако.> по возможности лучше сразу закрывать такие сайты не пытаясь чтото вводить там.
К сожалению, кроме гугля такая капча используется и в cloudflare.
Которой (то ли от большого ума, то ли просто незнания) подключает, по субъективным ощущениям, чуть ли не каждый второй сайт.
> Да и вылезают эти дeбиль^W автомобильно-дорожные капчи почему-то только из под TORя тебе больше скажу - если из своего гуглоакаунта не выходить, она вообще никогда не вылезет.
> Совпадение, однако.
слишком хорошо анонимизированный браузер, к сожалению, неотличим от спамбота.
А с тора помимо спамботов еще и люди-роботы приходят, анонимно гадить.
тор не показатель. у меня с белой статики на многих сайтах вылазиет всеравно эта хрень. не думаю ,что тот кто является держателем этого сервиса настолько глуп, что не может нормально откалибровать колличество попыток как в других капчах как в том же опеннете. Тут все гораздо глубже и серьезнее и находится за рамками ай ти индустрии. копать нужно в области экспериментальной психологии-психиатрии.
Держатель всей этой хрени насильно глуп, что его зовут Google
> Да и вылезают эти дeбиль^W автомобильно-дорожные капчи почему-то только из под TOR
> (и максимально анонимизированного браузера). Совпадение, однако.Никакого совпадения. Скрипт пытается определить браузер живого человека по наличию всякого хлама, который он нахватал от рекламы на ранее посещенных сайтах. Нет хлама - нет способа отличить бота - нужна проверка.
на сколько я знаю, гугл платит за распознавание дорожных капч. потому жадные вебмак^w вебмастера лепят их куда попало. могу ошибаться
> Чтоб она сдохла эта проклятая reCaptcha! Заколебала по 5 (а то и
> больше) наборов картинок с дорожными знаками, магазинами и прочей фигнёй заставлять
> тыкать на каждом шагу. Некоторое время назад моё терпение кончилось и
> я просто забил из-за этого на Гугл и перешёл на DuckDuckGo,
> но к сожалению она встречается и на некоторых других сайтах.статический белый ip спасет отца русской демократии.
>Работа RCN напоминает поведение нейронов в коре головного мозга, одна часть которых осуществляет выделение контуров объектов, а другая занимается изучением поверхности и текстур, сообща решая задачу распознавания образаНикто там ничем "обособленным" не занимается, нейроны не действуют сами по себе, а создают нелинейную среду, дающую импульсный отклик на ВСЁ изображение сразу, по типу голограммы - откуда и скорость (мгновенно), и характер распознавания "более похоже" / "менее похоже" в соотвествии с "разрешением" образа, т.е. соотношением сигнал/шум
Ну ты бы хоть погуглил про микродвижения глаз при рассмотрении тех или иных изображений, эксперт.
Ох ёк, ну и бред
Скоро капчам придет конец :)
когда каконец сделают тест Тьюринга вместо капчи
> когда каконец сделают тест Тьюринга вместо капчивот тогда-то вместо этих глупых заточек под конкретные очень узкие входные данные появится ИИ
Ну ты хоть почитай, что это за тест такой. На редкость идиотская идея.
Кстати, капча это вариант обратного теста Тьюринга.
Капча будет настолько изощренной, что кто ее распознает, тот бот
В онлайн играх против ботов использовали невидимые айтемы, которые бот подбирал и тем самым палил себя.
Более лютой капчи, чем 3D Captcha, я не встречал. А про знаки и автомобили это для тех, кто наверно не умеет раскладку переключать и букв английских не знает.
Блин, ну зачем? Оно и так сейчас адъ. Что дальше?! Чтобы достигнуть"я не бот" надо будет станцевать с паспортом перед вебкой? >_< А вообще капчу сделали, чтобы тренировать свои нейросети за бесплатно.
>А вообще капчу сделали, чтобы тренировать свои нейросети за бесплатно.Изначально задача была банально защититься от спама на форумах. А вот recaptcha да, сразу была заточена под использование мозгов населения в своих целях.
Скоро текст капчи будут читать голосом Михалёва, Володарского и других переводчиков. И надо будет угадывать кто это
ого - это лучше чем я определяю!
ну не знаю незнаю