The OpenNET Project / Index page

[ новости/++ | форум | wiki | теги | ]

31.10.2017 12:14  Опубликован код для определения reCaptcha с точностью 85%

Исследователи из Мэрилендского университета и компании Vicarious опубликовали реализации двух различных методов обхода средств отсеивания интернет-ботов на основе капчи, в том числе позволяющих обойти защиту популярного сервиса reCaptcha. Методы интересны различиями в подходах - первый проект легко реализуем при помощи существующих сервисов, а второй потребовал существенных исследований в области распознавания образов и машинного обучения.

Первый проект получил название unCaptcha и позволяет восстановить цифровой код reCaptcha, предлагаемый в режиме звуковой капчи. Метод позволяет определить капчу с точностью 85.15%. На распознавание уходит приблизительно 5 секунд, что сопоставимо с длительностью предлагаемой звуковой последовательности. Реализация опубликована на GitHub под лицензией MIT.

Суть метода сводится к записи продиктованных цифр, разделения отдельных слов и передачи каждого слова одновременно в шесть online-сервисов распознавания речи (IBM, Google Cloud, Google Speech Recognition, Sphinx, Wit-AI, Bing Speech Recognition). Далее из распознанных фраз выделяются цифры или слова по произношению близкие к цифрам (например, true/to/too воспринимается как 2, tree/free как 3, sex как 6 и т.п.) и на основе оценки частоты совпадений выбирается наиболее вероятное значение.

Второй проект использует методы машинного обучения и распознавания образов для выбора правильной картинки при работе с различными капчами. Для распознавания используется специально разработанный алгоритм RCN (Recursive Cortical Network), эталонная реализация которого опубликована под лицензией MIT.

В условиях распознавания обычного текста RCN обеспечивает точность на уровне 90% и в отличие от традиционно применяемых для подобных задач свёрточных нейронных сетей (CNN, Сonvolutional Neural Network) требует существенно меньшего объёма данных для обучения, обеспечивая при этом отличную адаптацию к искажениям символов, наклону, наложению и размытию, не требуя при этом дополнительного обучения.

Например, cеть RCN позволила добиться точности в 66.6% при распознавании фраз на капче reCAPTCHA, использовав для обучения всего 500 изображений. Для капч BotDetect точность распознавания составила 64.4%, Yahoo - 57.4% и PayPal - 57.1% (капча считается ненадёжной при возможности автоматического подбора с точностью в 1%). При оптимизации модели под конкретный стиль удалось добиться точности распознавания на уровне 90%.

Для сравнения остроенная компанией Google свёрточная нейронная сеть обеспечила уровень распознавания reCAPTCHA в 89.9%, но потребовала обучения на базе из 2.3 млн изображений капч и продемонстрировала снижение точности до 38.4% при простом изменении на 15% пространства между символами, в то время как RCN легко адаптируется к изменениям в стиле без потери эффективности.

В RCN задействованы методы, сходные с работой человеческого зрения. Работа RCN напоминает поведение нейронов в коре головного мозга, одна часть которых осуществляет выделение контуров объектов, а другая занимается изучением поверхности и текстур, сообща решая задачу распознавания образа. В RCN одна часть сети осуществляет выделение контуров объектов, другая часть анализирует наложения и параметры разных объектов, а третья выполняет операции классификации выделенной иерархии объектов с учётом стиля и угла зрения. На последнем этапе осуществляется сопоставление с формами стандартных букв или цифр. Для каждой из букв алфавита формируется набор шаблонов, учитывающих разные начертания, наклон, растяжение и другие виды искажений. Сопоставление осуществляется с использованием генеративной вероятностной модели, выделяющей наиболее вероятную связь исходного объекта с объектами из базы сопоставлений.



  1. Главная ссылка к новости (https://www.theregister.co.uk/...)
  2. OpenNews: Проект OpenNMT развивает систему машинного перевода на основе нейронной сети
  3. OpenNews: Google представил технику реконструкции пикселизированных изображений
  4. OpenNews: Проект по автоматической генерации кода, воспроизводящего интерфейс со скриншота
  5. OpenNews: Mozilla развивает свою систему распознавания речи
  6. OpenNews: Техника атаки на системы, использующие алгоритмы машинного обучения
Лицензия: CC-BY
Тип: К сведению
Ключевые слова: captcha, ai
При перепечатке указание ссылки на opennet.ru обязательно
Обсуждение Ajax/Линейный | Раскрыть все сообщения | RSS
 
  • 1.1, Нимус (?), 13:17, 31/10/2017 [ответить] [показать ветку] [···]    [к модератору]
  • +62 +/
    Дожили, программы(боты) распознают капчи лучше чем люди.
     
     
  • 2.4, пох (?), 13:30, 31/10/2017 [^] [ответить]    [к модератору]
  • +25 +/
    запилите уже browser extension, разгадывающий за меня эту херню, кто-нибудь!
    Можно даже - с привлечением внешней нейронной сети - все равно владелец капчи уже всю инфу про меня слил, уже не жалко поделиться еще с одним.

     
     
  • 3.20, Аноним (-), 14:58, 31/10/2017 [^] [ответить]    [к модератору]
  • +1 +/
    Для каких браузеров делают экстеншионы на смеси Python и C++?
     
     
  • 4.27, th3m3 (ok), 15:19, 31/10/2017 [^] [ответить]    [к модератору]
  • +2 +/
    С приходом WASM, ещё похлеще будут.
     
  • 4.28, Твоя мама (?), 15:27, 31/10/2017 [^] [ответить]    [к модератору]
  • +2 +/
    Для любых. Но без обвязки на javascript не обойтись.
     
  • 4.36, Crazy Alex (ok), 16:32, 31/10/2017 [^] [ответить]    [к модератору]  
  • +4 +/
    Отдельный демон (а то и онлайн-сервис) + минимальное расширение, которое хватает содержимое и этому демону/сервису отсылает - совершенно очевидная архитектура.
     
  • 3.21, Аноним (-), 15:05, 31/10/2017 [^] [ответить]    [к модератору]  
  • +7 +/
    Скоро будешь решать интегралы вместо каптчи.
     
     
  • 4.61, Огородничий (?), 23:41, 31/10/2017 [^] [ответить]    [к модератору]  
  • –3 +/
    Под водовку и картофанчик.
     
  • 4.64, Аноним (-), 06:00, 01/11/2017 [^] [ответить]    [к модератору]  
  • +/
    Больше всего доставляет:
    > Google Cloud, Google Speech Recognition

    "Окей, гугл, а теперь рюхни-ка рекапчу!"

     
  • 4.68, Аноним (-), 09:24, 01/11/2017 [^] [ответить]    [к модератору]  
  • +/
    это уже было в симпсонах^W^W на двачах
     
  • 1.2, Аноним (-), 13:23, 31/10/2017 [ответить] [показать ветку] [···]    [к модератору]  
  • +8 +/
    все это значит что капчи станут еще менее читаемыми. печально
     
     
  • 2.12, dq0s4y71 (ok), 13:58, 31/10/2017 [^] [ответить]    [к модератору]  
  • +5 +/
    Всё это значит, что капчи скоро перестанут существовать, потому что боты станут такими же умными как мы и получат равные с нами права ;)
     
     
  • 3.29, kvaps (ok), 15:32, 31/10/2017 [^] [ответить]    [к модератору]  
  • +4 +/
    Пора писать ботов которые при помощи нейросетей будут определять человек ты или бот.
     
     
  • 4.30, kvaps (ok), 15:32, 31/10/2017 [^] [ответить]    [к модератору]  
  • +4 +/
    А потом пилить ботов которые при помощи нейросетей будут обманывать их, выдавая себя за человека.
     
     
  • 5.65, Аноним (-), 06:03, 01/11/2017 [^] [ответить]    [к модератору]  
  • –1 +/
    > будут обманывать их, выдавая себя за человека.

    Это баянище, alicebot на*бывал еще пользователей IRC. При чем тут были нейросети? Они были источниками материала для алгоритма.

     
     
  • 6.69, Аноним (-), 09:26, 01/11/2017 [^] [ответить]    [к модератору]  
  • +3 +/
    я бы за человека не считал того, кто примет alice за человека
     
     
  • 7.72, Аноним (-), 11:04, 01/11/2017 [^] [ответить]    [к модератору]  
  • +/
    Оно изначально набирало базу фраз из того что люди говорят. Если на месяцок выпустить в IRC канал с полсотней чатлан - клоны и доразвитие alice начинали жечь напалмом.
     
  • 6.71, kvaps (ok), 10:58, 01/11/2017 [^] [ответить]     [к модератору]  
  • –1 +/
    Потому что сложность алгоритма должна постоянно возрастать ... весь текст скрыт [показать]
     
  • 3.50, Аноним (-), 19:17, 31/10/2017 [^] [ответить]     [к модератору]  
  • +1 +/
    нет, капчи перестанут существовать потому, что вместо каптч будет идентификация ... весь текст скрыт [показать]
     
     
  • 4.66, Аноним (-), 06:07, 01/11/2017 [^] [ответить]     [к модератору]  
  • +2 +/
    А чего это у тебя написано Аноним Догадаешься что делать дальше По твоему же... весь текст скрыт [показать]
     
  • 4.82, Аноним (-), 06:14, 03/11/2017 [^] [ответить]    [к модератору]  
  • –1 +/
    Ну хватит уже дурнопахнущей фантастики из сериалов.
     
  • 3.51, бот (?), 20:33, 31/10/2017 [^] [ответить]    [к модератору]  
  • +1 +/
    мы уже гораздо умнее тебя, так что хрен тебе, а не равные права, раб!
     
     
  • 4.70, Sw00p aka Jerom (?), 09:58, 01/11/2017 [^] [ответить]    [к модератору]  
  • +/
    Скоро запретят программировать (коментировать), чтобы ботов не создавали;)
     
  • 2.47, ALex_hha (ok), 18:14, 31/10/2017 [^] [ответить]    [к модератору]  
  • +2 +/
    > все это значит что капчи станут еще менее читаемыми. печально

    Совсем скоро в магазинах вашего города - https://i.imgur.com/TggXiRo.png

     
     
  • 3.54, Аноним (-), 21:10, 31/10/2017 [^] [ответить]    [к модератору]  
  • +/
    Ага, а после ошибка 503
     
  • 1.3, AntonAlekseevich (ok), 13:27, 31/10/2017 [ответить] [показать ветку] [···]    [к модератору]  
  • +1 +/
    Если честно, то давно было известно, что капчу придумали не для людей. :D
     
     
  • 2.48, AntonAlekseevich (ok), 18:23, 31/10/2017 [^] [ответить]    [к модератору]  
  • +1 +/
    ... и не для роботов.
     
  • 1.5, Аноним (-), 13:32, 31/10/2017 [ответить] [показать ветку] [···]    [к модератору]  
  • +10 +/
    Лучше бы они написали код определяющий автомобили, мосты, витрины и дорожные знакиа, и наконец-то эта дичь ушла бы в прошлое.
     
     
  • 2.9, Аноним (-), 13:47, 31/10/2017 [^] [ответить]    [к модератору]  
  • +/
    Ещё проще :)
     
  • 2.10, A.Stahl (ok), 13:55, 31/10/2017 [^] [ответить]     [к модератору]  
  • –1 +/
    В будущем о котором ты мечтаешь нет места для автомобилей, мостов, витрин и знак... весь текст скрыт [показать]
     
     
  • 3.13, Аноним (-), 14:15, 31/10/2017 [^] [ответить]    [к модератору]  
  • +6 +/
    Тест Тьюринга провален.
     
  • 3.22, Аноним (-), 15:08, 31/10/2017 [^] [ответить]    [к модератору]  
  • –1 +/
    Там, куда мы летим, не нужны автомобили, мосты и витрины.
     
  • 3.67, Аноним (-), 06:11, 01/11/2017 [^] [ответить]    [к модератору]  
  • +1 +/
    > В будущем о котором ты мечтаешь нет места для автомобилей, мостов, витрин и знаков?

    Дорожные знаки скорее всего отомрут. Вероятно еще при твоей жизни - man m2m.

     
     
  • 4.78, Аноним (-), 17:19, 01/11/2017 [^] [ответить]    [к модератору]  
  • +/
    > Вероятно еще при твоей жизни - man m2m.

    Т.е. в течении 50-70 лет? Вряд ли. Дорожные знаки, они ведь не только для водителей.

     
     
  • 5.83, Аноним (-), 06:17, 03/11/2017 [^] [ответить]    [к модератору]  
  • +/
    Напомнило анекдот про ГАИ.
     
  • 5.88, Аноним (-), 13:10, 05/11/2017 [^] [ответить]    [к модератору]  
  • +/
    > Т.е. в течении 50-70 лет? Вряд ли.

    Меньше.

    > Дорожные знаки, они ведь не только для водителей.

    Это не важно.

     
  • 2.80, Аноним (-), 10:11, 02/11/2017 [^] [ответить]    [к модератору]  
  • +/
    Давно уже сделали. Эта статья как раз развитие той.
     
  • 1.7, angra (ok), 13:38, 31/10/2017 [ответить] [показать ветку] [···]    [к модератору]  
  • +1 +/
    Это сколько же условных китайцев останется без работы?
     
     
  • 2.11, пох (?), 13:57, 31/10/2017 [^] [ответить]    [к модератору]  
  • +1 +/
    да нисколько, они все по уши загружены дорожными знаками, автомобилями и витринами.

     
  • 1.8, grayich (ok), 13:44, 31/10/2017 [ответить] [показать ветку] [···]    [к модератору]  
  • +1 +/
    символьные рекапчи уже не используются практически
     
  • 1.14, я (?), 14:17, 31/10/2017 [ответить] [показать ветку] [···]    [к модератору]  
  • +12 +/
    Капчу набрал клавой за 3 секунды и все.

    А отмечать дорожные знаки меня бесит. Пусть сдохнет кто прибумал... Горит в аду.

     
     
  • 2.24, Аноним (-), 15:10, 31/10/2017 [^] [ответить]    [к модератору]  
  • +/
    Гугл. По крайней мере использовать стал один из первых гугл точно. Подсказать, где штаб-квартира?
     
  • 2.63, лютый жабист__ (?), 05:08, 01/11/2017 [^] [ответить]     [к модератору]  
  • –1 +/
    Не было мысли, что ты используешься гуглом как бесплатный OCR для гугломапов Пр... весь текст скрыт [показать]
     
     
  • 3.74, Аноним (-), 15:14, 01/11/2017 [^] [ответить]    [к модератору]  
  • +/
    не было мысли, что причина горения в аду автора этой идеи — не помощь грядущему ИИ, а поганая реализация этой помощи?
     
  • 3.89, Аноним (-), 13:11, 05/11/2017 [^] [ответить]    [к модератору]  
  • +/
    > Причём да, скоро и эту задачу человеки сольют славным роботам...

    Хорошо.

     
  • 2.81, i (??), 12:20, 02/11/2017 [^] [ответить]    [к модератору]  
  • +/
    Однажды узнаешь, что работал на нейросеть какого-нибудь гугломобиля.
     
  • 1.15, Аноним (-), 14:24, 31/10/2017 [ответить] [показать ветку] [···]    [к модератору]  
  • +1 +/
    Без матановой капчи никак
     
  • 1.16, Аноним (-), 14:26, 31/10/2017 [ответить] [показать ветку] [···]     [к модератору]  
  • +3 +/
    Во время движения авто автомобиля гугл укажите где красный сигнал светофора Вы... весь текст скрыт [показать]
     
  • 1.17, Zenitur (ok), 14:32, 31/10/2017 [ответить] [показать ветку] [···]    [к модератору]  
  • +/
    Гугл и так не даёт искать через Tor, потому что "с вашего IP было подозрительно много запросов". А теперь не даст в этом случае даже капчу набрать!
     
     
  • 2.25, Аноним (-), 15:12, 31/10/2017 [^] [ответить]    [к модератору]  
  • –5 +/
    > "с вашего IP было подозрительно много запросов"

    Так ты используй поисковик а не поделку студентов, которая стала популярна по всему миру из-за отсутствии конкуренции.

     
     
  • 3.39, dq0s4y71 (ok), 16:47, 31/10/2017 [^] [ответить]    [к модератору]  
  • +1 +/
    Это какой поисковик? sputnik что ли?
     
  • 2.90, Аноним (-), 13:12, 05/11/2017 [^] [ответить]     [к модератору]  
  • +/
    Зато у duckduckgo есть даже свой onion Почувствуйте разницу ... весь текст скрыт [показать]
     
  • 1.18, Аноним (-), 14:33, 31/10/2017 [ответить] [показать ветку] [···]     [к модератору]  
  • +1 +/
    Гугл делает капчу, потом гугл её же распознаёт Пока гуглоинженеры в обоих проек... весь текст скрыт [показать]
     
     
  • 2.91, Аноним (-), 13:14, 05/11/2017 [^] [ответить]    [к модератору]  
  • +/
    AI часто дают играть самому с собой. Люди слишком медленные и глупые.
     
  • 1.31, Аноним (-), 15:44, 31/10/2017 [ответить] [показать ветку] [···]    [к модератору]  
  • +1 +/
    дорожные знаки, автомобили и витрины придумали для обучения нейросетей. Теперь они сами себя будут учить
     
     
  • 2.38, Аноним (-), 16:43, 31/10/2017 [^] [ответить]    [к модератору]  
  • +/
    Вообще-то ещё самая первая текстовая рекапча была тоже для обучения. Распознавалок текста.
     
     
  • 3.92, Аноним (-), 14:43, 05/11/2017 [^] [ответить]     [к модератору]  
  • +/
    А это видимо для обучения гугл автопилота Номера домов, витрины, знаки, реки, г... весь текст скрыт [показать]
     
  • 1.33, VINRARUS (ok), 15:56, 31/10/2017 [ответить] [показать ветку] [···]    [к модератору]  
  • +/
    Жду появление капчи в виде вопроса "В чом смысл жызни?"
     
     
  • 2.44, tester (??), 17:38, 31/10/2017 [^] [ответить]    [к модератору]  
  • +5 +/
    так ведь многие знают что ответ: 42
     
  • 1.34, Онаним (?), 15:56, 31/10/2017 [ответить] [показать ветку] [···]    [к модератору]  
  • +/
    Чтоб она сдохла эта проклятая reCaptcha! Заколебала по 5 (а то и больше) наборов картинок с дорожными знаками, магазинами и прочей фигнёй заставлять тыкать на каждом шагу. Некоторое время назад моё терпение кончилось и я просто забил из-за этого на Гугл и перешёл на DuckDuckGo, но к сожалению она встречается и на некоторых других сайтах.
     
     
  • 2.41, аноним2 (?), 17:13, 31/10/2017 [^] [ответить]    [к модератору]  
  • +/
    это делается намеренно в том числе и для обучения нейросетей и для ещо некоторых задач вне ит индустрии. по возможности лучше сразу закрывать такие сайты не пытаясь чтото вводить там.
     
     
  • 3.57, Аноним84701 (ok), 21:49, 31/10/2017 [^] [ответить]     [к модератору]  
  • +/
    Иногда такое ощущение, что основная мотивация - тонкое издевательство над пользо... весь текст скрыт [показать]
     
     
  • 4.60, пох (?), 23:00, 31/10/2017 [^] [ответить]     [к модератору]  
  • +/
    я тебе больше скажу - если из своего гуглоакаунта не выходить, она вообще никогд... весь текст скрыт [показать]
     
     
  • 5.62, аноним3 (?), 02:11, 01/11/2017 [^] [ответить]     [к модератору]  
  • +/
    тор не показатель у меня с белой статики на многих сайтах вылазиет всеравно эта... весь текст скрыт [показать]
     
     
  • 6.85, KhabMan (ok), 17:20, 03/11/2017 [^] [ответить]    [к модератору]  
  • +/
    Держатель всей этой хрени насильно глуп, что его зовут Google
     
  • 4.75, Аноним (-), 15:46, 01/11/2017 [^] [ответить]     [к модератору]  
  • +/
    Никакого совпадения Скрипт пытается определить браузер живого человека по налич... весь текст скрыт [показать]
     
  • 2.46, Аноним (-), 17:58, 31/10/2017 [^] [ответить]    [к модератору]  
  • +/
    на сколько я знаю, гугл платит за распознавание дорожных капч. потому жадные вебмак^w вебмастера лепят их куда попало. могу ошибаться
     
  • 2.84, Аноним (-), 06:20, 03/11/2017 [^] [ответить]     [к модератору]  
  • +/
    статический белый ip спасет отца русской демократии ... весь текст скрыт [показать]
     
  • 1.37, z (??), 16:36, 31/10/2017 [ответить] [показать ветку] [···]    [к модератору]  
  • –2 +/
    >Работа RCN напоминает поведение нейронов в коре головного мозга, одна часть которых осуществляет выделение контуров объектов, а другая занимается изучением поверхности и текстур, сообща решая задачу распознавания образа

    Никто там ничем "обособленным" не занимается, нейроны не действуют сами по себе, а создают нелинейную среду, дающую импульсный отклик на ВСЁ изображение сразу, по типу голограммы - откуда и скорость (мгновенно), и характер распознавания "более похоже" / "менее похоже" в соотвествии с "разрешением" образа, т.е. соотношением сигнал/шум

     
     
  • 2.40, angra (ok), 17:06, 31/10/2017 [^] [ответить]    [к модератору]  
  • +1 +/
    Ну ты бы хоть погуглил про микродвижения глаз при рассмотрении тех или иных изображений, эксперт.
     
  • 2.53, Crazy Alex (ok), 21:07, 31/10/2017 [^] [ответить]    [к модератору]  
  • +/
    Ох ёк, ну и бред
     
  • 1.42, Ващенаглухо (ok), 17:18, 31/10/2017 [ответить] [показать ветку] [···]    [к модератору]  
  • +/
    Скоро капчам придет конец :)
     
  • 1.43, Аноним (-), 17:28, 31/10/2017 [ответить] [показать ветку] [···]    [к модератору]  
  • –1 +/
    когда каконец сделают тест Тьюринга вместо капчи
     
     
  • 2.49, J.L. (?), 18:43, 31/10/2017 [^] [ответить]    [к модератору]  
  • +/
    > когда каконец сделают тест Тьюринга вместо капчи

    вот тогда-то вместо этих глупых заточек под конкретные очень узкие входные данные появится ИИ

     
  • 2.52, angra (ok), 20:55, 31/10/2017 [^] [ответить]    [к модератору]  
  • +/
    Ну ты хоть почитай, что это за тест такой. На редкость идиотская идея.
    Кстати, капча это вариант обратного теста Тьюринга.
     
  • 1.55, Вася (??), 21:18, 31/10/2017 [ответить] [показать ветку] [···]    [к модератору]  
  • +1 +/
    Капча будет настолько изощренной, что кто ее распознает, тот бот
     
     
  • 2.77, Noteme (?), 17:15, 01/11/2017 [^] [ответить]    [к модератору]  
  • +/
    В онлайн играх против ботов использовали невидимые айтемы, которые бот подбирал и тем самым палил себя.
     
  • 1.56, Аноним (-), 21:34, 31/10/2017 [ответить] [показать ветку] [···]    [к модератору]  
  • +/
    Более лютой капчи, чем 3D Captcha, я не встречал. А про знаки и автомобили это для тех, кто наверно не умеет раскладку переключать и букв английских не знает.
     
  • 1.59, ZetaRam (?), 22:18, 31/10/2017 [ответить] [показать ветку] [···]    [к модератору]  
  • +/
    Блин, ну зачем? Оно и так сейчас адъ. Что дальше?! Чтобы достигнуть"я не бот" надо будет станцевать с паспортом перед вебкой? >_< А вообще капчу сделали, чтобы тренировать свои нейросети за бесплатно.
     
     
  • 2.76, Аноним (-), 15:48, 01/11/2017 [^] [ответить]     [к модератору]  
  • +/
    Изначально задача была банально защититься от спама на форумах А вот recaptcha ... весь текст скрыт [показать]
     
  • 1.73, Аноним (-), 12:42, 01/11/2017 [ответить] [показать ветку] [···]    [к модератору]  
  • +/
    Скоро текст капчи будут читать голосом Михалёва, Володарского и других переводчиков. И надо будет угадывать кто это
     
  • 1.87, Аноним (-), 11:05, 05/11/2017 [ответить] [показать ветку] [···]    [к модератору]  
  • +/
    ого - это лучше чем я определяю!
     

     Добавить комментарий
    Имя:
    E-Mail:
    Заголовок:
    Текст:


      Закладки на сайте
      Проследить за страницей
    Created 1996-2018 by Maxim Chirkov  
    ДобавитьПоддержатьВебмастеруГИД  
    Hosting by Ihor