Несколько дней назад наткнулся на три подряд «невводимые» картинки от Рекапчи (это сервис, который использует базу отсканированных книг для того, чтобы показывать кусочки, которые не смогли распознать роботы, людям, в качестве защиты от спама; сейчас Рекапча принадлежит Гуглу).
Вспомнил, что это не первый раз, и тенденция вырисовывается мрачная. Решил пособирать немного материал, чтобы понять, насколько всё запущено. Поехали.
Первые две — чемпионы по непроходимости.
Дальше проще, и хотя бы читается, но путь преграждает не менее надёжно. Ни один робот не пройдёт (человек тоже). - × × ×
В Рекапче всегда достаточно ввести правильно одно из двух слов (но неизвестно, какое). Потому что одно слово используется, чтобы отличать людей от роботов, а другое - чтобы накапливать статистику по новым словам. Так что они все проходимы. - Vyacheslav Matyukhin
Интересно, спасибо, про одно из двух слов не знал. У меня иногда бывало так, что даже оба введенных не засчитывались. - × × ×
как-то попадалась рекапча с математическим выражением с интегралом, которая как бы намекала: "реши дифур! реши дифур, неуч!" - Ваш Танерада
Но ведь, я так понимаю, всегда можно отличить сгенерированное компьютером бессмысленное слово от слова из скана. У первого слегка aliased и более искажённая графика, и всегда алфавит всегда латинский. У второго обычно типографский вид и наличествует смысл :) Или там что-то глубже? - mindszenty
Нет никакого "сгенерированного" слова. Главная задача Рекапчи - распознавать тексты, то, что оно еще и капча - вторично :) Одно из двух слов более читаемо именно потому, что оно уже распознано, а плохие вторые слова так часто попадаются потому, для них у алгоритма никак не получается собрать репрезентативную статистику. - Vyacheslav Matyukhin
Там, все же, хорошо видны несуществующие слова из капчегенератора, но да, они не всегда замешиваются. - × × ×