URL: https://www.opennet.ru/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID3
Нить номер: 36724
[ Назад ]

Исходное сообщение
"OpenNews: Вычисление спама в графических файлах средствами SpamAssassin"

Отправлено opennews , 16-Фев-07 15:37 
В статье "Fight Image Spam With FuzzyOCR And SpamAssassin On Debian/Ubuntu (http://www.howtoforge.com/fight_image_spam_with_fuzzyocr_spa...)" рассказывается об интересном плагине к SpamAssassin - FuzzyOCR (http://www.fuzzyocr.net/), способном анализировать текст во вложенных картингах. Блокировка происходит если на картинке обнаружено одно из слов занесенных в черный список.

URL: http://www.howtoforge.com/fight_image_spam_with_fuzzyocr_spa...
Новость: http://www.opennet.ru/opennews/art.shtml?num=9869


Содержание

Сообщения в этом обсуждении
"Вычисление спама в графических файлах средствами SpamAssassin"
Отправлено Nagios , 16-Фев-07 15:42 
кто проверял ужо, али нет еще?

"Вычисление спама в графических файлах средствами SpamAssassi..."
Отправлено dukie , 16-Фев-07 15:58 
Уже пол года почти молотит без проблем, при достаточно большой нагрузке.
Пришлось правда его помягче настроить. При дефолтовых установках было много ложных срабатываний.

"Вычисление спама в графических файлах средствами SpamAssassi..."
Отправлено McLaud , 16-Фев-07 16:21 
+1

"Вычисление спама в графических файлах средствами SpamAssassi..."
Отправлено aim , 19-Фев-07 13:18 
а каких ресурсов он требует?

"Вычисление спама в графических файлах средствами SpamAssassin"
Отправлено soko1 , 16-Фев-07 17:41 
до чего прогресс дошел! обязательно прикручу эту вещь у себя на первой работе:)

"Вычисление спама в графических файлах средствами SpamAssassin"
Отправлено Роман , 16-Фев-07 18:42 
работает. не нагружает систему. gocr собрался без проблем. набил базу слов для поиска в картинках. все довольны

"Вычисление спама в графических файлах средствами SpamAssassin"
Отправлено Аноним , 16-Фев-07 22:05 
а если текст набран под кглом или разными шрифтами, ловит?

"Вычисление спама в графических файлах средствами SpamAssassi..."
Отправлено Роман , 17-Фев-07 09:54 
то, что распознает gocr. а кому нужен спам с перевернутым текстом? :)

"Вычисление спама в графических файлах средствами SpamAssassin"
Отправлено Суслик , 17-Фев-07 00:13 
ААААА - он в Генте в портах есть ! Ураа! генточка хорошая

"Вычисление спама в графических файлах средствами SpamAssassi..."
Отправлено sy , 17-Фев-07 08:11 
+1 Я тоже рад!

"Вычисление спама в графических файлах средствами SpamAssassin"
Отправлено spiner , 19-Фев-07 11:37 
пприкрутил. работает. только косяк в ocrad. у меня gentoo. ocrad там версии 0.10 и
при работе FuzzyOCR требуется выполнение команды ocrad -s. Такой ключ не поддерживается ocrad. Удалил ocrad. Все равно работает.

"Вычисление спама в графических файлах средствами SpamAssassin"
Отправлено tagore , 20-Фев-07 12:19 
http://fxp0.org.ua/2006/sep/27/setup-fuzzyocr-plugin-spamass...

"OpenNews: Вычисление спама в графических файлах средствами S..."
Отправлено lamer , 27-Фев-07 01:46 
>В статье "Fight Image Spam With FuzzyOCR And SpamAssassin On Debian/Ubuntu
А потом придут подлые спамеры и поломают этой штукoй Captcha-и на сайтах :(



"OpenNews: Вычисление спама в графических файлах средствами S..."
Отправлено igorka , 12-Мрт-07 09:03 
Стравнно как-то работает FuzzyOCR среди успешно обработанных писем встречаются такие, что не отмечены в заголовке FuzzyOCR-ом. Такое впечатление, что он либо не успевает обрабатывать поток писем, либо иногда падает и сам поднимается!

"OpenNews: Вычисление спама в графических файлах средствами S..."
Отправлено toor99 , 17-Мрт-07 09:08 
> Такое впечатление, что он либо не успевает обрабатывать поток
> писем, либо иногда падает и сам поднимается!
Мне кажется, он не падает и поднимается, а просто запускается на каждое письмо отдельно. Судя по логам, по крайней мере. Что быстродействия ему, само собой, не прибавляет. А вообще, штука очень классная... мне нравится.

"OpenNews: Вычисление спама в графических файлах средствами S..."
Отправлено igorka , 19-Мрт-07 11:57 
>> Такое впечатление, что он либо не успевает обрабатывать поток
>> писем, либо иногда падает и сам поднимается!
>Мне кажется, он не падает и поднимается, а просто запускается на каждое
>письмо отдельно. Судя по логам, по крайней мере. Что быстродействия ему,
>само собой, не прибавляет. А вообще, штука очень классная... мне нравится.
>

Оказалось - это не баг, а фича! fuzzy запускается в последнюю очередь, если письмо не признано спамом. Типа для ресурсосбережения!