The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

форумы  помощь  поиск  регистрация  майллист  ВХОД  слежка  RSS
"Адаптация под русский спам и тюнинг скорости в SpamAssassin"
Вариант для распечатки  
Пред. тема | След. тема 
Форумы Скрипты, настройки и файлы конфигурации. (Public)
Изначальное сообщение [Проследить за развитием треда]

"Адаптация под русский спам и тюнинг скорости в SpamAssassin" 
Сообщение от tim Искать по авторуВ закладки(??) on 29-Сен-04, 09:04  (MSK)
Хотелось бы обменятся опытом по настройке SpamAssassin.
Особенно интересуют темы оптимизации скорости работы и улучшения блокирования русскоязычного спама.

Вот мои текущие настройки:

# Допустимость русских букв
ok_languages en ru uk
ok_locales en ru

# Запретим RBL, который слишком много времени проверяет
skip_rbl_checks 1

# 2.7 - значение по умолчанию.
score SUBJ_ILLEGAL_CHARS 2.0
# 0.1
score MIME_HTML_ONLY 1.5
# 0.0
score HTML_MESSAGE 0.1
# 1.2
score MIME_HTML_MOSTLY 2.0
# 1.1
score FORGED_OUTLOOK_TAGS 1.8
# 2.0
score SUBJ_ILLEGAL_CHARS 1.5
# 4.3
score FROM_ILLEGAL_CHARS 3.0
# 0.1
score HTML_FONTCOLOR_RED 0.5

score HTML_FONTCOLOR_UNSAFE 1.0
score FROM_STARTS_WITH_NUMS 1.0

  Правка | Высказать мнение | Ответить | Рекомендовать в FAQ | Cообщить модератору | Наверх

 Оглавление

Индекс форумов | Темы | Пред. тема | След. тема
Сообщения по теме

1. "Адаптация под русский спам и тюнинг скорости в SpamAssassin" 
Сообщение от _KAV_ Искать по авторуВ закладки(ok) on 01-Окт-04, 10:26  (MSK)
>Хотелось бы обменятся опытом по настройке SpamAssassin.
>Особенно интересуют темы оптимизации скорости работы и улучшения блокирования русскоязычного спама.
># Допустимость русских букв
>ok_languages en ru uk
>ok_locales en ru
Эх... сколько народу ставит в локалях всякую фигню или вообще не ставит... Пришлось отключить.
А прочее - у меня упор на байесовскую оценку, только снижен порог autolearn до 7

  Удалить Правка | Высказать мнение | Ответить | Рекомендовать в FAQ | Cообщить модератору | Наверх

2. "Адаптация под русский спам и тюнинг скорости в SpamAssassin" 
Сообщение от uldus Искать по авторуВ закладки(ok) on 19-Окт-04, 22:44  (MSK)
В старых версиях SpamAssassin была полезная опция timelog_path для обнаружения узких мест по скорости, где-то после 2.60 ее убрали. Там была утечка памяти, вместо ее устранения просто вырезали весь timelog код :-(

Остается тестировать при помощи --lint и смотреть --debug. Чтобы убедится, что торможение не из-за сети можно запустить с опцией -L.

  Удалить Правка | Высказать мнение | Ответить | Рекомендовать в FAQ | Cообщить модератору | Наверх

3. "мои настройки" 
Сообщение от Nickolay Искать по авторуВ закладки(??) on 21-Окт-04, 15:32  (MSK)
я упор делаю на Байеса и автообучение - делаю общую для всех базу:
auto_learn 1
use_bayes 1
bayes_path /etc/mail/spamassassin/bayes/bayes
bayes_file_mode 0666
bayes_auto_learn_threshold_nonspam 0.3
bayes_auto_learn_threshold_spam 12.0
bayes_auto_learn 1

обнулил те проверки, по которым сильно много русскоязычных писем ошибочно попадали как спам:
score SUBJ_FULL_OF_8BITS        0
score FROM_ILLEGAL_CHARS        0
score SUBJ_ILLEGAL_CHARS        0
score HEAD_ILLEGAL_CHARS        0
score HABEAS_SWE                0
score FORGED_IMS_TAGS           1

плюс, там где нельзя ошибаться пользуюсь:
whitelist_to  
whitelist_from

ну и отдельно - это файлик для отлова проходящего отечественного спама:
то что пролезло - ищу слово, которое есть во всех однотипных письмах(семинар такой-то) и оставляю на неделю-другую. дальше эти письма отлавливаются по Байесу.

p.s. еще выкачал с сайта асасина следующие правила, для отловли всяких виагр и прочей иностранной лабуды.:
99_FVGT_Tripwire.cf
antidrug.cf
backhair.cf
bigevil.cf
chickenpox.cf
evilnumbers.cf
tripwire.cf
weeds2.cf

  Удалить Правка | Высказать мнение | Ответить | Рекомендовать в FAQ | Cообщить модератору | Наверх

4. "мои настройки" 
Сообщение от Givich emailИскать по авторуВ закладки(??) on 01-Июн-05, 14:19  (MSK)
>
>ну и отдельно - это файлик для отлова проходящего отечественного спама:
>то что пролезло - ищу слово, которое есть во всех однотипных письмах(семинар
>такой-то) и оставляю на неделю-другую. дальше эти письма отлавливаются по Байесу.

Объясни поподробнее, как. А то сейчас большинство спама в Unicode чешет, и вычлинить из тела письма нужную фразу трудновато. И какие именно правила для этого используешь

  Удалить Правка | Высказать мнение | Ответить | Рекомендовать в FAQ | Cообщить модератору | Наверх


Архив | Удалить

Индекс форумов | Темы | Пред. тема | След. тема
Оцените тред (1=ужас, 5=супер)? [ 1 | 2 | 3 | 4 | 5 ]
Пожалуйста, прежде чем написать сообщение, ознакомьтесь с данными рекомендациями.




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру