[
новости
/
+++
|
форум
|
wiki
|
теги
|
]
TextCat - implementation of the text categorization algorithm
Дата
15 Sep 2004
[
исправить
]
Заголовок
TextCat - implementation of the text categorization algorithm
Пояснение
Реализация алгоритма "N-Gram-Based Text Categorization" (на Perl) статистического анализа текста для автоматического определения языка на котором написан текст (для русского языка производится также определение кодировки).
Статья отражающая суть алгоритма
(на русском языке).
Home URL
http://odur.let.rug.nl/~vannoord/TextCat/
Флаг
russian
Раздел
Полезные Perl модули.
Преобразование из одной кодировки в другую
Ключи
rus
,
codepage
,
language
, (
найти похожие документы
)
Добавить ссылку
Поиск ссылки (
regex
):
Последние заметки
-
25.07
Создание программ под SynapseOS
-
24.07
Случайная задержка в shell-скрипте, выполняемом из crontab (без башизмов)
-
03.07
Выборочное туннелирование сайтов через WireGuard
-
19.05
Настройка шрифтов для консоли и терминала
-
26.02
Тестирование хелловорлда под 17 платформ одним скриптом
-
23.02
Скрипт для конвертации архива gz в lzma
-
06.12
Сравнение методов исключения разработки на JavaScript для веб технологий
-
30.11
Отправка логов из kubernetes в clickhouse
-
03.11
Linux окружение noroot в Android-смартфоне собственными руками.
-
02.11
Борьба с троллингом на opennet.ru при помощи uBlock Origin
RSS
|
Следующие 15 записей >>
Спонсоры:
Хостинг:
Закладки на сайте
Проследить за страницей
Created 1996-2022 by
Maxim Chirkov
Добавить
,
Поддержать
,
Вебмастеру