The OpenNET Project / Index page

[ новости /+++ | форум | wiki | теги | ]

TextCat - implementation of the text categorization algorithm

Дата
15 Sep 2004
ЗаголовокTextCat - implementation of the text categorization algorithm
ПояснениеРеализация алгоритма "N-Gram-Based Text Categorization" (на Perl) статистического анализа текста для автоматического определения языка на котором написан текст (для русского языка производится также определение кодировки).
  • Статья отражающая суть алгоритма (на русском языке).
  • Home URLhttp://odur.let.rug.nl/~vannoord/TextCat/
    Флагrussian
    РазделПолезные Perl модули.
    Преобразование из одной кодировки в другую
    Ключи

     Добавить ссылку
     
     Поиск ссылки (regex):
     

    Последние заметки
    - 25.07 Создание программ под SynapseOS
    - 24.07 Случайная задержка в shell-скрипте, выполняемом из crontab (без башизмов)
    - 03.07 Выборочное туннелирование сайтов через WireGuard
    - 19.05 Настройка шрифтов для консоли и терминала
    - 26.02 Тестирование хелловорлда под 17 платформ одним скриптом
    - 23.02 Скрипт для конвертации архива gz в lzma
    - 06.12 Сравнение методов исключения разработки на JavaScript для веб технологий
    - 30.11 Отправка логов из kubernetes в clickhouse
    - 03.11 Linux окружение noroot в Android-смартфоне собственными руками.
    - 02.11 Борьба с троллингом на opennet.ru при помощи uBlock Origin
    RSS | Следующие 15 записей >>




    Спонсоры:
    PostgresPro
    Inferno Solutions
    Hosting by Hoster.ru
    Хостинг:

    Закладки на сайте
    Проследить за страницей
    Created 1996-2022 by Maxim Chirkov
    Добавить, Поддержать, Вебмастеру