The OpenNET Project / Index page

[ новости/++ | форум | wiki | теги | ]

Полезные лингвистические Perl модули, преобразование и определение кодировки

Дата
22 Dec 2003
ЗаголовокПолезные лингвистические Perl модули, преобразование и определение кодировки
Пояснение
  • Lingua::Ispell - проверка орфографии;
  • Lingua::Ident - автоопределение языка по отрывку текста;
  • Lingua::Num2Word - преобразование цифр в буквенное написание;
  • Lingua::RU::Number - буквенное написание денежной суммы (в рублях);
  • Lingua::RU::PhTranslit - преобразование текста в правильный транслит или другую русскую кодировку;
  • Lingua::DetectCharset, Lingua::DetectCyrillic - определение русской кодировки по отрывку текста;
  • PerlIO::locale - прозрачное перекодирование текста при чтении и записи в файл;
  • Convert::Cyrillic - преобразование из одной кодировки в другую (включая поддержку UTF-8);
  • Snowball Stemmer - работа с русскими словарными формами (стемминг, выделение корня убирая суффиксы и окончания). perl интерфейс (для стеммера любого языка) - "Lingua::Stem::Snowball".
  • В сети так-же доступны исходные тексты стеммера от Andrew Kovalenko, см. так же статью Вероятностный морфологический анализатор русского и украинского языков.
  • Home URLhttp://search.cpan.org/
    Флагenglish
    Обновление26 Mar 2013
    Стаб. вер.5.16.3
    РазделПолезные Perl модули.
    Ключи



     Добавить ссылку
     
     Поиск ссылки (regex):
     

    Последние заметки
    - 05.07 Как получать ответы на вопросы по программированию прямо из командной строки или редактора
    - 11.06 Формирование минималистичного окружения GNOME, очищенного от излишеств
    - 09.06 Использование SystemTap для расшифровки локального HTTPS-трафика
    - 17.05 Sonatype Nexus как Maven proxy
    - 11.05 Как автоматически отключить закреплённые шапки на сайтах в Firefox
    - 22.04 Кодирование видео при помощи GPU из файла, запись с экрана и стриминг
    - 15.04 Организация шифрованного доступа к DNS-серверу BIND (DNS-over-TLS) при помощи nginx
    - 14.04 Включение DNS-Over-TLS в LEDE/OpenWrt через замену резолвера на Unbound
    - 12.04 Трассировка обмена данными через Unix domain socket
    - 04.04 Выбор метода обмена ключами с при подключении по ssh к Cisco ASA
    RSS | Следующие 15 записей >>



      Закладки на сайте
      Проследить за страницей
    Created 1996-2017 by Maxim Chirkov  
    ДобавитьРекламаВебмастеруГИД  
    Hosting by Ihor