The OpenNET Project / Index page

[ новости /+++ | форум | wiki | теги | ]

Выпуск системы распознавания текста GNU Ocrad 0.29

21.01.2024 08:43

После двух лет разработки сформирован релиз системы распознавания текста Ocrad 0.29 (Optical Character Recognition), развиваемой под эгидой проекта GNU. Ocrad может применяться как в форме библиотеки для интеграции функций OCR в другие приложения, так и в форме обособленной утилиты, которая на основе переданного на вход изображения выдаёт текст в UTF-8 или 8-битных кодировках.

Для оптического распознавания в Ocrad используется метод выделения признаков (feature extraction). В состав входит анализатор макета страницы, позволяющий корректно разделять столбцы и блоки текста в печатных документах. Распознавание поддерживается только для символов из кодировок "ascii", "iso-8859-9" и "iso-8859-15" (поддержка кириллицы отсутствует).

В новой версии:

  • Улучшено распознавание начертания буквы "L" с наклонённой правой частью.
  • При использовании опции '-o' ('--output') обеспечено создание недостающих промежуточных каталогов, указанных в заданном пути к файлу.
  • В сборочный файл configure и в Makefile.in добавлена переменная MAKEINFO.
  • Диагностические сообщения, связанные с файловыми операциями, преобразованы в форму 'PROGRAM: FILE: MESSAGE'.
  • В сообщениях об использовании некорректных аргументов командной строки обеспечен показ аргумента и имени опции.


  1. Главная ссылка к новости (https://www.mail-archive.com/i...)
  2. OpenNews: Релиз системы распознавания текста Tesseract 5.3.4
  3. OpenNews: В Firefox тестируют возможность распознавания текста на изображениях
  4. OpenNews: Выпуск системы распознавания текста GNU Ocrad 0.28
  5. OpenNews: Новая система оптического распознавания текста EasyOCR
  6. OpenNews: Релиз системы распознавания текстов Cuneiform 1.1.0
Лицензия: CC BY 3.0
Короткая ссылка: https://opennet.ru/60471-ocrad
Ключевые слова: ocrad, ocr
При перепечатке указание ссылки на opennet.ru обязательно


Обсуждение (52) Ajax | 1 уровень | Линейный | +/- | Раскрыть всё | RSS
  • 1.5, Аноним (5), 10:10, 21/01/2024 [ответить] [﹢﹢﹢] [ · · · ]  
  • –5 +/
    OCR-ок тьма тьмущая, зачем нужно это поделие от гну? что бы было?
     
     
  • 2.11, Аноним (11), 10:43, 21/01/2024 [^] [^^] [^^^] [ответить]  
  • +4 +/
    Да чтобы было именно свободное от гну. При этом она существует так давно что программа может быть даже памятником.
     
     
  • 3.17, хрю (?), 11:24, 21/01/2024 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Чего в ней старого - 2003 год? Даже cuneiform намного старше. Да и другие распозновалки как минимум базируются на намного более старом коде/продуктах.
     
     
  • 4.38, Аноним (11), 13:12, 21/01/2024 [^] [^^] [^^^] [ответить]  
  • +2 +/
    21 год прошел если что.
     
  • 2.18, хрю (?), 11:26, 21/01/2024 [^] [^^] [^^^] [ответить]  
  • +3 +/
    >> зачем нужно это поделие от гну?

    Одному челу интересно он и тащит. Большого смысла в ней нет - она проигрывает вообще всем распозновалкам.

     
  • 2.53, Аноним (53), 15:18, 21/01/2024 [^] [^^] [^^^] [ответить]  
  • +1 +/
    > OCR-ок тьма тьмущая, зачем нужно это поделие от гну? чтобы было?

    другие OCRы читают для людей, а эту читают люди для интереса или ознакомления или прокачки навыков.
    это создаст больше людей, которые создадут больше OCRов.

     
     
  • 3.54, Аноним (53), 15:21, 21/01/2024 [^] [^^] [^^^] [ответить]  
  • +3 +/
    возможно, ИИ существует дольше, чем люди думают, и уже давно вступил в симбиоз с человечеством, и размножается через гну.
     
     
  • 4.56, Аноним (53), 15:22, 21/01/2024 [^] [^^] [^^^] [ответить]  
  • +1 +/
    поэтому попытки понять код проектов гну можно смело назвать гнусным сэксом.
     
  • 3.58, Аноним (58), 15:47, 21/01/2024 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Сомневаюсь, что тут можно какие-то навыки прокачать, если только навык отсидки жопочасов. Я глянул код - такое ощущение, что чел писал калькулятор, а потом решил переделать в оцр.
     
     
  • 4.88, Axel (??), 21:28, 21/01/2024 [^] [^^] [^^^] [ответить]  
  • +/
    На чем написано, а то качать лень
     

  • 1.8, Аноним (8), 10:18, 21/01/2024 [ответить] [﹢﹢﹢] [ · · · ]  
  • +2 +/
    Для распознавания, вроде, есть и Tesseract и OpenCV с плагинами, которые помимо feature extraction поддерживают другие способы (включая нейросети). Ну и поддержка кириллицы там есть. Сабж чем-то примечателен, кроме лицензии?
     
  • 1.14, Аноним (-), 11:03, 21/01/2024 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Очередное поделие гну - вроде хурда, Health, Cash и тд. - которое существует только потому что... а вот хз вообще почему.

    Распознавать всего 3 (три) кодировки в 2024м. Ну это однозначно успех!
    Не поддерживать кириллицу. Ну, может сейчас это не модно, но оно и раньше не поддерживало. Хотя кириллических языков намного больше чем один.
    Про поддержку иероглифической письменности можно даже не заикаться...

    Сабж проигрывает Тессеракту по всем фронтам.
    В том числе по лицензии.

     
     
  • 2.19, Аноним (19), 11:27, 21/01/2024 [^] [^^] [^^^] [ответить]  
  • +/
    Да деньги на этом пилятся, вот и всё Смотри, как это работает Столлман едет в ... большой текст свёрнут, показать
     
     
  • 3.25, beck (??), 12:18, 21/01/2024 [^] [^^] [^^^] [ответить]  
  • +/
    А мог бы просто быть программистом...
     
     
  • 4.93, adolfus (ok), 15:46, 23/01/2024 [^] [^^] [^^^] [ответить]  
  • +/
    Придурок, этот человек  написал gcc и gdb, если знаешь, что этот такое.
     
  • 3.29, Аноним (29), 12:38, 21/01/2024 [^] [^^] [^^^] [ответить]  
  • +2 +/
    Фантазируй, хотя бы, реалистичнее. Университеты сами рады лишний грант/донат выбить. Не то, чтобы кому бы то их на сторону отдавать.
     
     
  • 4.32, Аноним (19), 12:53, 21/01/2024 [^] [^^] [^^^] [ответить]  
  • +2 +/
    Ты не сечешь как работает госуха) Чтобы в следующем году тебе дали норм финансирование - ты должен в этом потратить деньги) Иначе в следующем дадут меньше. Потратить заплатив себе зарплату ты не можешь, поэтому есть миллионы грантов на развитие очередной никому ненужной хрени, которые универы выдают вот таким Столлманам. Ричард в этой среде провел всю жизнь (он ни дня не работал в бизнесе), поэтому умеет зарабатывать токо так)
     
  • 4.59, Аноним (58), 15:51, 21/01/2024 [^] [^^] [^^^] [ответить]  
  • +/
    А ты думаешь в остальном мире что-то сильно по-другому? Там политики и лентяи какие-то другие, прилетели с Марса и какают радугой? Нет, родной, люди примерно одинаково устроены.
     
  • 3.71, Аноним (71), 17:16, 21/01/2024 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Твои фантазии. А в реальности M$ за очень дорого проталкивает Шиндошс везде, где может. Через откаты чинушам. А где не может, там закупы сами придумывают, как бы лизнуть такой импортной, но такой родной американской конторе.
     
  • 2.69, fuggy (ok), 17:00, 21/01/2024 [^] [^^] [^^^] [ответить]  
  • –1 +/
    GnuHealth пользуются в развивающихся странах. GnuCash может использоваться мелким бизнесом. Так что это не программа ради самой программы.
    Тоже самое, если ты не книгопечатник или архитектор, то тебе не нужно покупать MS Office и Adobe Photoshop, если тебе лишь нужно написать объявление или курсовую, достаточно LibreOffice и Gimp.
     
     
  • 3.74, Аноним (-), 17:48, 21/01/2024 [^] [^^] [^^^] [ответить]  
  • –2 +/
    > GnuHealth пользуются в развивающихся странах.

    А еще в развивающихся странах низкие требования к качеству еды, технике безопасности и транспорту.
    Но это от бедности. Думаю когда они станут по-богаче, то перейдут на более качественные системы.

    > тебе не нужно покупать MS Office

    До момента когда в твоем файле из опенофиса полезет верстка при открытии в ворде.
    К сожалению офис это лидер, и нужно быть как минимум не хуже.

     
     
  • 4.82, fuggy (ok), 19:50, 21/01/2024 [^] [^^] [^^^] [ответить]  
  • +/
    А там что не люди живут или им не нужно медицинскую помощь. Система работает что ещё надо.

    Такой же лидер, как и Windows, для тех кто готов платить сотни денег. Обратное тоже верно. При открытии ворд файла в LibreOffice тоже может ползти. Ты вообще MS формат файлов видел? Сотни костылей со времён Lotus Software. До сих пор присутствует баг 1900 года. Доходит до того что новый эксель хуже открывает 97 формат, чем другие офисы.

     
     
  • 5.84, Аноним (-), 20:05, 21/01/2024 [^] [^^] [^^^] [ответить]  
  • +/
    > А там что не люди живут или им не нужно медицинскую помощь. Система работает что ещё надо.

    Еще раз. Люди им пользуются от бедности.
    Жигули тоже ездили. Некоторые даже называли их автомобилем.
    А потом, как только появилась возможность, сменили свое зубило, ласточку или космич на иномарку.

    > При открытии ворд файла в LibreOffice тоже может ползти.

    Вот только это мало кого будет волновать, если у ворда подавляющее большинство.

     
  • 5.85, Аноним (-), 20:11, 21/01/2024 [^] [^^] [^^^] [ответить]  
  • +/
    У работает есть множество градаций Какова надежность Какая необходимость в о... большой текст свёрнут, показать
     
     
  • 6.86, fuggy (ok), 20:39, 21/01/2024 [^] [^^] [^^^] [ответить]  
  • +/
    > Если 95% вайлов - ворд, то всем как-то пофиг что odt файлы ползут.

    А как же импортозамещение. Дело привычки.

    > Была только пара случаев когда были проблемы с обратной совместимостью.

    Проблемы не с обратной совместимостью, проблемы сейчас, когда пишешь mar1 или 1/1, он придумывает рандомную дату. Из-за этого портятся научные данные. Так что это как раз LibreOffice работает предсказуемо.
    Если тебе надо объявление или курсовую распечатать ты будешь покупать "профессиональную" систему за 70 долларов в год? Если тебе нужно огород вскопать, ты будешь покупать экскаватор и нанимать людей на рынке, которые умеют с ним работать или просто возьмёшь лопату?

     
     
  • 7.90, Аноним (-), 22:35, 21/01/2024 [^] [^^] [^^^] [ответить]  
  • +/
    > импортозамещение

    оказалось фикцией

    > Из-за этого портятся научные данные.

    Потому что нефиг проводить научные вычисления инструментом для них не предназначенным!

    > Так что это как раз LibreOffice работает предсказуемо.

    Вот когда он перестанет загибаться на не таком уж большом кол-ве формул - тогда и поговорим))
    Я уже молчу про макросы.

    > Если тебе надо объявление или курсовую распечатать ты будешь покупать "профессиональную" систему за 70 долларов в год?

    Почему в год? Он стоит $159.99 без подписки. И его стоимость вполне нормальная для написания курсовых/дипломных работ за 4-6 лет обучения. Да и никакой ворд не профессиональный.

     
  • 3.75, Аноним (75), 18:25, 21/01/2024 [^] [^^] [^^^] [ответить]  
  • +/
    Ты глянь список внедрений гнухелс - там какие-то сельские поликлиники в глубинке Конго. И вообще не факт, что это - правда. Никто ж не проверит никогда. Ну ладно, допустим. Гнукэш и малый бизнес - это крайне смешно. Попробуй сдать отчётность гнукешем, потом вместе с налоговой поржете.
     
     
  • 4.78, Аноним (78), 19:27, 21/01/2024 [^] [^^] [^^^] [ответить]  
  • +/
    Получается, все прикладные приложения от GNU - лютый шлак?
     
  • 3.91, Бывалый смузихлёб (?), 09:54, 22/01/2024 [^] [^^] [^^^] [ответить]  
  • +/
    > GnuHealth пользуются в развивающихся странах. GnuCash может использоваться мелким бизнесом

    Чем и то и другое лучше листка в клеточку, блокнота или амбарной книги ?
    Смысл систем учёта финансов( для бузинеса ) - в возможности нормальной сдачи отчётности в ту же налоговую. Гнутым Кэшем этого не сделать.
    В электронном виде посредством него тоже отчётность в налоговую не отослать( из бесплатных есть разве что Налогоплательщик ЮЛ )

    По фотошопу и офису - отчасти, соглашусь. Жаль, правда, не все вообще понимают что потом делать с форматом одт. Но у той же либры вроде бы и в другие форматы можно сохранять
    Заместо фотошопа уже много лет отлично справляется Крита

     
  • 2.87, Kuromi (ok), 20:47, 21/01/2024 [^] [^^] [^^^] [ответить]  
  • +1 +/
    "Распознавать всего 3 (три) кодировки в 2024м. Ну это однозначно успех! "

    Ты наверное никогда не слышал американского термина "Rest Other World". Проект чисто latin\американо центричный. Проблемы так называемых "sand\ramen\borscht-ni**ers" их не волнуют. Не надо, мол, использовать неправильный алфавит.

     
     
  • 3.89, anonymous (??), 22:26, 21/01/2024 [^] [^^] [^^^] [ответить]  
  • +1 +/
    MGIMO finished ?
     

  • 1.21, Аноним (21), 11:42, 21/01/2024 [ответить] [﹢﹢﹢] [ · · · ]  
  • +1 +/
    То есть реальное изменение одно: «Улучшено распознавание начертания буквы "L" с наклонённой правой частью.»
     
     
  • 2.34, Аноним (34), 12:58, 21/01/2024 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Подобное изменение позорит проект. Выгбядит так, как будто там сидят программисты и для каждой буквы классификатор вручную пишут.
     
     
  • 3.37, Аноним (58), 13:08, 21/01/2024 [^] [^^] [^^^] [ответить]  
  • +2 +/
    Слушай, похоже так и есть. Я немношк посмотрел исходники - OCR в 24 году так не пишут. Блин, даже в 90х так не писали.
     
     
  • 4.43, Аноним (78), 13:44, 21/01/2024 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Ну а что ты хочешь забесплатно? И качество кода такое. Это узкоспециализрованный софт, cuneiform денежку требует.
     
     
  • 5.64, Ю.Т. (?), 16:17, 21/01/2024 [^] [^^] [^^^] [ответить]  
  • +/
    cuneiform разве не свободный?
     
     
  • 6.72, soarin (ok), 17:30, 21/01/2024 [^] [^^] [^^^] [ответить]  
  • +/
    бесплатный, открытый (BSD-образная лицензия), заброшенный
     
  • 5.70, namenotfound (?), 17:00, 21/01/2024 [^] [^^] [^^^] [ответить]  
  • +/
    гугловский tesseract бесплатен и выпущен под apache
     
     
  • 6.79, Аноним (78), 19:29, 21/01/2024 [^] [^^] [^^^] [ответить]  
  • +/
    ну это на бабки гугла он пишется, на деньги корпораций, не будет бабок от гугла - завтра же он станет усыхать
     
     
  • 7.83, Аноним (-), 19:56, 21/01/2024 [^] [^^] [^^^] [ответить]  
  • +/
    И? Сейчас оно работает? Работает
    Оно лучше работает чем ocrad? Лучше.

    Даже если оно начнет усыхать:
    - хуже чем было оно уже не станет
    - этот процесс займет какое-то время и, подозреваю, что совсем не маленькое
    - почему бы не воспользоваться вещью, за которой гугел уже заплатил))

     
  • 7.92, namenotfound (?), 18:11, 22/01/2024 [^] [^^] [^^^] [ответить]  
  • +/
    > ну это на бабки гугла он пишется, на деньги корпораций, не будет
    > бабок от гугла - завтра же он станет усыхать

    и что? в худшем случае они тупо снимут его с публичного доступа

     
  • 3.49, iPony129412 (?), 14:53, 21/01/2024 [^] [^^] [^^^] [ответить]  
  • +/
    Кто сказал что программисты (а не один) и сидят?
    Я не нашёл нормальной истории коммитов
    Но такое ощущение, что там около один и по пару часов в месяц делает в свободное время как хобби.
     
     
  • 4.62, Аноним (58), 15:58, 21/01/2024 [^] [^^] [^^^] [ответить]  
  • +/
    Теория про Васю и университетский откат начинает приобретать очертания кек
     
     
  • 5.63, Аноним (-), 16:03, 21/01/2024 [^] [^^] [^^^] [ответить]  
  • +/
    Только Вася каждый раз новый, потому что senior project сам себя не напишет.
     
  • 2.35, Аноним (-), 12:58, 21/01/2024 [^] [^^] [^^^] [ответить]  
  • +/
    Предыдущая версия вышла 2022-01-17. Т.е. прошло всего два года.
    Это достойное улучшение и скорость разработки вполне соответствует другим проектам FSF.
     
     
  • 3.39, Аноним (11), 13:14, 21/01/2024 [^] [^^] [^^^] [ответить]  
  • +/
    Можно подумать там много программистов, кто-то увидел поправил и выкатил. Пошел на работу.
     
  • 2.40, ИмяХ (ok), 13:21, 21/01/2024 [^] [^^] [^^^] [ответить]  
  • +/
    Для какой нибудь хромозиллы это было бы весомым поводом выпустить мажорный релиз
     
     
  • 3.42, Аноним (-), 13:33, 21/01/2024 [^] [^^] [^^^] [ответить]  
  • +/
    За два года разработки?))
    Плюс хромозилой в сумме пользуется больше 1 лярда людей. А этим... даже не уверен что вообще кто-то.
     
  • 2.66, fuggy (ok), 16:26, 21/01/2024 [^] [^^] [^^^] [ответить]  
  • +/
    Потому что разработано в те времена, а не вот эти ваши нейросети. Где вместо улучшено распознавание буквы "L":
    "Слышь, у нас букву L плохо распознаёт. Что делаем?
    - Давай переобучим нейросеть.
    - А что в чейджлоге написать?
    - Напиши улучшено распознавание. А что именно улучшено, даже мы сами не знаем."

    Также и в другой сфере. Взять например компьютерные шахматные движки. В 90е и 00е именно так и делали. Писали возможные ходы, придумывали эвристики, функции оценки, оптимизировали всё это альфа-бета минмакс. А потом пришли нейросети, где достаточно 1000 часов играть с самим собой и вырвались вперёд. А потом говорить что эти деды улучшили оценку значимости пешки, а нейросети всё равно побеждают. Взять например, шахматный движок Ботвинника, чемпиона мира, чемпиона СССР, доктора технических наук. Много лет пытался написать шахматный движок, но неудачно. В итоге движок чемпиона мира и математика проигрывает бездуховным нейросетям. Говорит ли это о том что 1 программа плохая? Нет.

     
     
  • 3.73, Нукак Так (?), 17:44, 21/01/2024 [^] [^^] [^^^] [ответить]  
  • +/
    Вообще-то распознавание определено инстутициально в забвенный сток автоопределением. 4 из 5 современных приложения четко следуют прописным алгоритмам внесистемных тербований, что сказывается на обновляемых картах ячеек.
     
  • 3.76, Аноним (75), 18:35, 21/01/2024 [^] [^^] [^^^] [ответить]  
  • +/
    Не сравнивай шахматные движки и распознавание образов. Алгоритмы там принципиально разные и шахматы сложнее.
     

  • 1.81, Аноним (81), 19:32, 21/01/2024 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Хорошая идея. Надо из своего проекта выбросить

    > "ascii", "iso-8859-9" и "iso-8859-15"

     

     Добавить комментарий
    Имя:
    E-Mail:
    Текст:



    Партнёры:
    PostgresPro
    Inferno Solutions
    Hosting by Hoster.ru
    Хостинг:

    Закладки на сайте
    Проследить за страницей
    Created 1996-2024 by Maxim Chirkov
    Добавить, Поддержать, Вебмастеру