URL: https://www.opennet.ru/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID3
Нить номер: 132624
[ Назад ]

Исходное сообщение
"Выпуск системы распознавания текста GNU Ocrad 0.29"

Отправлено opennews , 21-Янв-24 08:59 
После двух лет разработки сформирован релиз системы распознавания текста Ocrad 0.29 (Optical Character Recognition), развиваемой под эгидой проекта GNU. Ocrad может применяться как в форме библиотеки для интеграции функций OCR в другие приложения, так и в форме обособленной утилиты, которая на основе переданного на вход изображения выдаёт текст в UTF-8 или 8-битных кодировках...

Подробнее: https://www.opennet.ru/opennews/art.shtml?num=60471


Содержание

Сообщения в этом обсуждении
"Выпуск системы распознавания текста GNU Ocrad 0.29"
Отправлено Аноним , 21-Янв-24 10:10 
OCR-ок тьма тьмущая, зачем нужно это поделие от гну? что бы было?

"Выпуск системы распознавания текста GNU Ocrad 0.29"
Отправлено Аноним , 21-Янв-24 10:43 
Да чтобы было именно свободное от гну. При этом она существует так давно что программа может быть даже памятником.

"Выпуск системы распознавания текста GNU Ocrad 0.29"
Отправлено хрю , 21-Янв-24 11:24 
Чего в ней старого - 2003 год? Даже cuneiform намного старше. Да и другие распозновалки как минимум базируются на намного более старом коде/продуктах.

"Выпуск системы распознавания текста GNU Ocrad 0.29"
Отправлено Аноним , 21-Янв-24 13:12 
21 год прошел если что.

"Выпуск системы распознавания текста GNU Ocrad 0.29"
Отправлено хрю , 21-Янв-24 11:26 
>> зачем нужно это поделие от гну?

Одному челу интересно он и тащит. Большого смысла в ней нет - она проигрывает вообще всем распозновалкам.


"Выпуск системы распознавания текста GNU Ocrad 0.29"
Отправлено Аноним , 21-Янв-24 15:18 
> OCR-ок тьма тьмущая, зачем нужно это поделие от гну? чтобы было?

другие OCRы читают для людей, а эту читают люди для интереса или ознакомления или прокачки навыков.
это создаст больше людей, которые создадут больше OCRов.


"Выпуск системы распознавания текста GNU Ocrad 0.29"
Отправлено Аноним , 21-Янв-24 15:21 
возможно, ИИ существует дольше, чем люди думают, и уже давно вступил в симбиоз с человечеством, и размножается через гну.

"Выпуск системы распознавания текста GNU Ocrad 0.29"
Отправлено Аноним , 21-Янв-24 15:22 
поэтому попытки понять код проектов гну можно смело назвать гнусным сэксом.

"Выпуск системы распознавания текста GNU Ocrad 0.29"
Отправлено Аноним , 21-Янв-24 15:47 
Сомневаюсь, что тут можно какие-то навыки прокачать, если только навык отсидки жопочасов. Я глянул код - такое ощущение, что чел писал калькулятор, а потом решил переделать в оцр.

"Выпуск системы распознавания текста GNU Ocrad 0.29"
Отправлено Axel , 21-Янв-24 21:28 
На чем написано, а то качать лень

"Выпуск системы распознавания текста GNU Ocrad 0.29"
Отправлено Аноним , 21-Янв-24 10:18 
Для распознавания, вроде, есть и Tesseract и OpenCV с плагинами, которые помимо feature extraction поддерживают другие способы (включая нейросети). Ну и поддержка кириллицы там есть. Сабж чем-то примечателен, кроме лицензии?

"Выпуск системы распознавания текста GNU Ocrad 0.29"
Отправлено Аноним , 21-Янв-24 11:03 
Очередное поделие гну - вроде хурда, Health, Cash и тд. - которое существует только потому что... а вот хз вообще почему.

Распознавать всего 3 (три) кодировки в 2024м. Ну это однозначно успех!
Не поддерживать кириллицу. Ну, может сейчас это не модно, но оно и раньше не поддерживало. Хотя кириллических языков намного больше чем один.
Про поддержку иероглифической письменности можно даже не заикаться...

Сабж проигрывает Тессеракту по всем фронтам.
В том числе по лицензии.


"Выпуск системы распознавания текста GNU Ocrad 0.29"
Отправлено Аноним , 21-Янв-24 11:27 
>которое существует только потому что... а вот хз вообще почему.

Да деньги на этом пилятся, вот и всё. Смотри, как это работает:

Столлман едет в какой-нибудь универ, читает там лекцию про то, как нужно срочно всем распознавать текст свободным софтом и только гну может его написать. Кулуарно с ректором обсуждает размер доната в FSF и сроки поставки софта. Затем получает транш на счёт FSF, платит себе оттуда нужную денежку, на которую будет есть ближайший месяц. Остальное копьё отсыпает юристу и секретарше, которые экстренно ищут Васю, который напишет им OCR. Вася найден, собирает со stack overflow куски кода, тырит с других открытых OCRок библиотеки, но поскольку он Вася - софт получается ущербным и кривым. Но зато Столлман отчитывается перед универом, что задача выполнена. А студенты универа ближайший год будут этим трешем пользоваться. Профит!

P.S. посмотрел тут график его выступлений - недавно бухтел про языковые модели. Так что ждите скоро GNU GPT на уровне чатбота 2000 года))


"Выпуск системы распознавания текста GNU Ocrad 0.29"
Отправлено beck , 21-Янв-24 12:18 
А мог бы просто быть программистом...

"Выпуск системы распознавания текста GNU Ocrad 0.29"
Отправлено adolfus , 23-Янв-24 15:46 
Придурок, этот человек  написал gcc и gdb, если знаешь, что этот такое.

"Выпуск системы распознавания текста GNU Ocrad 0.29"
Отправлено Аноним , 21-Янв-24 12:38 
Фантазируй, хотя бы, реалистичнее. Университеты сами рады лишний грант/донат выбить. Не то, чтобы кому бы то их на сторону отдавать.

"Выпуск системы распознавания текста GNU Ocrad 0.29"
Отправлено Аноним , 21-Янв-24 12:53 
Ты не сечешь как работает госуха) Чтобы в следующем году тебе дали норм финансирование - ты должен в этом потратить деньги) Иначе в следующем дадут меньше. Потратить заплатив себе зарплату ты не можешь, поэтому есть миллионы грантов на развитие очередной никому ненужной хрени, которые универы выдают вот таким Столлманам. Ричард в этой среде провел всю жизнь (он ни дня не работал в бизнесе), поэтому умеет зарабатывать токо так)

"Выпуск системы распознавания текста GNU Ocrad 0.29"
Отправлено Аноним , 21-Янв-24 15:51 
А ты думаешь в остальном мире что-то сильно по-другому? Там политики и лентяи какие-то другие, прилетели с Марса и какают радугой? Нет, родной, люди примерно одинаково устроены.

"Выпуск системы распознавания текста GNU Ocrad 0.29"
Отправлено Аноним , 21-Янв-24 17:16 
Твои фантазии. А в реальности M$ за очень дорого проталкивает Шиндошс везде, где может. Через откаты чинушам. А где не может, там закупы сами придумывают, как бы лизнуть такой импортной, но такой родной американской конторе.

"Выпуск системы распознавания текста GNU Ocrad 0.29"
Отправлено fuggy , 21-Янв-24 17:00 
GnuHealth пользуются в развивающихся странах. GnuCash может использоваться мелким бизнесом. Так что это не программа ради самой программы.
Тоже самое, если ты не книгопечатник или архитектор, то тебе не нужно покупать MS Office и Adobe Photoshop, если тебе лишь нужно написать объявление или курсовую, достаточно LibreOffice и Gimp.

"Выпуск системы распознавания текста GNU Ocrad 0.29"
Отправлено Аноним , 21-Янв-24 17:48 
> GnuHealth пользуются в развивающихся странах.

А еще в развивающихся странах низкие требования к качеству еды, технике безопасности и транспорту.
Но это от бедности. Думаю когда они станут по-богаче, то перейдут на более качественные системы.

> тебе не нужно покупать MS Office

До момента когда в твоем файле из опенофиса полезет верстка при открытии в ворде.
К сожалению офис это лидер, и нужно быть как минимум не хуже.


"Выпуск системы распознавания текста GNU Ocrad 0.29"
Отправлено fuggy , 21-Янв-24 19:50 
А там что не люди живут или им не нужно медицинскую помощь. Система работает что ещё надо.

Такой же лидер, как и Windows, для тех кто готов платить сотни денег. Обратное тоже верно. При открытии ворд файла в LibreOffice тоже может ползти. Ты вообще MS формат файлов видел? Сотни костылей со времён Lotus Software. До сих пор присутствует баг 1900 года. Доходит до того что новый эксель хуже открывает 97 формат, чем другие офисы.


"Выпуск системы распознавания текста GNU Ocrad 0.29"
Отправлено Аноним , 21-Янв-24 20:05 
> А там что не люди живут или им не нужно медицинскую помощь. Система работает что ещё надо.

Еще раз. Люди им пользуются от бедности.
Жигули тоже ездили. Некоторые даже называли их автомобилем.
А потом, как только появилась возможность, сменили свое зубило, ласточку или космич на иномарку.

> При открытии ворд файла в LibreOffice тоже может ползти.

Вот только это мало кого будет волновать, если у ворда подавляющее большинство.


"Выпуск системы распознавания текста GNU Ocrad 0.29"
Отправлено Аноним , 21-Янв-24 20:11 
> Система работает что ещё надо.

У "работает" есть множество градаций.
Какова надежность? Какая необходимость в обслуживании?
Насколько ею удобно пользоваться? Насколько она гибкая, кастомизируемая? Насколько она "хрупкая"?
Сколько есть адекватных людей на рынке, которые умеют с системой работать? И еще куча других нюансов.
Потому что обычная лопата дешевая, надежная и даже работает, но копать ею котлован для высотки как-то не весело.

> Обратное тоже верно. При открытии ворд файла в LibreOffice тоже может ползти.

Если 95% вайлов - ворд, то всем как-то пофиг что odt файлы ползут.

> Сотни костылей со времён Lotus Software.

А мне как пользователю вообще пофиг что под капотом. Была только пара случаев когда были проблемы с обратной совместимостью. Оно просто работает и работает предсказуемо. И это самый главный критерий для пользователя.


"Выпуск системы распознавания текста GNU Ocrad 0.29"
Отправлено fuggy , 21-Янв-24 20:39 
> Если 95% вайлов - ворд, то всем как-то пофиг что odt файлы ползут.

А как же импортозамещение. Дело привычки.

> Была только пара случаев когда были проблемы с обратной совместимостью.

Проблемы не с обратной совместимостью, проблемы сейчас, когда пишешь mar1 или 1/1, он придумывает рандомную дату. Из-за этого портятся научные данные. Так что это как раз LibreOffice работает предсказуемо.
Если тебе надо объявление или курсовую распечатать ты будешь покупать "профессиональную" систему за 70 долларов в год? Если тебе нужно огород вскопать, ты будешь покупать экскаватор и нанимать людей на рынке, которые умеют с ним работать или просто возьмёшь лопату?


"Выпуск системы распознавания текста GNU Ocrad 0.29"
Отправлено Аноним , 21-Янв-24 22:35 
> импортозамещение

оказалось фикцией

> Из-за этого портятся научные данные.

Потому что нефиг проводить научные вычисления инструментом для них не предназначенным!

> Так что это как раз LibreOffice работает предсказуемо.

Вот когда он перестанет загибаться на не таком уж большом кол-ве формул - тогда и поговорим))
Я уже молчу про макросы.

> Если тебе надо объявление или курсовую распечатать ты будешь покупать "профессиональную" систему за 70 долларов в год?

Почему в год? Он стоит $159.99 без подписки. И его стоимость вполне нормальная для написания курсовых/дипломных работ за 4-6 лет обучения. Да и никакой ворд не профессиональный.


"Выпуск системы распознавания текста GNU Ocrad 0.29"
Отправлено Аноним , 21-Янв-24 18:25 
Ты глянь список внедрений гнухелс - там какие-то сельские поликлиники в глубинке Конго. И вообще не факт, что это - правда. Никто ж не проверит никогда. Ну ладно, допустим. Гнукэш и малый бизнес - это крайне смешно. Попробуй сдать отчётность гнукешем, потом вместе с налоговой поржете.

"Выпуск системы распознавания текста GNU Ocrad 0.29"
Отправлено Аноним , 21-Янв-24 19:27 
Получается, все прикладные приложения от GNU - лютый шлак?

"Выпуск системы распознавания текста GNU Ocrad 0.29"
Отправлено Бывалый смузихлёб , 22-Янв-24 09:54 
> GnuHealth пользуются в развивающихся странах. GnuCash может использоваться мелким бизнесом

Чем и то и другое лучше листка в клеточку, блокнота или амбарной книги ?
Смысл систем учёта финансов( для бузинеса ) - в возможности нормальной сдачи отчётности в ту же налоговую. Гнутым Кэшем этого не сделать.
В электронном виде посредством него тоже отчётность в налоговую не отослать( из бесплатных есть разве что Налогоплательщик ЮЛ )

По фотошопу и офису - отчасти, соглашусь. Жаль, правда, не все вообще понимают что потом делать с форматом одт. Но у той же либры вроде бы и в другие форматы можно сохранять
Заместо фотошопа уже много лет отлично справляется Крита


"Выпуск системы распознавания текста GNU Ocrad 0.29"
Отправлено Kuromi , 21-Янв-24 20:47 
"Распознавать всего 3 (три) кодировки в 2024м. Ну это однозначно успех! "

Ты наверное никогда не слышал американского термина "Rest Other World". Проект чисто latin\американо центричный. Проблемы так называемых "sand\ramen\borscht-ni**ers" их не волнуют. Не надо, мол, использовать неправильный алфавит.


"Выпуск системы распознавания текста GNU Ocrad 0.29"
Отправлено anonymous , 21-Янв-24 22:26 
MGIMO finished ?

"Выпуск системы распознавания текста GNU Ocrad 0.29"
Отправлено Аноним , 21-Янв-24 11:42 
То есть реальное изменение одно: «Улучшено распознавание начертания буквы "L" с наклонённой правой частью.»

"Выпуск системы распознавания текста GNU Ocrad 0.29"
Отправлено Аноним , 21-Янв-24 12:58 
Подобное изменение позорит проект. Выгбядит так, как будто там сидят программисты и для каждой буквы классификатор вручную пишут.

"Выпуск системы распознавания текста GNU Ocrad 0.29"
Отправлено Аноним , 21-Янв-24 13:08 
Слушай, похоже так и есть. Я немношк посмотрел исходники - OCR в 24 году так не пишут. Блин, даже в 90х так не писали.

"Выпуск системы распознавания текста GNU Ocrad 0.29"
Отправлено Аноним , 21-Янв-24 13:44 
Ну а что ты хочешь забесплатно? И качество кода такое. Это узкоспециализрованный софт, cuneiform денежку требует.

"Выпуск системы распознавания текста GNU Ocrad 0.29"
Отправлено Ю.Т. , 21-Янв-24 16:17 
cuneiform разве не свободный?

"Выпуск системы распознавания текста GNU Ocrad 0.29"
Отправлено soarin , 21-Янв-24 17:30 
бесплатный, открытый (BSD-образная лицензия), заброшенный

"Выпуск системы распознавания текста GNU Ocrad 0.29"
Отправлено namenotfound , 21-Янв-24 17:00 
гугловский tesseract бесплатен и выпущен под apache

"Выпуск системы распознавания текста GNU Ocrad 0.29"
Отправлено Аноним , 21-Янв-24 19:29 
ну это на бабки гугла он пишется, на деньги корпораций, не будет бабок от гугла - завтра же он станет усыхать

"Выпуск системы распознавания текста GNU Ocrad 0.29"
Отправлено Аноним , 21-Янв-24 19:56 
И? Сейчас оно работает? Работает
Оно лучше работает чем ocrad? Лучше.

Даже если оно начнет усыхать:
- хуже чем было оно уже не станет
- этот процесс займет какое-то время и, подозреваю, что совсем не маленькое
- почему бы не воспользоваться вещью, за которой гугел уже заплатил))


"Выпуск системы распознавания текста GNU Ocrad 0.29"
Отправлено namenotfound , 22-Янв-24 18:11 
> ну это на бабки гугла он пишется, на деньги корпораций, не будет
> бабок от гугла - завтра же он станет усыхать

и что? в худшем случае они тупо снимут его с публичного доступа


"Выпуск системы распознавания текста GNU Ocrad 0.29"
Отправлено iPony129412 , 21-Янв-24 14:53 
Кто сказал что программисты (а не один) и сидят?
Я не нашёл нормальной истории коммитов
Но такое ощущение, что там около один и по пару часов в месяц делает в свободное время как хобби.

"Выпуск системы распознавания текста GNU Ocrad 0.29"
Отправлено Аноним , 21-Янв-24 15:58 
Теория про Васю и университетский откат начинает приобретать очертания кек

"Выпуск системы распознавания текста GNU Ocrad 0.29"
Отправлено Аноним , 21-Янв-24 16:03 
Только Вася каждый раз новый, потому что senior project сам себя не напишет.

"Выпуск системы распознавания текста GNU Ocrad 0.29"
Отправлено Аноним , 21-Янв-24 12:58 
Предыдущая версия вышла 2022-01-17. Т.е. прошло всего два года.
Это достойное улучшение и скорость разработки вполне соответствует другим проектам FSF.

"Выпуск системы распознавания текста GNU Ocrad 0.29"
Отправлено Аноним , 21-Янв-24 13:14 
Можно подумать там много программистов, кто-то увидел поправил и выкатил. Пошел на работу.

"Выпуск системы распознавания текста GNU Ocrad 0.29"
Отправлено ИмяХ , 21-Янв-24 13:21 
Для какой нибудь хромозиллы это было бы весомым поводом выпустить мажорный релиз

"Выпуск системы распознавания текста GNU Ocrad 0.29"
Отправлено Аноним , 21-Янв-24 13:33 
За два года разработки?))
Плюс хромозилой в сумме пользуется больше 1 лярда людей. А этим... даже не уверен что вообще кто-то.

"Выпуск системы распознавания текста GNU Ocrad 0.29"
Отправлено fuggy , 21-Янв-24 16:26 
Потому что разработано в те времена, а не вот эти ваши нейросети. Где вместо улучшено распознавание буквы "L":
"Слышь, у нас букву L плохо распознаёт. Что делаем?
- Давай переобучим нейросеть.
- А что в чейджлоге написать?
- Напиши улучшено распознавание. А что именно улучшено, даже мы сами не знаем."

Также и в другой сфере. Взять например компьютерные шахматные движки. В 90е и 00е именно так и делали. Писали возможные ходы, придумывали эвристики, функции оценки, оптимизировали всё это альфа-бета минмакс. А потом пришли нейросети, где достаточно 1000 часов играть с самим собой и вырвались вперёд. А потом говорить что эти деды улучшили оценку значимости пешки, а нейросети всё равно побеждают. Взять например, шахматный движок Ботвинника, чемпиона мира, чемпиона СССР, доктора технических наук. Много лет пытался написать шахматный движок, но неудачно. В итоге движок чемпиона мира и математика проигрывает бездуховным нейросетям. Говорит ли это о том что 1 программа плохая? Нет.


"Выпуск системы распознавания текста GNU Ocrad 0.29"
Отправлено Нукак Так , 21-Янв-24 17:44 
Вообще-то распознавание определено инстутициально в забвенный сток автоопределением. 4 из 5 современных приложения четко следуют прописным алгоритмам внесистемных тербований, что сказывается на обновляемых картах ячеек.

"Выпуск системы распознавания текста GNU Ocrad 0.29"
Отправлено Аноним , 21-Янв-24 18:35 
Не сравнивай шахматные движки и распознавание образов. Алгоритмы там принципиально разные и шахматы сложнее.

"Выпуск системы распознавания текста GNU Ocrad 0.29"
Отправлено Аноним , 21-Янв-24 19:32 
Хорошая идея. Надо из своего проекта выбросить

> "ascii", "iso-8859-9" и "iso-8859-15"