The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



"Обновление программы для распознавания текста dpScreenOCR 1.5.1"
Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Изначальное сообщение [ Отслеживать ]

"Обновление программы для распознавания текста dpScreenOCR 1.5.1"  +/
Сообщение от opennews (??), 25-Апр-26, 08:03 
Состоялся выпуск программы для оптического распознавания текста dpScreenOCR 1.5.1, использующей Tesseract. dpScreenOCR позволяет при помощи глобальной горячей клавиши и мыши захватить произвольную область экрана, текст из которой будет распознан. В зависимости от выбора пользователя, программа может копировать распознанный текст в буфер обмена, добавить его в историю или отправить внешней программе. Готовые сборки сформированы для Linux и Windows (также доступны репозитории пакетов для Debian и Ubuntu). Код программы написан на C++ и распространяется под лицензией zlib...

Подробнее: https://www.opennet.ru/opennews/art.shtml?num=65281

Ответить | Правка | Cообщить модератору

Оглавление

Сообщения [Сортировка по ответам | RSS]

1. Сообщение от Аноним (1), 25-Апр-26, 08:03   –3 +/
Кто-нибудь уже натренировал и слил в сеть нормальные модели для tesseract? Штатная слабовато распознаёт, много ошибок и требовательно к чистоте картинки. И наклону. Желательно без стилеров токенов и ботнетов комплектом.
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #5, #27

2. Сообщение от Аноним (2), 25-Апр-26, 08:21   +1 +/
а на вяленом будет работать? :D
Ответить | Правка | Наверх | Cообщить модератору

3. Сообщение от Аноним (3), 25-Апр-26, 08:29   –2 +/
>использующей Tesseract

Tesseract - это хлам. Я ожидал, что таки навайбкодят аналог файнридера на нейронках, но видимо неподъёмно.

Ответить | Правка | Наверх | Cообщить модератору
Ответы: #40

4. Сообщение от Аноним (-), 25-Апр-26, 08:37   –5 +/
> Программа стала доступна в Microsoft Store.

Дожили, опеннет постит ссылки на коммерческий блобоварезник майкрософта :\

Ответить | Правка | Наверх | Cообщить модератору
Ответы: #9, #11, #13, #28

5. Сообщение от Аноним (5), 25-Апр-26, 08:53   +1 +/
прекрасно он текст распознает, но нужно чтобы распознаваемый
шрифт входил во мн-во на котором он учился. Переобучение
несложно локально сделать, там файлик со списком шрифтов есть
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #1 Ответы: #6, #8

6. Сообщение от Аноним (1), 25-Апр-26, 08:58   +3 +/
С ошибками. Мне иероглифы вообще распознавать надо. У гугла вон работает распознавание по фото с любым текстом под любым углом, а тут приходится вращать, выкручивать контрастность, двухцветные изображения делать. Не сказал бы, что это прекрасно, как минимум, нужны нормальные веса.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #5 Ответы: #10, #20, #25, #34

8. Сообщение от Профессор Кислвх Щей (?), 25-Апр-26, 09:07   +/
Так это ужасно. Она не должна знать то что распознает. Конечно у нее точное будет, если она видела этот пример
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #5

9. Сообщение от Аноним (9), 25-Апр-26, 09:08   +4 +/
И по этой ссылке опенсорсное приложение. Вроде бы все в пределах философии опенннета.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #4

10. Сообщение от Анонимище (?), 25-Апр-26, 09:18   +/
А почему Вам нужно распозновать иероглифы, простите за любопытство?
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #6 Ответы: #12

11. Сообщение от Аноним (11), 25-Апр-26, 09:26   +/
Написал так, как будто у вас процессор не на технологиях ASML разработан.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #4

12. Сообщение от Аноним (1), 25-Апр-26, 09:42   –1 +/
Много китайской продукции и я не владею китайским, одна надежда на переводчик. Посылать всё в гугл для распознавания, конечно, замечательная идея, но у неё есть свои недостатки.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #10 Ответы: #18

13. Сообщение от Аркагоблин (?), 25-Апр-26, 09:48   +1 +/
И что? Сама программа с открытым исходным кодом (лицензия zlib), а Microsoft Store лишь один из вариантов распространения. Firefox, LibreOffice и даже Ubuntu тоже там доступны, и что?
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #4

14. Сообщение от Аркагоблин (?), 25-Апр-26, 09:51   +/
Как раз на днях искал программу для распознавания текста из изображений (не китайский глянцевый хлам на непонятном стеке, с рекламой и VIP подпиской), и сегодня узнал об этой программе
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #21

17. Сообщение от psv (??), 25-Апр-26, 10:10   +/
И что никто не поставил в ламу локальную Qwen3.6-35b "смесь экспертов" с указанием "грузить картинки тоже"? )))
Ответить | Правка | Наверх | Cообщить модератору

18. Сообщение от Анонимище (?), 25-Апр-26, 10:17   +/
И что за недостатки?
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #12 Ответы: #19

19. Сообщение от Аноним (1), 25-Апр-26, 10:22   +1 +/
> И что за недостатки?

Гугл блокирует подсеть. Или хочет денег.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #18 Ответы: #22

20. Сообщение от Анонисссм (?), 25-Апр-26, 10:45   +1 +/
>Мне иероглифы вообще распознавать надо

tesseract прекрасно и раз в 10 быстрее работает, если НЕ нужны таблицы и прочее сложное форматирование, возможно китайский тоже не умеет. paddleOCR и подобное тебе нужно

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #6

21. Сообщение от Смузихлеб забывший пароль (?), 25-Апр-26, 13:25   +/
> китайский глянцевый хлам на непонятном стеке, с рекламой и VIP подпиской

ты примерно описал среднестатистическое приложение яблостора( десктоп )

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #14

22. Сообщение от faa (?), 25-Апр-26, 14:39   +/
А если послать какому-нибудь дипсику или квен?
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #19 Ответы: #24

23. Сообщение от Аноним (23), 25-Апр-26, 15:03   +/
не проще скрин в дипсик скинуть?
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #26

24. Сообщение от ryoken (ok), 25-Апр-26, 15:52   +/
В расчете на родной язык авторов? :)
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #22

25. Сообщение от Аноним (25), 25-Апр-26, 15:52   +/
> Мне иероглифы вообще распознавать надо
> тут приходится вращать, выкручивать контрастность, двухцветные изображения делать

Сабж, насколько понимаю, делает такие приготовления для изображений: у него качество распознавания несоизмеримо лучше, чем у голого консольного tesseract. Хотя я сравнивал для англичского и русского, а не для иероглифов.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #6

26. Сообщение от Аноним (25), 25-Апр-26, 15:58   +/
> не проще скрин в дипсик скинуть?

Не проще. Сабж без лишних телодвижений сразу распознает скрины дает результат в буфер обмена. Это банально быстрее, чем куда-то что-то загружать и потом выделять-копировать вручную.

Ну и работает оффлайн без необходимости сливать свои данные третьим лицам.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #23

27. Сообщение от Jh (?), 25-Апр-26, 16:52   +/
Я пробовал распознавать на сканах ксерокопий 200dpi, нормально распознает. Что не хватает так это работы с таблицами.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #1

28. Сообщение от Аноним (25), 25-Апр-26, 19:24   +/
>> Программа стала доступна в Microsoft Store.
> Дожили, опеннет постит ссылки на коммерческий блобоварезник майкрософта :\

Подавляющее большинство людей предпочтет установить программу из официального магазина, а не качать-запускать непонятно какие EXE с васянских сайтов.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #4 Ответы: #31

29. Сообщение от Аноним (29), 25-Апр-26, 19:38   +1 +/
Tesseract всё ещё работает ужасно?
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #32, #35

30. Сообщение от Петр А.email (?), 25-Апр-26, 21:49   +/
Еще в коллекцию?

https://www.altlinux.org/OCR

Ответить | Правка | Наверх | Cообщить модератору

31. Сообщение от Аноним (31), 26-Апр-26, 03:48   +/
Подавляющее большинство людей не пользуются официальным магазином, а предпочитают как и всегда качать непосредственно с сайта.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #28 Ответы: #39

32. Сообщение от жыжа (?), 26-Апр-26, 03:56   +1 +/
Весьма посредственно, если судить по spectacle, куда недавно завели распознавание текста на скринах через tesseract, и распознать смесь русского с английским, похоже, задача непосильная.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #29

33. Сообщение от Ю.Т. (?), 26-Апр-26, 08:26   +1 +/
Тессеракт имеет "нейронки" уже лет 10 почти.

Со "смесью языков" он работает, возможно, не блестяще, но и не плохо.

Китайский в нём есть, и "новый", и "старый".

Работать нужно, понятно же, с лучшим набором:
github.com/tesseract-ocr/tessdata_best

Чего не хватает тессеракту -
1 никак не родят к нему путёвый разбиватель страницы. Собственный там старый и довольно упрощённый.
2 Семантика текста, выражаемая размерами, положениями и начертаниями (выделения,дроби, индексы, сноски), не обрабатывается.
3 Их обучающие наборы данных скромноваты по размерам (не забудем, конечно, что их собирают и раздают бесплатно)
4 Также реализованная в тессеракте модель машобучения не позволяет её удобно доообучить.

Ответить | Правка | Наверх | Cообщить модератору
Ответы: #36

34. Сообщение от tkzv (ok), 26-Апр-26, 09:52   +/
Короткие тексты иероглифами tesseract распознаёт отлично, хотя многоцветные и длиннее 200 знаков особо распознавать не приходилось.

Вместо возни с контрастностью предпочитаю сразу распознать на нескольких уровнях гаммы — от 0,06 до 8 — и выбрать лучший. Забавно, что часто с гаммой и 2, и 0,5 получается одинаково хорошо, и гораздо лучше, чем с 1.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #6

35. Сообщение от tkzv (ok), 26-Апр-26, 10:02   +/
> Tesseract всё ещё работает ужасно?

Для распознавания скриншотов текста — более чем достаточно. Если весь текст одного размера и цвета, и достаточно контрастный. Проблемы бывают со светлосерым на белом (лечится прогоном через magick -gamma), с жёлтым на голубом (аналогично), при размере текста меньше 6 пикселов.

Если текст нескольких цветов, иногда приходится распознавать с разными гаммами и компоновать.

Если текст на нескольких языках, может подставить символы не того языка. HET, 3EB, НЕАР и т.д.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #29

36. Сообщение от tkzv (ok), 26-Апр-26, 10:14   +/
> Со "смесью языков" он работает, возможно, не блестяще, но и не плохо.

Прикрутить бы LanguageTool какой-нибудь. Чтобы меньше путал "не" и "he".

> 1 никак не родят к нему путёвый разбиватель страницы. Собственный там старый и довольно упрощённый.

Сейчас проще руками разбить картинку на несколько, чем надеяться, что распознает колонки.

> 2 Семантика текста, выражаемая размерами, положениями и начертаниями (выделения,дроби,  индексы, сноски), не обрабатывается.

Вообще какая-нибудь программа это умеет?

> 4 Также реализованная в тессеракте модель машобучения не позволяет её удобно доообучить.

Если я правильно понял документацию, обучение медленное и не умеет пользоваться GPU.

От себя добавлю внезапные затыки, когда в упор не видит не очень контрастный текст, но при изменении гаммы в любую сторону прекрасно всё распознаёт. И очень плохо распознаёт, если на черно-белом скриншоте что-то подчёркнуто или обведено красным.


Ответить | Правка | Наверх | Cообщить модератору
Родитель: #33 Ответы: #37

37. Сообщение от Ю.Т. (?), 26-Апр-26, 12:09   +/
> Прикрутить бы LanguageTool какой-нибудь. Чтобы меньше путал "не" и "he".

Думаю, такие действия лучше бы получать из мета-описаний. "Текст содержит целые слова в разных системах письма", а отсюда и вариант: "В тексте просто есть римские числа".

То же и к разбивателю относится. Глаз-мозг у всех одинаковы (с точки зрения такой задачи), так что не так много и сценариев выкладки (лучше сказать -- признаков?).

> Вообще какая-нибудь программа это умеет?

Кажется, нет. Но это как бы и не задача распознавалки, скорее - для средств постобработки.

Да, разноцветный текст тессеракт не любит. Но там и предобработка - оочень скупая.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #36

38. Сообщение от Сладкая булочка (?), 26-Апр-26, 18:12   +/
Госопода, подскажите, он же с формулами так и не научился работать? Что посоветуете для распознавания формул?
Ответить | Правка | Наверх | Cообщить модератору

39. Сообщение от Прохожий (??), 27-Апр-26, 01:35   +/
Подавляющее число вменяемых людей пользуются Chocolatey или Winget, или чем-то аналогичным и не ходят ни по каким сайтам или магазинам.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #31

40. Сообщение от Аноним (40), 28-Апр-26, 03:35   +/
Куча открытых моделей есть мультимодальных, которые умеют речь и картинки распознавать (ну, соответственно, как OCR работать). qwen3.6, gemma4 из последних.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #3


Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2026 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру