URL: https://www.opennet.ru/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID3
Нить номер: 80021
[ Назад ]

Исходное сообщение
"Релиз YAGF 0.8.7, графической оболочки для систем распознава..."

Отправлено opennews , 29-Авг-11 15:49 
Вышла новая версия YAGF (http://symmetrica.net/cuneiform-linux/yagf-ru.html), написанной с использованием Qt 4 графической оболочки для программ оптического распознавания текста Cuneiform (https://launchpad.net/cuneiform-linux) и Tesseract (http://code.google.com/p/tesseract-ocr/). Программа позволяет через единый GUI-интерфейс управлять сканированием изображений, их предварительной обработкой и распознаванием большого числа отсканированных страниц.


Главными новшествами новой версии YAGF является возможность импорта страниц из формата PDF и поддержка системы распознавания текста Tesseract. Проект Tesseract изначально разрабатывался в 1985-1995 годы в лаборатории компании Hewlett Packard, в 2005 году код был открыт под лицензией Apache и в дальнейшем развивался при участии работников компании Google. Как и Cuneiform, система Tesseract  поддерживает распознавание текста на русском и украинском языках.


<center><a href="http://symmetrica.net/cuneiform-linux/yagf-ru.jpeg">... src=...

URL: http://symmetrica.net/cuneiform-linux/yagf-ru.html
Новость: http://www.opennet.ru/opennews/art.shtml?num=31617


Содержание

Сообщения в этом обсуждении
"Релиз YAGF 0.8.7, графической оболочки для систем распознава..."
Отправлено Аноним , 29-Авг-11 15:49 
ктонть пробовал? насколько оно по сравнению с файнридером?

"Релиз YAGF 0.8.7, графической оболочки для систем распознава..."
Отправлено luckym , 29-Авг-11 15:59 
Ну разве что форматирование не поддерживает, а сам текст распознаёт нормально. Но это иногда только +, т.к. после ФайнРидера нередко приходилось всё форматирование сносить и заново форматировать.

"Релиз YAGF 0.8.7, графической оболочки для систем распознава..."
Отправлено jedie , 29-Авг-11 16:03 
Собрал, не работает!

Ни ошибок, ничего. Тупо стоит ничего не делает.


"Релиз YAGF 0.8.7, графической оболочки для систем распознава..."
Отправлено jedie , 29-Авг-11 16:04 
Пробовал вот эту картинку:
http://www.cs.uregina.ca/Links/class-info/425/Lab4/Picts/enh...

"Релиз YAGF 0.8.7, графической оболочки для систем распознава..."
Отправлено NavDotRu , 29-Авг-11 17:13 
А сами распознаватели то установлены?

"Релиз YAGF 0.8.7, графической оболочки для систем..."
Отправлено anonymous , 29-Авг-11 21:20 
> А сами распознаватели то установлены?

нет, инфа 100%


"Релиз YAGF 0.8.7, графической оболочки для систем распознава..."
Отправлено CityAceE , 30-Авг-11 01:17 
Вот распознанный этим пакетом текст с этой картинки:

Segmentation of nontrivial images is one of the mo~ processing. Segmentation accuracy determines the ev of computerized analysis procedures. For this reason, c be taken to improve the probability of rugged segment; such as industrial inspection applications, at least some the environment is possible at times. The experienced i designer invariably pays considerable attention to sucl


"Релиз YAGF 0.8.7, графической оболочки для систем распознава..."
Отправлено Skull , 29-Авг-11 16:12 
Пакет уже собран в ALT Linux. Всё работает.

"Релиз YAGF 0.8.7, графической оболочки для систем распознава..."
Отправлено ы , 29-Авг-11 20:05 
А в сизифе нету еще :(

"Релиз YAGF 0.8.7, графической оболочки для систем распознава..."
Отправлено Аноним , 29-Авг-11 16:37 
Отличная вещь для распознавания каптч.

"Релиз YAGF 0.8.7, графической оболочки для систем распознава..."
Отправлено ФФ , 30-Авг-11 09:29 
А зачем?

"Релиз YAGF 0.8.7, графической оболочки для систем распознава..."
Отправлено Аноним , 30-Авг-11 21:49 
Как хорошо, что появилась эта морда к утилиткам... FineReaderокапец близок!

"Релиз YAGF 0.8.7, графической оболочки для систем распознава..."
Отправлено Heckfy , 31-Авг-11 13:57 
Еще не близок, но направление движения выбрано правильное.

Жаль, еще нет веб2.0 интерфейса.
Можно было бы в облаке хранить тысячи, десятки тысяч сканов, создаваемых с десятков-сотен сканнеров. Всё это в фоне преварительно анализировалось бы и менеджеры просматривали одну за другой сотни листов, поправляя направление сканирования и автоматические границы блоков.