<?xml version="1.0" encoding="koi8-r"?>
<rss version="0.91">
<channel>
    <title>OpenForum RSS: Релиз системы распознавания текста Tesseract 5.3.4</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/132605.html</link>
    <description>Опубликован релиз системы оптического распознавания текста Tesseract 5.3.4, поддерживающей распознавание символов UTF-8 и текстов на более чем 100 языках, включая русский, казахский, белорусский  и украинский. Результат может сохраняться как открытым текстом, так и в форматах HTML (hOCR),  ALTO (XML), PDF и TSV. Изначально система была создана в 1985-1995 годах в лаборатории компании Hewlett Packard, в 2005 году код был открыт под лицензией Apache и в дальнейшем развивался при участии работников компании Google. Исходные тексты  проекта распространяются под лицензией Apache 2.0...&lt;br&gt;&lt;br&gt;Подробнее: https://www.opennet.ru/opennews/art.shtml?num=60457&lt;br&gt;</description>

<item>
    <title>Релиз системы распознавания текста Tesseract 5.3.4 (Аноним)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/132605.html#33</link>
    <pubDate>Sat, 20 Jan 2024 12:25:01 GMT</pubDate>
    <description>Китайцы безусловно молодцы, факт. &lt;br&gt;&lt;br&gt;&amp;gt; Всё остальное просто нервно курит в сторонке по качеству распознавания.&lt;br&gt;&lt;br&gt;Само-собой, нейронки нещадно нагибают классический подход. &lt;br&gt;&lt;br&gt;&amp;gt; Я собирал на C++ и библиотеку и программу распознавания. &lt;br&gt;&lt;br&gt;cpp_infer? Оно работало, но это скорее побочное демо. Основная софтина &amp;#8212; это именно питона кусок.&lt;br&gt;&lt;br&gt;&amp;gt; Много документации на английском&lt;br&gt;&lt;br&gt;Какая&amp;#8211;то есть. Актуальность и полноту по сравнению с китайской берёшься гарантировать? (спойлер: китайская полнее и актуальнее) Поиск по багтрекеру тоже возьмёшся организовать?&lt;br&gt;&lt;br&gt;Штука не в том. PaddleOCR развивается, тестируется и поддерживается именно как датасатанистский проект с питоном во все поля. Не как сишная либа. Отдельные инициативы по запуску моделей на нативных рантаймах &amp;#8212; это именно что демки и proof&amp;#8211;of&amp;#8211;concept. Без поддержки и гарантий актуализации. Самое ценное там &amp;#8212; это компактные модели, но обвязку под них придётся допиливать самостоятельно.&lt;br&gt;&lt;br&gt;В том и разница: Tesseract компактен, сам</description>
</item>

<item>
    <title>Релиз системы распознавания текста Tesseract 5.3.4 (Аноним)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/132605.html#32</link>
    <pubDate>Sat, 20 Jan 2024 09:58:54 GMT</pubDate>
    <description>&amp;gt; Недавно занимался распознаванием документа. Потом уснул..&lt;br&gt;&lt;br&gt;Хреновая и неэффективная нейросеть. Заменить на робота.&lt;br&gt;</description>
</item>

<item>
    <title>Релиз системы распознавания текста Tesseract 5.3.4 (Прадед)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/132605.html#31</link>
    <pubDate>Sat, 20 Jan 2024 06:28:00 GMT</pubDate>
    <description>Недавно занимался распознаванием документа. Потом уснул.. &lt;br&gt;</description>
</item>

<item>
    <title>Релиз системы распознавания текста Tesseract 5.3.4 (cat666)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/132605.html#30</link>
    <pubDate>Fri, 19 Jan 2024 18:22:34 GMT</pubDate>
    <description>Ты даже не в теме. Никакие куски питона там не нужны. Я собирал на C++ и библиотеку и программу распознавания. Всё остальное просто нервно курит в сторонке по качеству распознавания. Много документации на английском, для этого надо просто зайти на GitHub. Китайцы молодцы. &lt;br&gt;</description>
</item>

<item>
    <title>Релиз системы распознавания текста Tesseract 5.3.4 (Jh)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/132605.html#29</link>
    <pubDate>Fri, 19 Jan 2024 17:30:13 GMT</pubDate>
    <description>И еще есть гуй для этой утилиты - gimagereader. Довольно неполохой&lt;br&gt;</description>
</item>

<item>
    <title>Релиз системы распознавания текста Tesseract 5.3.4 (Jh)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/132605.html#28</link>
    <pubDate>Fri, 19 Jan 2024 17:18:27 GMT</pubDate>
    <description>не распознает. А с фанридером лично у меня всегда были проблемы если результат надо было редактировать. &lt;br&gt;</description>
</item>

<item>
    <title>Релиз системы распознавания текста Tesseract 5.3.4 (Jh)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/132605.html#27</link>
    <pubDate>Fri, 19 Jan 2024 17:16:22 GMT</pubDate>
    <description>tesseract хорошо распознает. Я его тестировал на сканах ксерокопий в 200взш которые нам присылали из больниц. В чем проблема, что он распознает таблицы. &lt;br&gt;</description>
</item>

<item>
    <title>Релиз системы распознавания текста Tesseract 5.3.4 (Аноним)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/132605.html#26</link>
    <pubDate>Fri, 19 Jan 2024 13:10:15 GMT</pubDate>
    <description>Не запретили. Как и выучить китайский. Речь не о принципиальной невозможности, а о дополнительном геморрое. &lt;br&gt;</description>
</item>

<item>
    <title>Релиз системы распознавания текста Tesseract 5.3.4 (Бывалый смузихлёб)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/132605.html#25</link>
    <pubDate>Fri, 19 Jan 2024 12:54:53 GMT</pubDate>
    <description>&amp;gt; Если языковой барьер не мешает, то пожалуйста. &lt;br&gt;&lt;br&gt;Онлайн-переводчики уже запретили ?&lt;br&gt;</description>
</item>

</channel>
</rss>
