<?xml version="1.0" encoding="koi8-r"?>
<rss version="0.91">
<channel>
    <title>OpenForum RSS: Первый релиз многопоточного HTML-парсера MyHTML</title>
    <link>https://opennet.ru/openforum/vsluhforumID3/108541.html</link>
    <description>После нескольких месяцев разработки увидел свет первый релиз (https://github.com/lexborisov/myhtml/releases/tag/v1.0.1) быстрого HTML парсера MyHTML (https://github.com/lexborisov/myhtml/). Код написан на языке Си и распространяется под лицензией  LGPL v2.1.&lt;br&gt;&lt;br&gt;&lt;br&gt;Особенности  MyHTML:&lt;br&gt;&lt;br&gt;&lt;br&gt;-  Высокая производительность;&lt;br&gt;-  Асинхронная обработка токенов и построение дерева&lt;br&gt;-  Полная поддержка спецификаций HTML 5 (https://html.spec.whatwg.org/multipage/), по состоянию на 19.06.2016;&lt;br&gt;-  Возможность манипулировать элементами и их атрибутами: добавлять, удалять, изменять&lt;br&gt;-  Поддерживает 39 кодировок на входе. На выходе только UTF-8, вся работа внутри только в UTF-8&lt;br&gt;-  Автоматическое определение кодировки текста. Сейчас доступны unicode: UTF-8, UTF-16LE, UTF-16BE (+ определение по BOM) и русские: windows-1251, koi8-r, iso-8859-5, x-mac-cyrillic, ibm866&lt;br&gt;-  Может работать в Single Mode &amp;#8212; без тредов. Так же может быть собран без потоков.&lt;br&gt;-  Возможность парсить фрагменты HTML или парсить кусками (chunks);&lt;br&gt;- </description>

<item>
    <title>Первый релиз многопоточного HTML-парсера MyHTML (ZloySergant)</title>
    <link>https://opennet.ru/openforum/vsluhforumID3/108541.html#166</link>
    <pubDate>Sat, 06 Aug 2016 17:08:48 GMT</pubDate>
    <description>&amp;gt; То что ты наблюдал в кабинете информатики своего ПТУ это конечно важные &lt;br&gt;&amp;gt; наблюдения, но реальность &quot;немножко&quot; другая. Стыдно не знать что к питону &lt;br&gt;&amp;gt; подключаются всякие сишные библиотечки, совмещая скорость Си и простоту питона. К &lt;br&gt;&amp;gt; примеру есть вполне себе массовый и шустрый питоновский парсер grab, который &lt;br&gt;&amp;gt; написан вокруг обвязки сишной библиотеки lxml. Работает и шустро и просто. &lt;br&gt;&amp;gt; Больно, да?&lt;br&gt;&lt;br&gt;Солнышко, ты хоть усрись, но конечный продюкт, транслируемый в машинный код всякие парсеры-херарсеры не превзойдут. Все равно что сказать: наша картонная мороженка круче Вашей нативной из молока! Всегой-то надо отшелушить десяток слоёв картона. А там - тот самый пломбир.&lt;br&gt;</description>
</item>

<item>
    <title>Первый релиз многопоточного HTML-парсера MyHTML (Аноним)</title>
    <link>https://opennet.ru/openforum/vsluhforumID3/108541.html#165</link>
    <pubDate>Sat, 16 Jul 2016 01:18:19 GMT</pubDate>
    <description>&amp;gt; Вообще-то один из простых способов получить скорость и компактность - не давать &lt;br&gt;&amp;gt; страницам делать лишнего.&lt;br&gt;&lt;br&gt;Во-первых, сейчас сами браузеры пытаются делать много лишнего, от борьбы с фишингом до телеметрии внаглую.&lt;br&gt;&lt;br&gt;Во-вторых, без разрешения этого лишнего - сайты часто работать перестают. Для понимания, посмотри на twitter bootstrap. Без js половина оформления отваливается, хотя формально js опционален. А оно популярное и на этом каждый второй сайт сделан.&lt;br&gt;</description>
</item>

<item>
    <title>Первый релиз многопоточного HTML-парсера MyHTML (Аноним)</title>
    <link>https://opennet.ru/openforum/vsluhforumID3/108541.html#163</link>
    <pubDate>Fri, 15 Jul 2016 19:19:59 GMT</pubDate>
    <description>&amp;gt; Это какая ошибка, ведь Rust самый лучший язык, у servo самые лучшие &lt;br&gt;&amp;gt; разработчики на самом лучшем языке, Mozilla Foundation самая прогрессивная опен-сорс компания, &lt;br&gt;&amp;gt; а поезд Си давно ушел!&lt;br&gt;&lt;br&gt;Разработчики из мозиллы свалили а у менеджеров всегда все самое лучшее. Но, к сожалению, только в маркетинговых буклетиках.&lt;br&gt;</description>
</item>

<item>
    <title>Первый релиз многопоточного HTML-парсера MyHTML (Аноним)</title>
    <link>https://opennet.ru/openforum/vsluhforumID3/108541.html#162</link>
    <pubDate>Fri, 15 Jul 2016 18:29:39 GMT</pubDate>
    <description>&amp;gt; На хабре (https://habrahabr.ru/post/277031) я описывал что за проект и к чему стремлюсь. &lt;br&gt;&amp;gt; Возможно скоро я буду делать его не один.&lt;br&gt;&lt;br&gt;А что, набор технологий ничего так, симпатично и со вкeсом. Никакой хипстерской фигни и решения всех мировых проблем, все по делу. Автор крут.&lt;br&gt;</description>
</item>

<item>
    <title>Первый релиз многопоточного HTML-парсера MyHTML (Аноним)</title>
    <link>https://opennet.ru/openforum/vsluhforumID3/108541.html#161</link>
    <pubDate>Fri, 15 Jul 2016 18:22:58 GMT</pubDate>
    <description>&amp;gt; Конечно. Аппликативный код распараллеливается лучше итеративного. При словах &quot;многопоточного &lt;br&gt;&amp;gt; HTML-парсера&quot; у меня первая мысль была об erlang-е, но я подумал &lt;br&gt;&amp;gt; и всё-таки написал про haskell.&lt;br&gt;&lt;br&gt;Если он будет такой же как ejabberd - спасибо, но оставьте это себе.&lt;br&gt;</description>
</item>

<item>
    <title>Первый релиз многопоточного HTML-парсера MyHTML (Аноним)</title>
    <link>https://opennet.ru/openforum/vsluhforumID3/108541.html#160</link>
    <pubDate>Fri, 15 Jul 2016 18:21:17 GMT</pubDate>
    <description>&amp;gt; Вот было бы на haskell-е, тогда бы была бы действительно круть...&lt;br&gt;&lt;br&gt;Куда это потом девать? Пофапать и выбросить? На сях то оно куда угодно прикручивается при должном желании.&lt;br&gt;</description>
</item>

<item>
    <title>Первый релиз многопоточного HTML-парсера MyHTML (lastmac)</title>
    <link>https://opennet.ru/openforum/vsluhforumID3/108541.html#159</link>
    <pubDate>Fri, 15 Jul 2016 15:13:13 GMT</pubDate>
    <description>Спасибо!&lt;br&gt;&lt;br&gt;Если перейдете на MyHTML то дайте знать, интересно кто использует у себя и как.&lt;br&gt;</description>
</item>

<item>
    <title>Первый релиз многопоточного HTML-парсера MyHTML (dq0s4y71)</title>
    <link>https://opennet.ru/openforum/vsluhforumID3/108541.html#158</link>
    <pubDate>Fri, 15 Jul 2016 09:59:23 GMT</pubDate>
    <description>Тогда надо было написать &quot;поддерживает ООП&quot; или что-нибудь &quot;визуальное&quot;. Школота это понимает.&lt;br&gt;</description>
</item>

<item>
    <title>Первый релиз многопоточного HTML-парсера MyHTML (Vsevolod Stakhov)</title>
    <link>https://opennet.ru/openforum/vsluhforumID3/108541.html#157</link>
    <pubDate>Fri, 15 Jul 2016 09:07:49 GMT</pubDate>
    <description>Очень интересный набор фич и производительность, спасибо за работу! &lt;br&gt;&lt;br&gt;Жалко, что проекта не было, когда я искал подходящий (как минимум, по скорости) парсер html для своего rspamd - пришлось написать собственный велосипед, заточенный только под фильтрацию спама. Впрочем, возможно, будет иметь смысл перейти на ваше решение в будущем.&lt;br&gt;&lt;br&gt;</description>
</item>

</channel>
</rss>
