<?xml version="1.0" encoding="koi8-r"?>
<rss version="0.91">
<channel>
    <title>OpenForum RSS: Text mining - дать оценку тексту</title>
    <link>https://opennet.me/openforum/vsluhforumID9/10049.html</link>
    <description>Добрый день, уважаемые форумчане!&lt;br&gt;&lt;br&gt;Суть задачи довольно простая, на первый взгляд - &lt;br&gt;1. найти подходящую программу/доработать существующую,&lt;br&gt;2. произвести &quot;тренировку&quot;, используя существующие тексты, &lt;br&gt;3. на ввод программы подать произвольный текст,&lt;br&gt;4. на выходе получить оценку в виде баллов (не суть в каком виде, главное это наличие оценки)&lt;br&gt;&lt;br&gt;Такая программа есть, она называется спам-фильтр (отправлять текст через MTA), но пока мне эта идея кажется безумной и наверняка можно упереться в &quot;заточенность&quot; архитектуры спам-фильтра.&lt;br&gt;Мне на глаза попался opennlp, и вроде бы в нем есть необходимый функционал, но очень плохо документирован, во всяком случае внешние команды оболочки (API пока тем более для меня темный лес).&lt;br&gt;Или может уже есть что-то, основанное на муравьином алгоритме? http://math.nsc.ru/conference/zont09/reports/43Schurevich-Kryuchkova.pdf&lt;br&gt;&lt;br&gt;Что можно взять за основу и не изобретать велосипед? Желательно чтобы &quot;это&quot; поддерживало обработку русского языка и было достаточно документировано.&lt;br&gt;&lt;br&gt;С</description>

<item>
    <title>Text mining - дать оценку тексту (booggyman)</title>
    <link>https://opennet.me/openforum/vsluhforumID9/10049.html#6</link>
    <pubDate>Sat, 24 Oct 2015 17:07:00 GMT</pubDate>
    <description>&amp;gt; Мда, молодежь пошла - ни мозгов, ни фантазии, ни юмора.&lt;br&gt;&lt;br&gt;Похоже, неверно истолковал ваше сообщение. Эмоции.&lt;br&gt;</description>
</item>

<item>
    <title>Text mining - дать оценку тексту (booggyman)</title>
    <link>https://opennet.me/openforum/vsluhforumID9/10049.html#5</link>
    <pubDate>Sat, 24 Oct 2015 07:17:01 GMT</pubDate>
    <description>&amp;gt; Мда, молодежь пошла - ни мозгов, ни фантазии, ни юмора.&lt;br&gt;&lt;br&gt;Знаете, это мой первый вопрос за несколько последних лет.&lt;br&gt;То, что вы называете &quot;мозгами, фантазией и юмором&quot;, для меня есть снобизм и агрессия.&lt;br&gt;&lt;br&gt;В конечном счете, вы можете просто пройти мимо этой темы и не связываться с глупым человеком, а показать свой &quot;мозг, фантазию, юмор&quot; в комментариях к новостям. Впрочем, я вам не указ.&lt;br&gt;&lt;br&gt;Так или иначе, решение найдено.&lt;br&gt;</description>
</item>

<item>
    <title>Text mining - дать оценку тексту (Pahanivo)</title>
    <link>https://opennet.me/openforum/vsluhforumID9/10049.html#4</link>
    <pubDate>Fri, 23 Oct 2015 17:37:58 GMT</pubDate>
    <description>Мда, молодежь пошла - ни мозгов, ни фантазии, ни юмора.&lt;br&gt;&lt;br&gt;</description>
</item>

<item>
    <title>Text mining - дать оценку тексту (booggyman)</title>
    <link>https://opennet.me/openforum/vsluhforumID9/10049.html#3</link>
    <pubDate>Fri, 23 Oct 2015 16:03:30 GMT</pubDate>
    <description>&amp;gt; Я сегодня добрый:&lt;br&gt;&amp;gt;#!/bin/bash &lt;br&gt;&amp;gt; cat &amp;gt;/dev/null &lt;br&gt;&amp;gt; echo 3+&lt;br&gt;&lt;br&gt;Характер Andrey Mitrofanov в 3-х строках&lt;br&gt;</description>
</item>

<item>
    <title>Text mining - дать оценку тексту (booggyman)</title>
    <link>https://opennet.me/openforum/vsluhforumID9/10049.html#2</link>
    <pubDate>Fri, 23 Oct 2015 16:01:31 GMT</pubDate>
    <description>&amp;gt;&#091;оверквотинг удален&#093;&lt;br&gt;&amp;gt; Такая программа есть, она называется спам-фильтр (отправлять текст через MTA), но пока &lt;br&gt;&amp;gt; мне эта идея кажется безумной и наверняка можно упереться в &quot;заточенность&quot; &lt;br&gt;&amp;gt; архитектуры спам-фильтра.&lt;br&gt;&amp;gt; Мне на глаза попался opennlp, и вроде бы в нем есть необходимый &lt;br&gt;&amp;gt; функционал, но очень плохо документирован, во всяком случае внешние команды оболочки &lt;br&gt;&amp;gt; (API пока тем более для меня темный лес).&lt;br&gt;&amp;gt; Или может уже есть что-то, основанное на муравьином алгоритме? http://math.nsc.ru/conference/zont09/reports/43Schurevich-Kryuchkova.pdf &lt;br&gt;&amp;gt; Что можно взять за основу и не изобретать велосипед? Желательно чтобы &quot;это&quot; &lt;br&gt;&amp;gt; поддерживало обработку русского языка и было достаточно документировано.&lt;br&gt;&amp;gt; Спасибо.&lt;br&gt;&lt;br&gt;Сам себе: зря парился, спам-фильтр bogofilter отлично подошел для этих целей.&lt;br&gt;&lt;br&gt;# echo &quot;Наш замечательный текст&quot; &amp;#124; bogofilter -p &amp;#124; grep spamicity &amp;#124; awk -F&quot;,&quot; &apos;&#123;print $3&#125;&apos;&lt;br&gt; spamicity=0.520000&lt;br&gt;&lt;br&gt;&lt;br&gt;</description>
</item>

<item>
    <title>Text mining - дать оценку тексту (Andrey Mitrofanov)</title>
    <link>https://opennet.me/openforum/vsluhforumID9/10049.html#1</link>
    <pubDate>Fri, 23 Oct 2015 12:47:18 GMT</pubDate>
    <description>&amp;gt; 3. на ввод программы подать произвольный текст, &lt;br&gt;&amp;gt; 4. на выходе получить оценку в виде баллов (не суть в каком &lt;br&gt;&amp;gt; виде, главное это наличие оценки) &lt;br&gt;&lt;br&gt;Я сегодня добрый:&#091;CODE&#093;#!/bin/bash&lt;br&gt;&lt;br&gt;cat &amp;gt;/dev/null&lt;br&gt;&lt;br&gt;echo 3+&#091;/CODE&#093;&lt;br&gt;</description>
</item>

</channel>
</rss>
