The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

Обзор проекта по созданию системы смыслового поиска

26.09.2006 16:09

В заметке "Open source search technology goes beyond keywords" рассказывается про проект Semantic Indexing Project позволяющий вместо традиционной обработки ключевых слов выявить смысловые связи между поисковой фразой и документами в базе, отталкиваясь от близости слов по смыслу.

Для наглядного представления семантических связей в документе, разработана специальная утилита.

Базовый код (Semantic-Engine) написан на Си++, также присутствует интерфейсный модуль на Perl. Все наработки проекта распространяются под лицензией GPL.

  1. Главная ссылка к новости (http://software.newsforge.com/...)
Лицензия: CC BY 3.0
Короткая ссылка: https://opennet.ru/8400-search
Ключевые слова: search
При перепечатке указание ссылки на opennet.ru обязательно


Обсуждение (6) Ajax | 1 уровень | Линейный | +/- | Раскрыть всё | RSS
  • 1.1, bool (?), 16:44, 26/09/2006 [ответить]  
  • +/
    Это что-то наподобии http://search.quintura.ru/ ???
     
     
  • 2.2, vilfred (?), 20:16, 26/09/2006 [^] [^^] [^^^] [ответить]  
  • +/
    странно, но вот тож самое но в 2001 году написано просто как идея:

    http://genphys.phys.msu.ru/~dmitriyk/perl/base.shtml#fast

     
     
  • 3.3, vilfred (?), 20:17, 26/09/2006 [^] [^^] [^^^] [ответить]  
  • +/
    начинать читать с "Поиск по маске слов"... ссылка сначала про самопальное хеширование.
     
     
  • 4.4, CDigger (?), 02:47, 27/09/2006 [^] [^^] [^^^] [ответить]  
  • +/
    Очень интересно... Особенно с учетом того, что статья наполовину в разных кодировках :D
    Увлекательное чтение.
     
     
  • 5.6, vilfred (?), 22:25, 27/09/2006 [^] [^^] [^^^] [ответить]  
  • +/
    да потому што это никому нах не надо... там половина в кои, половина в винде...
     
  • 2.5, dkrot (??), 11:45, 27/09/2006 [^] [^^] [^^^] [ответить]  
  • +/
    Quintura никаких смысловых связей не выделяет. Её алгоритм куда проще - выцепление блтзлежаиших с искомыми слов минуя незначимые части речи и стоп-слова. А далее по дистанции ранжирование.
    Гораздо более привлекательная реализация: http://vivisimo.com.
     
     Добавить комментарий
    Имя:
    E-Mail:
    Текст:



    Партнёры:
    PostgresPro
    Inferno Solutions
    Hosting by Hoster.ru
    Хостинг:

    Закладки на сайте
    Проследить за страницей
    Created 1996-2024 by Maxim Chirkov
    Добавить, Поддержать, Вебмастеру