The OpenNET Project / Index page

[ новости /+++ | форум | wiki | теги | ]

30.09.2005 14:48  Яндекс открыл доступ к научным работам по поисковым технологиям

Открыт доступ к более чем двадцати работам, участвовавшим в конкурсе на получения грантов от компании Yandex.

Можно выделить следующие интересные материалы:

  • Некоторые способы определения географической привязки IP адресов.

    Анализ текста.

  • Формирование многоязычных словарей и их использование при кросс-языковом поиске информации.
  • Снятие лексико-семантической омонимии в новостных и газетно-журнальных текстах: поверхностные фильтры и статистическая оценка.
  • Интерактивное разрешение лексической и синтаксической неоднозначности в системах автоматической обработки естественного языка.
  • Сравнение эффективности двух методик снятия лексической и морфологической неоднозначности для русского языка (скрытая модель Маркова и синтаксический анализатор именных групп).
  • Автоматическое реферирование веб-документов с учетом запроса.

    Распознавание изображений

  • Быстрая классификация JPEG–изображений.
  • Распознавание типовых портретных изображений в задаче автоматической классификации.

    Технологии индексации и ранжировния

  • Исследование эффективности алгоритмов выполнения алгебраических операций к XML-данным в распределенных запросах.
  • Исследование эффективности применения методов совместного анализа текстов и гиперссылок для поиска тематических сообществ.
  • Оптимизация расчета ссылочной популярности и учета ее при ранжировании результатов поиска.

  • Извлечение значимой информации из web-страниц для задач информационного поиска.
  • Порождение кластеров документов-дубликатов: подход, основанный на поиске частых замкнутых множеств признаков.
  • Структура русскоязычной части глубинного Веба. (динамический контент доступный через работу с формами);

    Каталогизирвоание

  • Оптимизация процедуры автоматического пополнения веб-каталога.
  • Классификация веб-страниц на основе алгоритмов машинного обучения.
  • Автоматическая рубрикация web-страниц в интернет-каталоге с иерархической структурой.

    Агрегирование новостей

  • Метод кластеризации текстов, учитывающий совместную встречаемость ключевых терминов, и его применение к анализу тематической структуры новостного потока, а также ее динамики.
  • Формирование выпуска новостей на основе автоматического анализа новостных сообщений.
  • Обработка потока новостей на основе больших лингвистических ресурсов.

    1. Главная ссылка к новости (http://company.yandex.ru/grant...)
    2. webplanet.ru: Научные работы "Яндекса" — в открытом доступе
    Лицензия: CC-BY
    Источник: webplanet.ru
    Тип: Интересно / яз. русский
    Ключевые слова: search, text
    При перепечатке указание ссылки на opennet.ru обязательно
    Обсуждение RSS
     
  • 1, McLone (?), 06:28, 02/10/2005 [ответить]    [к модератору]
  • +/
    big yandex is watching you...
    Думаю, стоит http://tor.eff.org юзать почти постоянно.
     

     Добавить комментарий
    Имя:
    E-Mail:
    Заголовок:
    Текст:


      Закладки на сайте
      Проследить за страницей
    Created 1996-2019 by Maxim Chirkov  
    ДобавитьПоддержатьВебмастеруГИД  
    Hosting by Ihor