The OpenNET Project / Index page

[ новости /+++ | форум | wiki | теги | ]

форумы  помощь  поиск  регистрация  майллист  вход/выход  слежка  RSS
"Релиз поискового движка Apache Nutch 2.0"
Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Изначальное сообщение [ Отслеживать ]

"Релиз поискового движка Apache Nutch 2.0"  +/
Сообщение от opennews (??) on 11-Июл-12, 00:09 
Организация Apache Software Foundation представила (https://blogs.apache.org/foundation/entry/the_apache_softwar...) релиз Apache Nutch 2.0 (http://nutch.apache.org/) - модульного фреймворка для построения поисковых систем, написанного на языке Java и основанного на технологиях  Lucene, Solr, Tika, Hadoop и Gora, адаптированных для специфики поиска в Web (например, поддерживается crawler, база ссылочной связи, парсинг HTML и других форматов). Архитектура Nutch позволяет разработчикам легко создавать плагины для обработки нового медиа-контента, получения данных через нестандартные каналы, для формирования типовых запросов или организации поискового кластера.


В новой версии представлен ряд новых средств для построения высокосасштабируемых  систем индексации, абстрагированных от типа хранилища, что позволяет использовать как хранилища для больших объемов данных, такие как  Apache Accumulo, Apache Avro, Apache Cassandra, Apache HBase и HDFS, так и SQL-базы и размещаемые в памяти NoSQL БД. На базе Nutch 2.0, запущенного поверх 34-узлового Hadoop-кластера, построен поисковый сервис компании Kalooga, в индексе которого находится более миллиарда страниц.


URL: https://blogs.apache.org/foundation/entry/the_apache_softwar...
Новость: https://www.opennet.ru/opennews/art.shtml?num=34303

Ответить | Правка | Cообщить модератору

Оглавление

Сообщения по теме [Сортировка по времени | RSS]


7. "Релиз поискового движка Apache Nutch 2.0"  +/
Сообщение от ононим on 11-Июл-12, 00:56 
есть какие опен-сорс решения для замены локального яндекс поиска? он крив и убог, и с 2010 года не поддерживается.

искать надо по локальным PDF документам и doc файлам.

Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

8. "Релиз поискового движка Apache Nutch 2.0"  +/
Сообщение от KDED on 11-Июл-12, 01:22 
> есть какие опен-сорс решения для замены локального яндекс поиска? он крив и
> убог, и с 2010 года не поддерживается.
> искать надо по локальным PDF документам и doc файлам.

NEPOMUK

Ответить | Правка | ^ к родителю #7 | Наверх | Cообщить модератору

10. "Релиз поискового движка Apache Nutch 2.0"  +/
Сообщение от ононим on 11-Июл-12, 02:11 
желательно чтобы работал через веб.
Ответить | Правка | ^ к родителю #8 | Наверх | Cообщить модератору

22. "Релиз поискового движка Apache Nutch 2.0"  +/
Сообщение от filosofem (ok) on 12-Июл-12, 02:27 
xapian-omega
Ответить | Правка | ^ к родителю #10 | Наверх | Cообщить модератору

13. "Релиз поискового движка Apache Nutch 2.0"  +/
Сообщение от Аноним (??) on 11-Июл-12, 09:15 
А, собственно, Nutch/Solr чем не устраивают?
Ответить | Правка | ^ к родителю #7 | Наверх | Cообщить модератору

23. "Релиз поискового движка Apache Nutch 2.0"  +/
Сообщение от Axel email(??) on 12-Июл-12, 17:35 
> искать надо по локальным PDF документам и doc файлам.

Solr + Tika

Ответить | Правка | ^ к родителю #7 | Наверх | Cообщить модератору

14. "Релиз поискового движка Apache Nutch 2.0"  –5 +/
Сообщение от A.Stahl on 11-Июл-12, 09:25 
>Java

<troll mode>
Беда в том, что кроссплатформенная жаба работает нормально только под винду.
Да и вообще проприетарщина во все поля.
Я бы может и согласился с целесообразностью  поддержки старого жабо-кода, но совсем не понимаю зачем новый код писать на языке, направление которому задаёт Оракл. О что такое Оракл? Это современный Apple и будущий SCO (зомби-версия).

</troll mode>

Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

15. "Релиз поискового движка Apache Nutch 2.0"  +5 +/
Сообщение от edwin3d email on 11-Июл-12, 10:00 
> Беда в том, что кроссплатформенная жаба работает нормально только под винду.
> Да и вообще проприетарщина во все поля.

Думается Вы просто решили подразнить читателей.
Потому как это явное передергивание.
Реальные проблемы с переносимостью Java приложений имеют место быть:
1) Скомпилировали в одном JDK, а запускаем в другом.
(к слову чаще всего именно в этом кроются большиство проблем с корпоративными
приложениями ... сейчас, когда допилили OpenJRE, стало не так и плохо, а вот раньше да - дружили далеко не всегда)
Отношение к ОС не имеет никакого, да и ситуация в этой сфере уже стала намного лучше.
2) JavaFX ... - это да, но без этого можно жить аж бегом, потому как уже очень специфическа штучка.
3) Есть нюансы с Java Applet. Я сам видет апплет, написаный быдлокодерами, который работал только под WinXP SP2 с IE6.0 и в JVM 1.4.x .

В остальном .... есть вагон и малая тележка Java приложений, которые прекрастно работают как под Win так и Linux.
Таковых большиство ...

> направление которому задаёт Оракл

Спорить не буду.
Задам простой вопрос: Будте так любезны. порекомендуйте ка мне язык, на котором я бы смог так же, как на Java писать кроссплатформенные серверные приложение, ориентированные на высокую нагрузку ?
У которого все хорошо с многопоточностью и т.д. ?
  

Ответить | Правка | ^ к родителю #14 | Наверх | Cообщить модератору

16. "Релиз поискового движка Apache Nutch 2.0"  +/
Сообщение от super anonim on 11-Июл-12, 10:24 
да не корми его =))
Ответить | Правка | ^ к родителю #15 | Наверх | Cообщить модератору

17. "Релиз поискового движка Apache Nutch 2.0"  +3 +/
Сообщение от Аноним (??) on 11-Июл-12, 10:32 
> Задам простой вопрос: Будте так любезны. порекомендуйте ка мне язык, на котором я бы смог так же, как на Java писать кроссплатформенные серверные приложение, ориентированные на высокую нагрузку ?
> У которого все хорошо с многопоточностью и т.д. ?

Erlang.
И у него с перечисленными вами пунктами все даже лучше.
И сама система гораздо более качественная.

Ответить | Правка | ^ к родителю #15 | Наверх | Cообщить модератору

18. "Релиз поискового движка Apache Nutch 2.0"  +/
Сообщение от A.Stahl on 11-Июл-12, 11:07 
Я честный тролль и от ответов стараюсь не уходить.
>писать кроссплатформенные серверные приложение, ориентированные на высокую нагрузку ?

C/C++
Только жаба-подход "собрал единожды -- запускается везде" меняется на "написал единожды -- компилируется везде".

Многопоточные серверы писать на плюсах одно удовольствие.

>Отношение к ОС не имеет никакого, да и ситуация в этой сфере уже стала намного лучше.

Не люблю троллить на базе слухов, но сейчас лень искать подтверждение. Была какая-то возня с тем, что Оракл очень не хотел видеть openJDK в линуксовых дистрибутивах... Или наоборот свой проприетарный бинариник? Не помню точно, но факт такой, что Оракл вставляет палки в кросплатформенность джавы. Причём целенаправленно.

Ответить | Правка | ^ к родителю #15 | Наверх | Cообщить модератору

19. "Релиз поискового движка Apache Nutch 2.0"  +/
Сообщение от кверти on 11-Июл-12, 11:56 
>Была какая-то возня с тем, что Оракл очень не хотел видеть openJDK в линуксовых дистрибутивах... Или наоборот свой проприетарный бинариник?

https://www.opennet.ru/opennews/art.shtml?num=31622

Ответить | Правка | ^ к родителю #18 | Наверх | Cообщить модератору

21. "Релиз поискового движка Apache Nutch 2.0"  +/
Сообщение от Аноним (??) on 11-Июл-12, 13:07 
>Я честный тролль

Насмищил, содомит.

Ответить | Правка | ^ к родителю #18 | Наверх | Cообщить модератору

20. "Релиз поискового движка Apache Nutch 2.0"  +/
Сообщение от samm email(ok) on 11-Июл-12, 13:06 
по моему опыту - огромный кусок проблем это jni, который быдлокодеры юзают к месту и нет. Или использование из жабы криптопровайдеров специфичных для ОС (например, windows crypto API, который юзает аплет моего банка). Вины языка тут нет, но простой пользователь, естественно, этого не понимает.
Ответить | Правка | ^ к родителю #15 | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Спонсоры:
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2021 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру