The OpenNET Project / Index page

[ новости /+++ | форум | wiki | теги | ]

форумы  помощь  поиск  регистрация  майллист  вход/выход  слежка  RSS
"Создатели Wikipedia представили проект структурированной баз..."
Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Изначальное сообщение [ Отслеживать ]

"Создатели Wikipedia представили проект структурированной баз..."  +/
Сообщение от opennews on 02-Апр-12, 21:45 
Фонд Wikimedia анонсировал (http://blog.wikimedia.org/2012/03/30/the-wikipedia-data-revo.../) новый проект - Wikidata (http://meta.wikimedia.org/wiki/Wikidata), в рамках которого планируется подготовить доступную для совместного наполнения структурированную базу данных, в которой будут собраны разнообразные сведения и знания. Это первый значительны проект Wikimedia за последние 7 лет. Wikidata станет центральным сервисом для доступа к структурированным данным из всех статей свободной энциклопедии, примерно как в настоящее время Wikimedia Commons выступает в роли хранилища мультимедиа файлов.


Например, в Wikidata может быть сохранена численность населения определённого города, к которой в дальнейшем можно обращаться из статей Wikipedia по ключу с названием города и атрибутом, ассоциированным с численностью населения. При необходимости изменения данных, достаточно будет поправить запись в БД, после чего во всех статьях энциклопедии, упоминающих численность населения города N, будут использоваться новые сведения, без необходимость ручного выявления и правки этих статей. Кроме численности населения, можно сопоставить с городом различные географические и политические сведения, такие как имя мэра города, телефонный код, города-спутники и т.п.

Данные будут доступны не только для ручного редактирования, но и для полностью автоматизированной машинной обработки. Таким образом, данные могут быть задействованы в разнообразных сторонних приложениях, таких как системы аннотирования научных статей. Система будет поддерживать гибкие средства локализации, позволяющие хранить единые представления фактов на всех языках, поддерживаемых в Wikipedia (даже если статья не переведена, для всех языков можно будет вывести типовые факты). Данные будут предоставляться на условиях лицензии Creative Commons.


На разработку начального прототипа проекта выделено 1.3 млн евро, половина из которых пожертвовано Институтом решения проблем искусственного интеллекта (http://www.ai-squared.org/) (AI²), созданного Полом Алленом (http://ru.wikipedia.org/wiki/%D0%9F%D0%B...). Остальную часть финансирования предоставила компания Google и фонд Gordon and Betty Moore Foundation. По мнению вице-президента института AI² проект Wikidata является следующим шагом эволюции  Wikipedia, трансформируя способ размещения энциклопедических данных, делая их доступными более широкой аудитории. Проект Wikidata будет основан на семантических технологиях, которые позволят упростить выявление нужных сведений.


Разработка проекта разделена на три фазы. Первую фазу планируется завершить в августе нынешнего года. На данной стадии будет проведена работа по централизации ссылок между версиями Wikipedia на разных языках.  На второй стадии, результаты которой планируется представить в декабре 2012 года, редакторы получат возможность добавления и использования данных в Wikidata. Финальная фаза ознаменует собой появление средств для автоматического создания списков и схем, основанных на данных в Wikidata.


URL: http://blog.wikimedia.org/2012/03/30/the-wikipedia-data-revo.../
Новость: http://www.opennet.ru/opennews/art.shtml?num=33511

Ответить | Правка | Cообщить модератору

Оглавление

Сообщения по теме [Сортировка по времени | RSS]


1. "Создатели Wikipedia представили проект структурированной баз..."  +9 +/
Сообщение от Адольф on 02-Апр-12, 21:45 
Wikipedia отличный пример того, какие замечательные вещи может создавать некоммерческое общество
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

20. "Создатели Wikipedia представили проект структурированной баз..."  –1 +/
Сообщение от Самый цимес on 03-Апр-12, 10:22 
Надо добавлять фразу "на пожертвования". Полностью какие замечательные вещи может делать некоммерческое сообщество на пожертвования. И вся радость куда-то пропадает.
Ответить | Правка | ^ к родителю #1 | Наверх | Cообщить модератору

24. "Создатели Wikipedia представили проект структурированной баз..."  +3 +/
Сообщение от FractalizeR email(ok) on 03-Апр-12, 11:10 
Куда она пропадает? На одном энтузиазме их инфраструктуру не удержать. Что плохого в том, что проект существует на пожертвования?
Ответить | Правка | ^ к родителю #20 | Наверх | Cообщить модератору

26. "Создатели Wikipedia представили проект структурированной баз..."  –11 +/
Сообщение от Аноним (??) on 03-Апр-12, 11:17 
Правда, сюрприз, аноны? - коммунизма нет. Все в этом мире стоит деньги. И лишь время анонов совершенно бесплатно. Прошу заметить - безвозвратно уходящее время.
Ответить | Правка | ^ к родителю #24 | Наверх | Cообщить модератору

29. "Создатели Wikipedia представили проект структурированной баз..."  +4 +/
Сообщение от robux email(ok) on 03-Апр-12, 13:24 
Сюрприз для тебя, сорос-недоучка: есть люди их желания и дела. А про деньги иди гусям расскажи.
Ответить | Правка | ^ к родителю #26 | Наверх | Cообщить модератору

4. "Создатели Wikipedia представили проект структурированной баз..."  –2 +/
Сообщение от Аноним (??) on 02-Апр-12, 21:49 
А если ее(викидату) обрушат - обрушатся все ссылающиеся проекты?
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

6. "Создатели Wikipedia представили проект структурированной баз..."  +1 +/
Сообщение от Аноним (??) on 02-Апр-12, 21:53 
Капитан, не скромничайте.
Ответить | Правка | ^ к родителю #4 | Наверх | Cообщить модератору

21. "Создатели Wikipedia представили проект структурированной баз..."  +1 +/
Сообщение от тоже Аноним (ok) on 03-Апр-12, 10:40 
База данных - потенциально куда более надежное хранилище, чем файлопомойка.
Ее можно динамично реплицировать, дублировать, кэшировать... при этом вы будете работать со структурированной информацией, а не с аморфной кучей.
Ответить | Правка | ^ к родителю #4 | Наверх | Cообщить модератору

60. "Создатели Wikipedia представили проект структурированной баз..."  +1 +/
Сообщение от XoRe (ok) on 04-Апр-12, 00:53 
> А если ее(викидату) обрушат - обрушатся все ссылающиеся проекты?

Берите больше - представьте, что будет, если порушить гугль со всеми его сервисами!
Дело за малым - обрушить)

Ответить | Правка | ^ к родителю #4 | Наверх | Cообщить модератору

5. "Создатели Wikipedia представили проект структурированной баз..."  +/
Сообщение от Аноним (??) on 02-Апр-12, 21:51 
Это будет в RDF?
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

7. "Создатели Wikipedia представили проект структурированной баз..."  +/
Сообщение от Аноним (??) on 02-Апр-12, 21:54 
plain text
Ответить | Правка | ^ к родителю #5 | Наверх | Cообщить модератору

8. "Создатели Wikipedia представили проект структурированной баз..."  +/
Сообщение от Аноним (??) on 02-Апр-12, 21:55 
>The data will be exported in different formats, especially RDF

Таки RDF, а это вин! веб 3.0 подкрался незаметно...

Ответить | Правка | ^ к родителю #7 | Наверх | Cообщить модератору

9. "Создатели Wikipedia представили проект структурированной баз..."  +3 +/
Сообщение от Все тот же аноним on 02-Апр-12, 22:56 
> Таки RDF, а это вин!

Большую чушь сложно придумать. Вы вообще представляете, что есть RDF?

По тексту новости: судя по анонсу, есть сомнения в том, что разработчики понимают, каким образом должны быть структурированы данные. На самом деле задача гораздо шире анонсируемой и при текущей политике организаторов решения не имеет. Абсолютно необходимые шаги - контекст и семантические отношения, реализовать которые в данном случае будет сложно.

Ответить | Правка | ^ к родителю #8 | Наверх | Cообщить модератору

12. "Создатели Wikipedia представили проект структурированной баз..."  +/
Сообщение от Avator (ok) on 02-Апр-12, 23:46 
Зачем вы так категорично?
Почитайте книгу Тима Бернерса Ли "Weaving Semantic web".
Это как раз Web 3.0 и есть по сути =) Точнее первые  шаги в эту сторону.
Ответить | Правка | ^ к родителю #9 | Наверх | Cообщить модератору

18. "Создатели Wikipedia представили проект структурированной баз..."  +/
Сообщение от Все тот же аноним on 03-Апр-12, 07:49 
По сути это кривая поделка. Волшебных слов RDF для взлета недостаточно. До Web 3.0 - как до Луны пешком.

Куча способов рефакторинга с учетом, кстати, методов, позволяющих рубить бабло.

Ответить | Правка | ^ к родителю #12 | Наверх | Cообщить модератору

63. "Создатели Wikipedia представили проект структурированной баз..."  +/
Сообщение от Avator (ok) on 04-Апр-12, 03:50 
> По сути это кривая поделка. Волшебных слов RDF для взлета недостаточно. До
> Web 3.0 - как до Луны пешком.
> Куча способов рефакторинга с учетом, кстати, методов, позволяющих рубить бабло.

Извините, я как-то Тиму Бернерсу Ли немного больше верю =)

Ответить | Правка | ^ к родителю #18 | Наверх | Cообщить модератору

10. "Создатели Wikipedia представили проект структурированной баз..."  +3 +/
Сообщение от Аноним (??) on 02-Апр-12, 22:59 
Так вот ты какой, 1984…
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

16. "Создатели Wikipedia представили проект структурированной баз..."  +2 +/
Сообщение от 123 (??) on 03-Апр-12, 00:38 
да, что б много газет не перепечатывать!
Ответить | Правка | ^ к родителю #10 | Наверх | Cообщить модератору

14. "Создатели Wikipedia представили проект структурированной баз..."  –3 +/
Сообщение от Marbleless on 03-Апр-12, 00:15 
Я джва года ждал...
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

15. "Создатели Wikipedia представили проект структурированной баз..."  +10 +/
Сообщение от Аноним (??) on 03-Апр-12, 00:26 
Это проект немецкой Wikimedia Deutschland. Все хорошие нововведения в Википедии последнее время идут от немцев (например, интеграция с OpenStreetMap, поддержка TIFF, создание toolserver - хостинга для скриптов, нужных для различных околовикипедийных работ и т.д.). Американский же фонд, хотя и получает львиную долю пожертвований, полностью импотентен и управляется достаточно малоадекватными товарищами. Поэтому неприятно видеть, что это достижение в новости приписано именно американцам.
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

23. "Создатели Wikipedia представили проект структурированной баз..."  +4 +/
Сообщение от минонА on 03-Апр-12, 10:57 
Зато у американских товарищей большие слёзные глаза и и стоять с протянутой рукой получается лучше. А для попрошаек это важнее идейности и креативности.
Ответить | Правка | ^ к родителю #15 | Наверх | Cообщить модератору

37. "Создатели Wikipedia представили проект структурированной баз..."  +/
Сообщение от abc (??) on 03-Апр-12, 14:23 
У всех четко разделенные обязанности: американцы деньги добавыют, немцы нововведения делают :)
Ответить | Правка | ^ к родителю #15 | Наверх | Cообщить модератору

22. "Создатели Wikipedia представили проект структурированной баз..."  +/
Сообщение от Аноним (??) on 03-Апр-12, 10:41 
Я правильно понимаю, что они хотят вики загнать в семантическую сеть? То есть, по сути, вместо базы данных построить базу знаний, а отношения описывать (в том числе) на JSON?
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

25. "Создатели Wikipedia представили проект структурированной баз..."  –2 +/
Сообщение от Ваня (??) on 03-Апр-12, 11:13 
Да. Только вот задача нерешаема на нашем уровне знаний.

Простой пример: опишите ВСЕ отношения которые связывают "дом" и "собаку". Включая то что они оба являются материальными (физика материальных тел), существуют только на планете Земля (ссылка на Землю, отсюда хвостик на Солнечную систему и нашу Галактику), и т.д.

Ответить | Правка | ^ к родителю #22 | Наверх | Cообщить модератору

27. "Создатели Wikipedia представили проект структурированной баз..."  +/
Сообщение от тоже Аноним (ok) on 03-Апр-12, 13:02 
"Мы сами знаем, что она не имеет решения, – сказал Хунта, немедленно ощетиниваясь. – Мы хотим знать, как ее решать" (АБС)
"Замахивайся на великое, чтобы сделать хотя бы малое" (тоже кто-то из классиков)
Проще говоря, не можешь решить большую проблему - решай попутные.
Ответить | Правка | ^ к родителю #25 | Наверх | Cообщить модератору

30. "Создатели Wikipedia представили проект структурированной баз..."  +/
Сообщение от Crazy Alex (ok) on 03-Апр-12, 13:38 
А если не выпендриваться - получаем просто удобное хранилище для фактажа, который в википедии уже есть. Вроде того же населения городов. По факту это означает основательное упрощение жизни для различных языковых версий как минимум.
Ответить | Правка | ^ к родителю #25 | Наверх | Cообщить модератору

32. "Создатели Wikipedia представили проект структурированной баз..."  –1 +/
Сообщение от Ваня (??) on 03-Апр-12, 14:04 
Почитай историю языка UNL (Universal Network Language), разрабатываемого в 80-90-е годы. А уже потом, владея знаниями и не "выпендриваясь" сделай выводы.
Ответить | Правка | ^ к родителю #30 | Наверх | Cообщить модератору

34. "Создатели Wikipedia представили проект структурированной баз..."  +1 +/
Сообщение от Аноним (??) on 03-Апр-12, 14:08 
Мне кажется что вы тут не правы. Между БД и БЗ разница существенная: БД - хранит данные, БЗ - описывает предметную область. У БД я могу запросить данные, а с помощью БЗ я могу разрешить в истину или ложь свое утверждение.

Согласитесь, что есть разница между запросом "какая численность Москвы" и запросом "Москва большой город?" А ведь стоит только добавить правила преобразований (критерии), и вуале! - экспертная система готова.

Да, инструментальные средства нужны иные. Но кое-что уже есть. К примеру ЯП Пролог.

Короч, первый шаг к Скайнет сделан, имхо.

Ответить | Правка | ^ к родителю #30 | Наверх | Cообщить модератору

35. "Создатели Wikipedia представили проект структурированной баз..."  –1 +/
Сообщение от Ваня (??) on 03-Апр-12, 14:11 
И вы тоже почитайте про UNL.
Ответить | Правка | ^ к родителю #34 | Наверх | Cообщить модератору

36. "Создатели Wikipedia представили проект структурированной баз..."  +/
Сообщение от Аноним (??) on 03-Апр-12, 14:21 
Речь идет, как мне кажется, не об UNL 80-х,  а уж скорее о трудах академика Поспелова (http://www.ccas.ru/personal/g_pospel/g_pospel.htm) в области семантических сетей в 60-х.
Ответить | Правка | ^ к родителю #35 | Наверх | Cообщить модератору

38. "Создатели Wikipedia представили проект структурированной баз..."  –1 +/
Сообщение от Ваня (??) on 03-Апр-12, 14:33 
И их тоже. А вдовесок что GREEN и ЗЕЛЁНЫЙ это не одно и то же. Когда анонимам станет понятно почему так, тогда и часть проблемы для них прояснится.
Ответить | Правка | ^ к родителю #36 | Наверх | Cообщить модератору

39. "Создатели Wikipedia представили проект структурированной баз..."  +/
Сообщение от Crazy Alex (ok) on 03-Апр-12, 15:31 
Да нет с этим всем никаких проблем если не пытаться клепать универсальное решение. Есть куча вполне конкретных и однозначных данных которые туда спокойно лягут. Улучшит это жизнь на сколько-то (а национальным википедиям точно улучшит) - вот и хорошо. Можно будет эти данные посторонним софтом доставать - совсем замечательно, в худшем случае просто для определённых областей будет более-менее доверенная база фактажа.

То есть плевать на GREEN и ЗЕЛЕНЫЙ, если можно будет выдернуть "последние данные по численности населения Бостона (США)". А если получится запросить "последние данные по численности городов США" в формате (город, численность, дата) - то и совсем хорошо, для кучи применений пригодится.

Ответить | Правка | ^ к родителю #38 | Наверх | Cообщить модератору

42. "Создатели Wikipedia представили проект структурированной баз..."  +/
Сообщение от Ваня (??) on 03-Апр-12, 16:18 
В русской вики есть раздел "Синтоистские святилища". В русской их 25, английской 23, японской 47. Упростило жизнь? А теперь найди в английской вики мой родную и до боли (и телефона) любимую платформу Панки. Упростило жизнь? Думаешь сможешь по английской вики найти список всех станций от ст.Москва-Товарная до пл.Новоебенёво? Валяй. Начинает доходить что языки в вики реализованы как отдельные миры, даже ссылки в конце разные, хотя в русской статьье могут ссылаться на английские (другие английские) ресурсы, чем в аналогичной английской.

Запросить можно и сейчас "Население" по тэгу "Города США". Только вот, гы, ты этой информации доверяешь? Если "на отъе**сь" - прокатит, если для дела - нет.

Для серьёзной энциклопедии не хватает каталога, а он строится по библиотечным (с его 5000-летней историей) правилам. Только у нас есть 2,6 ляма и на 5000-летнюю историю болт, сами умные.

Ответить | Правка | ^ к родителю #39 | Наверх | Cообщить модератору

43. "Создатели Wikipedia представили проект структурированной баз..."  +1 +/
Сообщение от Crazy Alex (ok) on 03-Апр-12, 16:51 
Лечитесь от перфекционизма. Где получится - будут использовать. И, понятное дело, чем дальше - тем в большем количестве мест получится.
А запросить сейчас население - глазками нормально, а автоматом - неудобно. И если в штатовской версии появились ноые данные - жди, пока в беларусской поправят. И да - для многих бытовых ситуаций точности Википедии достаточно, потому что вопрос обычно "пару десятков крупных городов" или что-то вроде. А если мало - ВольфрамАльфа и более серьёзные ресурсы в помощь. Кстати, еще один плюс - часть информации можно будет из того же Вольфрама и подобных хранилищ и тянуть/сверять.

А по святилищам - да, упростит - если организуют как "сущность + названия на разных языках" и будут выводить мастер-язык, если нет локального (как gettext тот же поступает). Тогда можно будет сунуть в русскую страницу одним махом этот список, увидеть, где нет русских названий и их добавить. Или не добавлять - один хрен лучше японские названия, чем никаких. Всё это давным-давно в локализациях софта обкатано.

Каталог же - он хорош по бедности, если толкового поиска нет. Поэтому - да, на 5000-летнюю историю начиная с глиняных табличек - таки болт, сейчас много лучше можем. Никто в здравом уме не будет строить каталог для статьи по всем мыслимым атрибутам, а выборку можно по чём угодно организовать.

Ответить | Правка | ^ к родителю #42 | Наверх | Cообщить модератору

45. "Создатели Wikipedia представили проект структурированной баз..."  +/
Сообщение от Все тот же аноним on 03-Апр-12, 16:54 
> Поэтому - да, на 5000-летнюю историю начиная с глиняных табличек - таки болт, сейчас много лучше можем.

Фатальное заблуждение.

Ответить | Правка | ^ к родителю #43 | Наверх | Cообщить модератору

47. "Создатели Wikipedia представили проект структурированной баз..."  +/
Сообщение от Crazy Alex (ok) on 03-Апр-12, 16:58 
>> Поэтому - да, на 5000-летнюю историю начиная с глиняных табличек - таки болт, сейчас много лучше можем.
> Фатальное заблуждение.

А детальнее?

Ответить | Правка | ^ к родителю #45 | Наверх | Cообщить модератору

49. "Создатели Wikipedia представили проект структурированной баз..."  +/
Сообщение от Все тот же аноним on 03-Апр-12, 17:19 
> А детальнее?

"Много лучше" - обманчивое впечатление. Много быстрее и много больше - да.

Ответить | Правка | ^ к родителю #47 | Наверх | Cообщить модератору

50. "Создатели Wikipedia представили проект структурированной баз..."  +/
Сообщение от Crazy Alex (ok) on 03-Апр-12, 17:24 
Ну так в случае википедии (которая нужна для "быстро и примерно посмотреть") это же и нужно?
Ответить | Правка | ^ к родителю #49 | Наверх | Cообщить модератору

62. "Создатели Wikipedia представили проект структурированной баз..."  +/
Сообщение от XoRe (ok) on 04-Апр-12, 01:26 
> - да, на 5000-летнюю историю начиная с глиняных табличек - таки
> болт, сейчас много лучше можем.

А вы в курсе, что современные БД работают по принципам этих глинаных табличек?
Например, знаете как переводится слово INDEX?
http://lingvo.yandex.ru/index/%D1%81%20%.../
Посмотрите там значения 3)а) и 3)б).

"Болт на глиняные таблички" - это примерно, как "нафиг индексы! чтение всей таблицы рулит!")

Просто современные мощности позволяют использовать МНОГО глиняных табличек.
Отдельную табличку для GREEN и отдельную для ЗЕЛЕНЫЙ.
И ещё 100500 табличек для их метаданных)

Ответить | Правка | ^ к родителю #43 | Наверх | Cообщить модератору

44. "Создатели Wikipedia представили проект структурированной баз..."  +/
Сообщение от Все тот же аноним on 03-Апр-12, 16:51 
Это первая проблема из тех, что на поверхности: синхронные языковые эквиваленты. Причем, с учетом национальных особенностей. Вторая проблема - неоднозначность: существование разных описаний одного и того же факта. Третья - изменяемость данных во времени. Четвертая - достоверность данных.

И только потом, решив эти задачи, можно начинать говорить о семантических отношениях.

Как-то так.

Ответить | Правка | ^ к родителю #42 | Наверх | Cообщить модератору

46. "Создатели Wikipedia представили проект структурированной баз..."  +/
Сообщение от Crazy Alex (ok) on 03-Апр-12, 16:58 
В пень перфекционизм. Вам же не AI на этом (и только на этом) обучать.

С эквивалентами софт локализации давным-давно работает, как это рещается все знают. Для названий объектов никаких особых национальных особенностей нет. А если где-то что-то выстрелит - ну будет без семантики лежать, руками в статью вписанное. С разными описаниями как раз у википедии, с её толпой редактирующих, опыт огромный - разберутся не хуже чем сейчас. Изменяемость данных во времени - ну так историю изменений хранить тоже никто не запрещал. Достоверность будет не лучше и не хуже чем сейчас в википедии. Даже повысить её можно легко - потому что структурированные данные можно легко сравнить/синхронизировать с другими источниками, если у кого-то будет такое желание.

Ответить | Правка | ^ к родителю #44 | Наверх | Cообщить модератору

48. "Создатели Wikipedia представили проект структурированной баз..."  +/
Сообщение от Все тот же аноним on 03-Апр-12, 17:16 
> С эквивалентами софт локализации давным-давно работает

Да. Два варианта: криво и очень криво.

> названий объектов никаких особых национальных особенностей нет

Разумеется, есть. И не только национальные. Конфессиональные, политические и пр. Очень простой вопрос: Южная Осетия - это что? А Тибет? Как пишется начальное "О" в ирландских фамилиях, какие есть варианты сортировки таких фамилий? Какие варианты используемого летосчисления вы знаете? Какие есть варианты пролептических календарей и почему?

Боюсь, вы не представляете, сколько существует аналогичных вопросов.

> руками в статью вписанное

Так и лежит. Огромная мусорная куча. Нравится - пользуйтесь на здоровье. Предпочитаю адекватные источники.

> ну так историю изменений хранить тоже никто не запрещал

Я знаю, как это делается. А вы?

Ответить | Правка | ^ к родителю #46 | Наверх | Cообщить модератору

51. "Создатели Wikipedia представили проект структурированной баз..."  +/
Сообщение от Crazy Alex (ok) on 03-Апр-12, 17:34 
У локализаций, в общем-то, ровно две проблемы: разная структура предложений и омонимия. Для софта это критично. Для википедии - нет - с омонимией и так приходится явно работать, и подстановки в середину фразы не нужны. Поэтому не вижу поля для кривизны.

Южную осетию суём и в автономные области Грузии и в государства и в российские колонии. То есть общий подход - если есть альт тренативные варианты - забиваем все. Тибет - то же самое. Ирландские фамилии - не в теме, но если есть мейнстримное правило - пользуемся им, если нет - суём все мейнчтримные варианты. При чём здесь летоисчисление вообще не пойму - преобразование из одной календарной системы в другую - чисто техническая задача, было бы известно в какой оригинал лежит и что пользователь хочет получить. В общем, не проблема это если не научную монграфию ипсать и не претендовать на аобсолютное знание.

И сейчас - да, куча. Вот будет меньшей кучей, кое-что будет более систематизировано чем сейчас. Дальше наверняка это дело подхватят. А так как википедией как надёжным источником в любом случе пользоваться нельзя - нужно своё исследование проводить, то мелкие ошибки не фатальны. Зато выборка вроде "в каких штатах какой процент убийств и разрешен ли там при этом огнестрел" будет строиться на ура с точностью вполне достаточной для выводов.

И да, я знаю как работают версионированные БД. Не rocket science ни разу, особенно если понимать, что 99,99% запросов будут к актуальной версии данных, т.е. доступ к архивам можно не оптимизировать никак.

Ответить | Правка | ^ к родителю #48 | Наверх | Cообщить модератору

52. "Создатели Wikipedia представили проект структурированной баз..."  +/
Сообщение от Ваня (??) on 03-Апр-12, 18:01 
А вот здесь мы приходим к GREEN и ЗЕЛЁНЫЙ. Это не одно и то же. Опросив носителей языка, попросив выбрать указанный цвет из 32 млрд.цветов мы узнаем что это разные цвета, хотя и похожие. Это пример несогласованности понятий. Напр. китайское "Му" на русский не переводится, а на ихние мовы не переводятся наши слова. Даже слова, имеющие перевод, не совпадают по значению, напр. "торговка" в русском имеет негативный оттенок, а "торговец" нет, а в английском оба слова однозначны, т.к. нет родов. В силу этого и ещё ряда причин ссылки возможным лишь по терминам. Одно и то же в разных науках называется по-разному. И мы приходим к библиотечному каталогу, когда мы не пытаемся познать и описать в одной книге весь мир, а лишь сохраняем накопленные знания с удобным и быстрым поиском (каталог + тэги) по ним.

Поисковые возможности вики: тэги, поиск по словам без учёта контекста, ссылки. Вместо того чтобы добавить каталог и объединить вики с существующими оцифрованными библиотеками (когда каждая статья будет ссылаться на книги с подробным материалом) работают над расширением тэгов.

Тэги можно расширять пока тэги не будут дублировать написанное в статье, ибо каждое слово, и даже буква достойны отдельной статьи. Но при таком уровне перекрёстных ссылок разобраться в материале будет невозможно. UNL - одна из попыток машиночитаемого текста (80-е, провалилась), OWL (Web Oriental Language) - современная попытка. В OWL выделяют три уровня: lite (только тэги), DL (дескрипционная логика) и FULL (идеальный мир со всем его многообразием). При этом для FULL сделана приписка "Маловероятно, что какое-либо программное обеспечение будет в состоянии осуществлять полную поддержку каждой особенности OWL Full".

Идеальный мир, описанный вами, возможен лишь на бумаге или на очень ограниченных предметных областях (напр. только результаты бейсбольных матчей). Такие системы были построены в 80-е, но они экстенсивны с факториальным ростом сложности и их расширение невозможно. Напр. черепаха - земноводное, есть ритуальные татуировки с черепахами, есть блюда из черепах, есть знаменитые черепахи, черепахи в кино (вкл.эпизоды), много чего ещё есть. Сколько-нибудь полное описание мира на текущем уровне знаний невозможно.

Поэтому не нужно изобретать велосипед, библиотеки существовали 5000 лет и накопили в вопросе сохранения и извлечения знаний _некоторый_ опыт.

Ответить | Правка | ^ к родителю #51 | Наверх | Cообщить модератору

54. "Создатели Wikipedia представили проект структурированной баз..."  +/
Сообщение от Crazy Alex (ok) on 03-Апр-12, 19:55 
Так в том и дело, что как раз я на идеальный мир не претендую. Создатели википедии, насколько я понимаю, тоже - поэтому не будет там статей на каждую букву/слово. И полнота тоже никому на фиг не нужна, что следует из основного принципа википедии - статьи пишутся и поддерживаются добровольцами. Суть в том, что есть часть данных которая отлично формализуется (допустим, итоги спортивных матчей), ещё часть - формализуется не отлично, но приемлемо для такого неточного по определению источника как википедия (численность населения или перечень стран). Разного "Му" в Wikidata скорее всего вообще не будет, в отличие от численности населения Бостона или (неполного) списка национальностей Земли.

Сама суть википедии такова, что там содержится не полная, а значимая информация - во всяком случае настолько значимая,что кто-то не поленился её туда вписать. И не достоверная, а имеющая неплохой шанс оказаться близкой к реальности. Если это понимать - никаких проблем нет, есть удобный инструмент для массы случаев - от пьяного спора до примреного ознакомления с новой областью или прикидок в какую страну эмигрировать точно не хочется.

Ответить | Правка | ^ к родителю #52 | Наверх | Cообщить модератору

56. "Создатели Wikipedia представили проект структурированной баз..."  +/
Сообщение от Ваня (??) on 03-Апр-12, 20:49 
Мне кажется или вы стали говорить за всю википедию, а возможно что и за весь мир?
Ответить | Правка | ^ к родителю #54 | Наверх | Cообщить модератору

59. "Создатели Wikipedia представили проект структурированной баз..."  +/
Сообщение от тоже Аноним email(ok) on 03-Апр-12, 23:30 
Могу вам сказать за весь мир: ни периодическая система элементов, ни формулы ньютоновской физики при пересечении границ не меняются (хотя и могут обозначаться другими буковками в порядке локализации).
Ответить | Правка | ^ к родителю #56 | Наверх | Cообщить модератору

58. "Создатели Wikipedia представили проект структурированной баз..."  +/
Сообщение от Все тот же аноним on 03-Апр-12, 22:13 
> Сама суть википедии такова, что там содержится не полная, а значимая информация
> настолько значимая,что кто-то не поленился её туда вписать

Или сделал это за бабло. Или с какой-то конкретной целью. Знаете, я даже примеров приводить не буду, настолько все банально. Почитайте, например, жизнеописания политиков.

Цена таких данных (не информации) - ноль рублей ноль копеек. Достоверность - ноль целых ноль десятых по десятибалльной шкале. Повторюсь, извините: нравится - пользуйтесь.

Ответить | Правка | ^ к родителю #54 | Наверх | Cообщить модератору

61. "Создатели Wikipedia представили проект структурированной баз..."  +/
Сообщение от XoRe (ok) on 04-Апр-12, 01:19 
> А вот здесь мы приходим к GREEN и ЗЕЛЁНЫЙ. Это не одно
> и то же.

Это фигня.
Вот есть хороший пример ваших аргументов:
http://ru.wikipedia.org/wiki/%D0%A5%D1%8...
Статья есть только на русском, и ещё свой вариант на сербском.
Но все равно что-нибудь можно вынести в wikidata
Даже пускай отдельно будут данные о green, и отдельно - данные о зеленом.

Давайте скажем так - хранилище данных поможет несколько уменьшить разницу между страничками на разных языках.
И держать какие-то данные в актуальном состоянии.
Например, можно будет фильмографию актера держать в одном месте.
Ну или список научных публикаций.
Или версии убунты.

Минус в другом.
До этой системы, на страничке Николаса Кейджа (в языке квенья), было мало информации про его фильмографию.
А теперь будет много информации, но большинство - на английском.
Т.к. тупо не будут переводить вовремя на местный язык его растущую фильмографию.
Ну или будут переводить с запаздыванием.
Уведомления о том, что вышел новый фильм - кому слать?
Кого уведомлять о том, что в wikidata появились новые непереведенные данные?

Зато упростится вхождение новых языков.
Главное - чтобы авторам было не в лом локализировать данные.
А то будут полу-английские полу-зулусские страницы.

Ответить | Правка | ^ к родителю #52 | Наверх | Cообщить модератору

64. "Создатели Wikipedia представили проект структурированной баз..."  +/
Сообщение от тоже Аноним email(ok) on 04-Апр-12, 08:58 
Зачем слать уведомления об изменениях? Вики сама это прекрасно делает. Я подписан по RSS на изменения на тех страницах, которые делал сам. Даже о добавлении роботом ссылок на другие языки сообщает.
Ответить | Правка | ^ к родителю #61 | Наверх | Cообщить модератору

53. "Создатели Wikipedia представили проект структурированной баз..."  +/
Сообщение от Все тот же аноним on 03-Апр-12, 18:46 
> У локализаций, в общем-то, ровно две проблемы

Сильно больше. Ниже уже написано, не буду повторяться.

> Южную осетию суём

И получите ту же гору мусора, которая уже есть сейчас.

> если есть мейнстримное правило

Есть. В Штатах - свое, в Ирландии - свое, в Бельгии - свое.

> При чём здесь летоисчисление вообще не пойму

Не вы один, к сожалению.

> И да, я знаю как работают версионированные БД.

Позвольте вам не поверить. Все написанное вами убеждает в обратном.

Ответить | Правка | ^ к родителю #51 | Наверх | Cообщить модератору

55. "Создатели Wikipedia представили проект структурированной баз..."  +/
Сообщение от Crazy Alex (ok) on 03-Апр-12, 20:06 
>> У локализаций, в общем-то, ровно две проблемы
> Сильно больше. Ниже уже написано, не буду повторяться.

Не видел ни одного примера. Если речь о "зеленом" - то к википедии это отношения не имеет, так как ни один нормальный человек не будет совать в Wikidata данные о зелёном цвете - не для того оно.

>> Южную осетию суём
> И получите ту же гору мусора, которая уже есть сейчас.

Нормально получаем. Если нет единственно верного описания значит надо давать все мейнстримные. Мы ж не правила вывода формулируем.

>> если есть мейнстримное правило
> Есть. В Штатах - свое, в Ирландии - свое, в Бельгии -
> свое.

Нет, вы мне поконкретнее ситуацию приведите, когда это надо будет сунуть в wikidata и разница будет создавать практические проблемы а не просто нарушать гармонию.

>> При чём здесь летоисчисление вообще не пойму
> Не вы один, к сожалению.

Ну так и пояснили бы. Я пока проблем не вижу - кладём время в каком-то календаре, по стандартным правилам оно преобразуется в число секунд от рождества Балабуды + метка исходного календаря. На выходе - либо запрошенный пользователем календарь, либо исходный + возможность сравнения произвольных дат.

>> И да, я знаю как работают версионированные БД.
> Позвольте вам не поверить. Все написанное вами убеждает в обратном.

Эм... А что сложного-то? Запись имеет номер ревизии + если делаются ссылки - то тоже на номера ревизий. И плюс 90% старья елижт в отдельных таблицах, чтобы в индексах не мешалось. На вебе вполне отработанная схема, у бухгалтеров тоже.

И ещё раз. Плевать на мелкие недобработки - википедия по самой своей сути неточна. Но если сейчас это свосем неструктурированная гора мусора, то с запуском Wikidata структурируемые части можно будет выделить и дать к ним удобный доступ.

Ответить | Правка | ^ к родителю #53 | Наверх | Cообщить модератору

57. "Создатели Wikipedia представили проект структурированной баз..."  +/
Сообщение от Все тот же аноним on 03-Апр-12, 22:06 
> Плевать на мелкие недобработки

Это не "мелкие недоработки". Это незнание основ проектирования.

> значит надо давать все мейнстримные.

Разумеется. Но при этом вам необходим контекст. О чем я и говорю. И о чем не имеют понятия разработчики обсуждаемой кучи мусора и о чем вы категорически не хотите слушать. Какие данные будут иметь основной идентификатор? Как будут различаться варианты?

> Эм... А что сложного-то?

Да ничего, собственно. Для корректного отражения истории изменений вам всего и нужна возможность отражения связанных изменений. Т. е. нужна метаметамодель, которая включала бы в себя и реляционную метамодель, и метамодели, выбранные для отображения связей. Вы, полагаю, понимаете, почему таких метамоделей будет больше одной? Если сможете предложить хорошее решение этой задачи, очень быстро заработаете свой первый миллион. А если возьмете стандартную метаметамодель типа MOF, то и пару-тройку.

Ответить | Правка | ^ к родителю #55 | Наверх | Cообщить модератору

41. "Создатели Wikipedia представили проект структурированной баз..."  +/
Сообщение от Crazy Alex (ok) on 03-Апр-12, 15:37 
Нет, неправильно. Они хотят уложить в базу то, что туда укладывается. Особенно легко это для различных числовых данных и классификаций вроде "Бостон - это город".
Ответить | Правка | ^ к родителю #22 | Наверх | Cообщить модератору

31. "Создатели Wikipedia представили проект структурированной баз..."  +1 +/
Сообщение от robux email(ok) on 03-Апр-12, 13:51 
Wikidata - это конечно шажок вперед.
Но реальным шагом, имхо, будет создание свободной распределенной базы.

Т.е. чтобы база городов (например) хранилась не на пендосских или путинских серверах, а на тысячах-миллионах компьютерах пользователей/организаций по всему миру. Вот это будет реальный прорыв!

А так, мы получаем подколпаковую базу: Большой Брат захотел сманипулировать - поправил цифру в WikiData, и пипл массово схвавал.

Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

33. "Создатели Wikipedia представили проект структурированной баз..."  –1 +/
Сообщение от Ваня (??) on 03-Апр-12, 14:06 
Скорее не "большой брат", а один попрошайка, грозившийся закрыть ресурс если ему не отстегнут N лямов зелени. И его аппетиты с каждым годом растут.
Ответить | Правка | ^ к родителю #31 | Наверх | Cообщить модератору

40. "Создатели Wikipedia представили проект структурированной баз..."  +/
Сообщение от Crazy Alex (ok) on 03-Апр-12, 15:32 
> Wikidata - это конечно шажок вперед.
> Но реальным шагом, имхо, будет создание свободной распределенной базы.
> Т.е. чтобы база городов (например) хранилась не на пендосских или путинских серверах,
> а на тысячах-миллионах компьютерах пользователей/организаций по всему миру. Вот это будет
> реальный прорыв!
> А так, мы получаем подколпаковую базу: Большой Брат захотел сманипулировать - поправил
> цифру в WikiData, и пипл массово схвавал.

У них всю жизнь все базы были открытыми, навреняка и дальше там будет. Есть желание - версионируйте, отслеживайте изменения. Объём там по сравнению с википедией будет смехотворный, объём правок - тем более.

Ответить | Правка | ^ к родителю #31 | Наверх | Cообщить модератору

66. "Создатели Wikipedia представили проект структурированной баз..."  +/
Сообщение от Аноним (??) on 09-Апр-12, 22:02 
Качество в Wikipedia не хватает... качества. А на не коммерческом проекте его не будет. Одной духовной пищей сыт не будешь.
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру