The OpenNET Project / Index page

[ новости /+++ | форум | wiki | теги | ]

02.04.2012 20:40  Создатели Wikipedia представили проект структурированной базы данных Wikidata

Фонд Wikimedia анонсировал новый проект - Wikidata, в рамках которого планируется подготовить доступную для совместного наполнения структурированную базу данных, в которой будут собраны разнообразные сведения и знания. Это первый значительный проект Wikimedia за последние 7 лет. Wikidata станет центральным сервисом для доступа к структурированным данным из всех статей свободной энциклопедии, примерно как в настоящее время Wikimedia Commons выступает в роли хранилища мультимедиа файлов.

Например, в Wikidata может быть сохранена численность населения определённого города, к которой в дальнейшем можно обращаться из статей Wikipedia по ключу с названием города и атрибутом, ассоциированным с численностью населения. При необходимости изменения данных, достаточно будет поправить запись в БД, после чего во всех статьях энциклопедии, упоминающих численность населения города N, будут использоваться новые сведения, без необходимости ручного выявления и правки этих статей. Кроме численности населения, можно сопоставить с городом различные географические и политические сведения, такие как имя мэра города, телефонный код, города-спутники и т.п.

Данные будут доступны не только для ручного редактирования, но и для полностью автоматизированной машинной обработки. Таким образом, данные могут быть задействованы в разнообразных сторонних приложениях, таких как системы аннотирования научных статей. Система будет поддерживать гибкие средства локализации, позволяющие хранить единые представления фактов на всех языках, поддерживаемых в Wikipedia (даже если статья не переведена, для всех языков можно будет вывести типовые факты). Данные будут предоставляться на условиях лицензии Creative Commons.

На разработку начального прототипа проекта выделено 1.3 млн евро, половина из которых пожертвовано Институтом решения проблем искусственного интеллекта (AI²), созданного Полом Алленом. Остальную часть финансирования предоставила компания Google и фонд Gordon and Betty Moore Foundation. По мнению вице-президента института AI² проект Wikidata является следующим шагом эволюции Wikipedia, трансформируя способ размещения энциклопедических данных, делая их доступными более широкой аудитории. Проект Wikidata будет основан на семантических технологиях, которые позволят упростить выявление нужных сведений.

Разработка проекта разделена на три фазы. Первую фазу планируется завершить в августе нынешнего года. На данной стадии будет проведена работа по централизации ссылок между версиями Wikipedia на разных языках. На второй стадии, результаты которой планируется представить в декабре 2012 года, редакторы получат возможность добавления и использования данных в Wikidata. Финальная фаза ознаменует собой появление средств для автоматического создания списков и схем, основанных на данных в Wikidata.

  1. Главная ссылка к новости (http://blog.wikimedia.org/2012...)
Лицензия: CC-BY
Тип: К сведению
Ключевые слова: wikidata, wikimedia
При перепечатке указание ссылки на opennet.ru обязательно
Обсуждение Ajax/Линейный | Раскрыть все сообщения | RSS
 
  • 1.1, Адольф (?), 21:45, 02/04/2012 [ответить] [показать ветку] [···]    [к модератору]
  • +9 +/
    Wikipedia отличный пример того, какие замечательные вещи может создавать некоммерческое общество
     
     
  • 2.20, Самый цимес (?), 10:22, 03/04/2012 [^] [ответить]    [к модератору]
  • –1 +/
    Надо добавлять фразу "на пожертвования". Полностью какие замечательные вещи может делать некоммерческое сообщество на пожертвования. И вся радость куда-то пропадает.
     
     
  • 3.24, FractalizeR (ok), 11:10, 03/04/2012 [^] [ответить]    [к модератору]
  • +3 +/
    Куда она пропадает? На одном энтузиазме их инфраструктуру не удержать. Что плохого в том, что проект существует на пожертвования?
     
     
  • 4.26, Аноним (-), 11:17, 03/04/2012 [^] [ответить]    [к модератору]
  • –11 +/
    Правда, сюрприз, аноны? - коммунизма нет. Все в этом мире стоит деньги. И лишь время анонов совершенно бесплатно. Прошу заметить - безвозвратно уходящее время.
     
     
  • 5.29, robux (ok), 13:24, 03/04/2012 [^] [ответить]    [к модератору]
  • +4 +/
    Сюрприз для тебя, сорос-недоучка: есть люди их желания и дела. А про деньги иди гусям расскажи.
     
  • 1.4, Аноним (-), 21:49, 02/04/2012 [ответить] [показать ветку] [···]    [к модератору]  
  • –2 +/
    А если ее(викидату) обрушат - обрушатся все ссылающиеся проекты?
     
     
  • 2.6, Аноним (-), 21:53, 02/04/2012 [^] [ответить]    [к модератору]  
  • +1 +/
    Капитан, не скромничайте.
     
  • 2.21, тоже Аноним (ok), 10:40, 03/04/2012 [^] [ответить]     [к модератору]  
  • +1 +/
    База данных - потенциально куда более надежное хранилище, чем файлопомойка Ее ... весь текст скрыт [показать]
     
  • 2.60, XoRe (ok), 00:53, 04/04/2012 [^] [ответить]    [к модератору]  
  • +1 +/
    > А если ее(викидату) обрушат - обрушатся все ссылающиеся проекты?

    Берите больше - представьте, что будет, если порушить гугль со всеми его сервисами!
    Дело за малым - обрушить)

     
  • 1.5, Аноним (-), 21:51, 02/04/2012 [ответить] [показать ветку] [···]    [к модератору]  
  • +/
    Это будет в RDF?
     
     
  • 2.7, Аноним (-), 21:54, 02/04/2012 [^] [ответить]    [к модератору]  
  • +/
    plain text
     
     
  • 3.8, Аноним (-), 21:55, 02/04/2012 [^] [ответить]    [к модератору]  
  • +/
    >The data will be exported in different formats, especially RDF

    Таки RDF, а это вин! веб 3.0 подкрался незаметно...

     
     
  • 4.9, Все тот же аноним (?), 22:56, 02/04/2012 [^] [ответить]     [к модератору]  
  • +3 +/
    Большую чушь сложно придумать Вы вообще представляете, что есть RDF По тексту ... весь текст скрыт [показать]
     
     
  • 5.12, Avator (ok), 23:46, 02/04/2012 [^] [ответить]    [к модератору]  
  • +/
    Зачем вы так категорично?
    Почитайте книгу Тима Бернерса Ли "Weaving Semantic web".
    Это как раз Web 3.0 и есть по сути =) Точнее первые  шаги в эту сторону.
     
     
  • 6.18, Все тот же аноним (?), 07:49, 03/04/2012 [^] [ответить]    [к модератору]  
  • +/
    По сути это кривая поделка. Волшебных слов RDF для взлета недостаточно. До Web 3.0 - как до Луны пешком.

    Куча способов рефакторинга с учетом, кстати, методов, позволяющих рубить бабло.

     
     
  • 7.63, Avator (ok), 03:50, 04/04/2012 [^] [ответить]     [к модератору]  
  • +/
    Извините, я как-то Тиму Бернерсу Ли немного больше верю ... весь текст скрыт [показать]
     
  • 1.10, Аноним (-), 22:59, 02/04/2012 [ответить] [показать ветку] [···]    [к модератору]  
  • +3 +/
    Так вот ты какой, 1984…
     
     
  • 2.16, 123 (??), 00:38, 03/04/2012 [^] [ответить]    [к модератору]  
  • +2 +/
    да, что б много газет не перепечатывать!
     
  • 1.14, Marbleless (?), 00:15, 03/04/2012 [ответить] [показать ветку] [···]    [к модератору]  
  • –3 +/
    Я джва года ждал...
     
  • 1.15, Аноним (-), 00:26, 03/04/2012 [ответить] [показать ветку] [···]    [к модератору]  
  • +10 +/
    Это проект немецкой Wikimedia Deutschland. Все хорошие нововведения в Википедии последнее время идут от немцев (например, интеграция с OpenStreetMap, поддержка TIFF, создание toolserver - хостинга для скриптов, нужных для различных околовикипедийных работ и т.д.). Американский же фонд, хотя и получает львиную долю пожертвований, полностью импотентен и управляется достаточно малоадекватными товарищами. Поэтому неприятно видеть, что это достижение в новости приписано именно американцам.
     
     
  • 2.23, минонА (?), 10:57, 03/04/2012 [^] [ответить]    [к модератору]  
  • +4 +/
    Зато у американских товарищей большие слёзные глаза и и стоять с протянутой рукой получается лучше. А для попрошаек это важнее идейности и креативности.
     
  • 2.37, abc (??), 14:23, 03/04/2012 [^] [ответить]    [к модератору]  
  • +/
    У всех четко разделенные обязанности: американцы деньги добавыют, немцы нововведения делают :)
     
  • 1.22, Аноним (-), 10:41, 03/04/2012 [ответить] [показать ветку] [···]    [к модератору]  
  • +/
    Я правильно понимаю, что они хотят вики загнать в семантическую сеть? То есть, по сути, вместо базы данных построить базу знаний, а отношения описывать (в том числе) на JSON?
     
     
  • 2.25, Ваня (??), 11:13, 03/04/2012 [^] [ответить]     [к модератору]  
  • –2 +/
    Да Только вот задача нерешаема на нашем уровне знаний Простой пример опишите ... весь текст скрыт [показать]
     
     
  • 3.27, тоже Аноним (ok), 13:02, 03/04/2012 [^] [ответить]     [к модератору]  
  • +/
    Мы сами знаем, что она не имеет решения, 8211 сказал Хунта, немедленно ощети... весь текст скрыт [показать]
     
  • 3.30, Crazy Alex (ok), 13:38, 03/04/2012 [^] [ответить]     [к модератору]  
  • +/
    А если не выпендриваться - получаем просто удобное хранилище для фактажа, которы... весь текст скрыт [показать]
     
     
  • 4.32, Ваня (??), 14:04, 03/04/2012 [^] [ответить]    [к модератору]  
  • –1 +/
    Почитай историю языка UNL (Universal Network Language), разрабатываемого в 80-90-е годы. А уже потом, владея знаниями и не "выпендриваясь" сделай выводы.
     
  • 4.34, Аноним (-), 14:08, 03/04/2012 [^] [ответить]     [к модератору]  
  • +1 +/
    Мне кажется что вы тут не правы Между БД и БЗ разница существенная БД - хранит... весь текст скрыт [показать]
     
     
  • 5.35, Ваня (??), 14:11, 03/04/2012 [^] [ответить]    [к модератору]  
  • –1 +/
    И вы тоже почитайте про UNL.
     
     
  • 6.36, Аноним (-), 14:21, 03/04/2012 [^] [ответить]    [к модератору]  
  • +/
    Речь идет, как мне кажется, не об UNL 80-х,  а уж скорее о трудах академика Поспелова (http://www.ccas.ru/personal/g_pospel/g_pospel.htm) в области семантических сетей в 60-х.
     
     
  • 7.38, Ваня (??), 14:33, 03/04/2012 [^] [ответить]    [к модератору]  
  • –1 +/
    И их тоже. А вдовесок что GREEN и ЗЕЛЁНЫЙ это не одно и то же. Когда анонимам станет понятно почему так, тогда и часть проблемы для них прояснится.
     
     
  • 8.39, Crazy Alex (ok), 15:31, 03/04/2012 [^] [ответить]     [к модератору]  
  • +/
    Да нет с этим всем никаких проблем если не пытаться клепать универсальное решени... весь текст скрыт [показать]
     
     
  • 9.42, Ваня (??), 16:18, 03/04/2012 [^] [ответить]     [к модератору]  
  • +/
    В русской вики есть раздел Синтоистские святилища В русской их 25, английской... весь текст скрыт [показать]
     
     
  • 10.43, Crazy Alex (ok), 16:51, 03/04/2012 [^] [ответить]     [к модератору]  
  • +1 +/
    Лечитесь от перфекционизма Где получится - будут использовать И, понятное дело... весь текст скрыт [показать]
     
     
  • 11.45, Все тот же аноним (?), 16:54, 03/04/2012 [^] [ответить]    [к модератору]  
  • +/
    > Поэтому - да, на 5000-летнюю историю начиная с глиняных табличек - таки болт, сейчас много лучше можем.

    Фатальное заблуждение.

     
     
  • 12.47, Crazy Alex (ok), 16:58, 03/04/2012 [^] [ответить]    [к модератору]  
  • +/
    >> Поэтому - да, на 5000-летнюю историю начиная с глиняных табличек - таки болт, сейчас много лучше можем.
    > Фатальное заблуждение.

    А детальнее?

     
     
  • 13.49, Все тот же аноним (?), 17:19, 03/04/2012 [^] [ответить]    [к модератору]  
  • +/
    > А детальнее?

    "Много лучше" - обманчивое впечатление. Много быстрее и много больше - да.

     
     
  • 14.50, Crazy Alex (ok), 17:24, 03/04/2012 [^] [ответить]    [к модератору]  
  • +/
    Ну так в случае википедии (которая нужна для "быстро и примерно посмотреть") это же и нужно?
     
  • 11.62, XoRe (ok), 01:26, 04/04/2012 [^] [ответить]     [к модератору]  
  • +/
    А вы в курсе, что современные БД работают по принципам этих глинаных табличек Н... весь текст скрыт [показать]
     
  • 10.44, Все тот же аноним (?), 16:51, 03/04/2012 [^] [ответить]     [к модератору]  
  • +/
    Это первая проблема из тех, что на поверхности синхронные языковые эквиваленты ... весь текст скрыт [показать]
     
     
  • 11.46, Crazy Alex (ok), 16:58, 03/04/2012 [^] [ответить]     [к модератору]  
  • +/
    В пень перфекционизм Вам же не AI на этом и только на этом обучать С эквивал... весь текст скрыт [показать]
     
     
  • 12.48, Все тот же аноним (?), 17:16, 03/04/2012 [^] [ответить]     [к модератору]  
  • +/
    Да Два варианта криво и очень криво Разумеется, есть И не только национальны... весь текст скрыт [показать]
     
     
  • 13.51, Crazy Alex (ok), 17:34, 03/04/2012 [^] [ответить]     [к модератору]  
  • +/
    У локализаций, в общем-то, ровно две проблемы разная структура предложений и ом... весь текст скрыт [показать]
     
     
  • 14.52, Ваня (??), 18:01, 03/04/2012 [^] [ответить]     [к модератору]  
  • +/
    А вот здесь мы приходим к GREEN и ЗЕЛЁНЫЙ Это не одно и то же Опросив носителе... весь текст скрыт [показать]
     
     
  • 15.54, Crazy Alex (ok), 19:55, 03/04/2012 [^] [ответить]     [к модератору]  
  • +/
    Так в том и дело, что как раз я на идеальный мир не претендую Создатели википед... весь текст скрыт [показать]
     
     
  • 16.56, Ваня (??), 20:49, 03/04/2012 [^] [ответить]    [к модератору]  
  • +/
    Мне кажется или вы стали говорить за всю википедию, а возможно что и за весь мир?
     
     
  • 17.59, тоже Аноним (ok), 23:30, 03/04/2012 [^] [ответить]    [к модератору]  
  • +/
    Могу вам сказать за весь мир: ни периодическая система элементов, ни формулы ньютоновской физики при пересечении границ не меняются (хотя и могут обозначаться другими буковками в порядке локализации).
     
  • 16.58, Все тот же аноним (?), 22:13, 03/04/2012 [^] [ответить]    [к модератору]  
  • +/
    > Сама суть википедии такова, что там содержится не полная, а значимая информация
    > настолько значимая,что кто-то не поленился её туда вписать

    Или сделал это за бабло. Или с какой-то конкретной целью. Знаете, я даже примеров приводить не буду, настолько все банально. Почитайте, например, жизнеописания политиков.

    Цена таких данных (не информации) - ноль рублей ноль копеек. Достоверность - ноль целых ноль десятых по десятибалльной шкале. Повторюсь, извините: нравится - пользуйтесь.

     
  • 15.61, XoRe (ok), 01:19, 04/04/2012 [^] [ответить]    [к модератору]  
  • +/
    > А вот здесь мы приходим к GREEN и ЗЕЛЁНЫЙ. Это не одно
    > и то же.

    Это фигня.
    Вот есть хороший пример ваших аргументов:
    http://ru.wikipedia.org/wiki/%D0%A5%D1%83%D0%B9
    Статья есть только на русском, и ещё свой вариант на сербском.
    Но все равно что-нибудь можно вынести в wikidata
    Даже пускай отдельно будут данные о green, и отдельно - данные о зеленом.

    Давайте скажем так - хранилище данных поможет несколько уменьшить разницу между страничками на разных языках.
    И держать какие-то данные в актуальном состоянии.
    Например, можно будет фильмографию актера держать в одном месте.
    Ну или список научных публикаций.
    Или версии убунты.

    Минус в другом.
    До этой системы, на страничке Николаса Кейджа (в языке квенья), было мало информации про его фильмографию.
    А теперь будет много информации, но большинство - на английском.
    Т.к. тупо не будут переводить вовремя на местный язык его растущую фильмографию.
    Ну или будут переводить с запаздыванием.
    Уведомления о том, что вышел новый фильм - кому слать?
    Кого уведомлять о том, что в wikidata появились новые непереведенные данные?

    Зато упростится вхождение новых языков.
    Главное - чтобы авторам было не в лом локализировать данные.
    А то будут полу-английские полу-зулусские страницы.

     
     
  • 16.64, тоже Аноним (ok), 08:58, 04/04/2012 [^] [ответить]    [к модератору]  
  • +/
    Зачем слать уведомления об изменениях? Вики сама это прекрасно делает. Я подписан по RSS на изменения на тех страницах, которые делал сам. Даже о добавлении роботом ссылок на другие языки сообщает.
     
  • 14.53, Все тот же аноним (?), 18:46, 03/04/2012 [^] [ответить]    [к модератору]  
  • +/
    > У локализаций, в общем-то, ровно две проблемы

    Сильно больше. Ниже уже написано, не буду повторяться.

    > Южную осетию суём

    И получите ту же гору мусора, которая уже есть сейчас.

    > если есть мейнстримное правило

    Есть. В Штатах - свое, в Ирландии - свое, в Бельгии - свое.

    > При чём здесь летоисчисление вообще не пойму

    Не вы один, к сожалению.

    > И да, я знаю как работают версионированные БД.

    Позвольте вам не поверить. Все написанное вами убеждает в обратном.

     
     
  • 15.55, Crazy Alex (ok), 20:06, 03/04/2012 [^] [ответить]     [к модератору]  
  • +/
    Не видел ни одного примера Если речь о зеленом - то к википедии это отношения... весь текст скрыт [показать]
     
     
  • 16.57, Все тот же аноним (?), 22:06, 03/04/2012 [^] [ответить]    [к модератору]  
  • +/
    > Плевать на мелкие недобработки

    Это не "мелкие недоработки". Это незнание основ проектирования.

    > значит надо давать все мейнстримные.

    Разумеется. Но при этом вам необходим контекст. О чем я и говорю. И о чем не имеют понятия разработчики обсуждаемой кучи мусора и о чем вы категорически не хотите слушать. Какие данные будут иметь основной идентификатор? Как будут различаться варианты?

    > Эм... А что сложного-то?

    Да ничего, собственно. Для корректного отражения истории изменений вам всего и нужна возможность отражения связанных изменений. Т. е. нужна метаметамодель, которая включала бы в себя и реляционную метамодель, и метамодели, выбранные для отображения связей. Вы, полагаю, понимаете, почему таких метамоделей будет больше одной? Если сможете предложить хорошее решение этой задачи, очень быстро заработаете свой первый миллион. А если возьмете стандартную метаметамодель типа MOF, то и пару-тройку.

     
  • 2.41, Crazy Alex (ok), 15:37, 03/04/2012 [^] [ответить]    [к модератору]  
  • +/
    Нет, неправильно. Они хотят уложить в базу то, что туда укладывается. Особенно легко это для различных числовых данных и классификаций вроде "Бостон - это город".
     
  • 1.31, robux (ok), 13:51, 03/04/2012 [ответить] [показать ветку] [···]    [к модератору]  
  • +1 +/
    Wikidata - это конечно шажок вперед.
    Но реальным шагом, имхо, будет создание свободной распределенной базы.

    Т.е. чтобы база городов (например) хранилась не на пендосских или путинских серверах, а на тысячах-миллионах компьютерах пользователей/организаций по всему миру. Вот это будет реальный прорыв!

    А так, мы получаем подколпаковую базу: Большой Брат захотел сманипулировать - поправил цифру в WikiData, и пипл массово схвавал.

     
     
  • 2.33, Ваня (??), 14:06, 03/04/2012 [^] [ответить]    [к модератору]  
  • –1 +/
    Скорее не "большой брат", а один попрошайка, грозившийся закрыть ресурс если ему не отстегнут N лямов зелени. И его аппетиты с каждым годом растут.
     
  • 2.40, Crazy Alex (ok), 15:32, 03/04/2012 [^] [ответить]    [к модератору]  
  • +/
    > Wikidata - это конечно шажок вперед.
    > Но реальным шагом, имхо, будет создание свободной распределенной базы.
    > Т.е. чтобы база городов (например) хранилась не на пендосских или путинских серверах,
    > а на тысячах-миллионах компьютерах пользователей/организаций по всему миру. Вот это будет
    > реальный прорыв!
    > А так, мы получаем подколпаковую базу: Большой Брат захотел сманипулировать - поправил
    > цифру в WikiData, и пипл массово схвавал.

    У них всю жизнь все базы были открытыми, навреняка и дальше там будет. Есть желание - версионируйте, отслеживайте изменения. Объём там по сравнению с википедией будет смехотворный, объём правок - тем более.

     
  • 1.66, Аноним (-), 22:02, 09/04/2012 [ответить] [показать ветку] [···]    [к модератору]  
  • +/
    Качество в Wikipedia не хватает... качества. А на не коммерческом проекте его не будет. Одной духовной пищей сыт не будешь.
     

     Добавить комментарий
    Имя:
    E-Mail:
    Заголовок:
    Текст:


      Закладки на сайте
      Проследить за страницей
    Created 1996-2019 by Maxim Chirkov  
    ДобавитьПоддержатьВебмастеруГИД  
    Hosting by Ihor