The OpenNET Project / Index page

[ новости /+++ | форум | wiki | теги | ]

Успехи проекта Document Liberation по созданию библиотек для работы с проприетарными форматами

14.04.2015 19:03

Представлен краткий отчёт о достижениях проекта Document Liberation за 2014 год. Document Liberation основан разработчиками LibreOffice и нацелен на вынос в отдельные библиотеки средств для работы с различными актуальными и устаревшими проприетарными форматами файлов, что позволяет организовать работу с данными форматами не только в LibreOffice, но и в любом стороннем открытом проекте. В рамках проекта сформирована коллекция библиотек для работы с форматами Corel WordPerfect, Corel Draw, Microsoft Works, AbiWord, Microsoft Publisher, Microsoft Visio, Apple Keynote, Adobe FreeHand, Aldus PageMaker, и многих форматов документов Mac.

Из недавних достижений отмечается создание сводной библиотеки librevenge, выступающей интерфейсом для упрощения использования функций остальных библиотек, развиваемых проектом. Интеграция библиотеки libpagemaker для разбора документов, подготовленных в Adobe PageMaker. Создание двух библиотек libepubgen и librvngabw для организации экспорта в ePub и формат документов Abiword. Расширение возможностей существующих библиотек, например добавление в libwps поддержки электронных таблиц и БД Microsoft Works, а также подготовка к добавлению поддержки форматов Lotus 1-2-3. Добавление в libmwaw поддержки более 20 устаревших форматов платформы Mac. Улучшение libfreehand и libetonyek в плане импорта форматов Adobe Freehand и Apple Pages.

  1. Главная ссылка к новости (http://blog.documentfoundation...)
  2. OpenNews: Создатели LibreOffice представили Document Liberation Project
Лицензия: CC-BY
Тип: Обобщение
Ключевые слова: libreoffice
При перепечатке указание ссылки на opennet.ru обязательно
Обсуждение (51) Ajax | 1 уровень | Линейный | Раскрыть всё | RSS
  • 1.1, A.Stahl (ok), 19:08, 14/04/2015 [ответить] [﹢﹢﹢] [ · · · ]  
  • +4 +/
    Ого! Теперь детишки смогут перевести своё внимание с плееров (или что там сейчас модно отвечать на вопрос "А что бы написать?") на текстовые "процессоры".
    Ну хоть какое-то разнообразие.
     
     
  • 2.15, Анончег (?), 23:04, 14/04/2015 [^] [^^] [^^^] [ответить]  
  • +3 +/
    И к тому же заметьте, Александр, с пользой для дела ! А потом детишки вырастут и напишут свой "МС Оффисе" с проверкой грамматики и риббoновым интерфейсом на Qt.
     
     
  • 3.16, A.Stahl (ok), 23:14, 14/04/2015 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Вот давайте только без гиббоновых интерфейсов. Они неудобны для макак:)
     
     
  • 4.18, Анончег (?), 03:16, 15/04/2015 [^] [^^] [^^^] [ответить]  
  • +/
    > Вот давайте только без гиббоновых интерфейсов. ...

    Нет уж, поздно, дети хотят риббон !

    > ... Они неудобны для макак:)

    Зато чрезвычайно удобны для гиббонов.

     
  • 4.49, Юрий (??), 17:02, 15/04/2015 [^] [^^] [^^^] [ответить]  
  • +/
    Вы сказали на маках?
     
  • 3.33, Аноним (-), 10:46, 15/04/2015 [^] [^^] [^^^] [ответить]  
  • +/
    поколение сэлфи сделает плугином к хромому если только
     

  • 1.2, Аноним (-), 19:15, 14/04/2015 [ответить] [﹢﹢﹢] [ · · · ]  
  • –5 +/
    толку то так в xls все и расползаются как пару лет назад, благо простенькие doc норма отображаются  
     
     
  • 2.5, Аноним (-), 20:10, 14/04/2015 [^] [^^] [^^^] [ответить]  
  • +4 +/
    Пиши багрепорты или патчи. Эти библиотеки нужны не для того чтоб кто-то в интернете ныл что расползается. И не для того чтоб не расползалось. А для упрощения поддержки различных форматов документов сторонним разработчикам.
     
     
  • 3.6, Кармер (?), 20:21, 14/04/2015 [^] [^^] [^^^] [ответить]  
  • –6 +/
    Нинужно. И таблицы -  тоже не нужны : самый поганый для ошибок и отладки язык после  ассемлера.
    А уж если туда еще и VBA прикрутили ... Вот нет других дел, что б начать гигатонны этого дерьма воспроизводить ?!
     
     
  • 4.8, Онотоле (?), 21:18, 14/04/2015 [^] [^^] [^^^] [ответить]  
  • +3 +/
    Да что с вами то? Послушаешь - вообще ничего не нужно.
    Нужно. Когда винда окончательно отгниет - то что после нее осталось - всякие экселевские файлики - их то и нужно будет в чем то всковыривать, лучше и надежней - всковыривать чем то опенсорсным.
     
     
  • 5.25, минонА (?), 06:00, 15/04/2015 [^] [^^] [^^^] [ответить]  
  • +/
    А зачем нужно отгнивание венды? Какой профит?
     
     
  • 6.31, terraslav (ok), 09:38, 15/04/2015 [^] [^^] [^^^] [ответить]  
  • +/
    Это не профит, а "следующий этап развития" M$ Windows, судя по тестируемой вынь10;)
     
  • 5.50, Аноним (-), 08:14, 16/04/2015 [^] [^^] [^^^] [ответить]  
  • +/
    Есть класс людей которым "нужно" только нескучные обои и форма куда писать комментарии. Т.е. первое - единственное, чем они могут выделиться из массы таких же как они, а последнее - единственное, что они могут производить своим "интеллектуальным трудом".
     
  • 4.23, prokoudine (??), 05:10, 15/04/2015 [^] [^^] [^^^] [ответить]  
  • +2 +/
    > Нинужно. И таблицы -  тоже не нужны : самый поганый для
    > ошибок и отладки язык после  ассемлера.

    Храню в электронных таблицах самые разные данные — пресс-клиппинги, сырые данные для конкурентных анализов, разные расчёты. Счастлив и доволен, волосы удивительно шелковистые, кошмары по ночам не мучают, животик не пучит. Ненужнистам могу посоветовать эфтаназепам.

     
     
  • 5.26, Аноним (-), 07:47, 15/04/2015 [^] [^^] [^^^] [ответить]  
  • +2 +/
    Люби csv и кучу пре- и постпроцессоров к нему. Ишь чего удумал, ирод окаянный, пользоваться электронными таблицами.
     
     
  • 6.36, Crazy Alex (ok), 12:41, 15/04/2015 [^] [^^] [^^^] [ответить]  
  • +2 +/
    Особенно расчёты туда засунуть удобно, ага. Это сарказм, если кто не догнал.
     
  • 3.17, Аноним (-), 23:30, 14/04/2015 [^] [^^] [^^^] [ответить]  
  • +/
    Разрабы на другой планете живут и табличек в глаза не видали? Смысл 1001 репорт писать, все уже давно написано.
     

  • 1.3, Аноним (-), 19:35, 14/04/2015 [ответить] [﹢﹢﹢] [ · · · ]  
  • –3 +/
    после фразы "Из недавних достижений отмечается" нужно поставить двоеточие!
     
     
  • 2.4, A.Stahl (ok), 19:40, 14/04/2015 [^] [^^] [^^^] [ответить]  
  • +3 +/
    Не нужно. С чего бы это?
     
  • 2.11, Аноним (-), 21:47, 14/04/2015 [^] [^^] [^^^] [ответить]  
  • –1 +/
    "отмечаЮтся" - точно надо.
     
     
  • 3.12, A.Stahl (ok), 21:48, 14/04/2015 [^] [^^] [^^^] [ответить]  
  • +2 +/
    И это не надо!
    Что отмечается? Отмечается создание. Всё ок.
     

  • 1.7, paulus (ok), 20:40, 14/04/2015 [ответить] [﹢﹢﹢] [ · · · ]  
  • +1 +/
    с каких это пор формат абиворда проприетарный?
     
  • 1.9, Аноним (-), 21:21, 14/04/2015 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    С достижением в виде распространения открытых форматов всё плохо?
     
     
  • 2.10, A.Stahl (ok), 21:26, 14/04/2015 [^] [^^] [^^^] [ответить]  
  • +/
    Угу, совсем плохо. Но иначе и быть не могло -- проприетарщина часто обладает свойством "завязывать" все смежные процессы на свою, ни с чем не совместимую, инфраструктуру.
    У опенсорса обычно аналогичной целостной инфраструктуры нет.
    Вот и жрут каку. И вариантов не имеют. Ведь разбавление говна(завендорлоченых форматов) конфетами(открытыми стандартами) приводит лишь к увеличение количества говна (итоговых документов)...
     
  • 2.29, prokoudine (??), 08:58, 15/04/2015 [^] [^^] [^^^] [ответить]  
  • +2 +/
    > С достижением в виде распространения открытых форматов всё плохо?

    Внимательно читаем описание проекта:

    > The Document Liberation Project was created in the hope that it would empower individuals, organizations, and governments to recover their data from proprietary formats and provide a mechanism to transition that data into open file formats, returning effective control over the content from computer companies to the actual authors.

    Проект не занимается пиаром открытых форматов, он даёт инструменты для переноса данных из закрытых форматов в открытые. Проще говоря, это не маркетинговый, а технологический проект.

     

  • 1.13, vitalif (ok), 22:00, 14/04/2015 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Как там у них успехи с libvisio? До сих пор же вроде через пень колоду работает...
     
     
  • 2.22, prokoudine (??), 05:06, 15/04/2015 [^] [^^] [^^^] [ответить]  
  • +4 +/
    > Как там у них успехи с libvisio? До сих пор же вроде
    > через пень колоду работает...

    Виталик как обычно доставляет своими феерическими комментариями.

    У проекта есть багзилла и русскоязычный специалист по реверс-инжинерингу. Казалось бы, что ещё надо...

     

  • 1.14, тоже Аноним (ok), 22:47, 14/04/2015 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Формат пижамкера? Зачем?!
    Этим людям не говорили, что пижамкер сам умел довести свои файлы до состояния "сам не могу прочитать, падаю"?
    С тех пор все, кто хотел, научились понимать EPS, а те же проприетарные Adobe позволяют выгнать свое добро в IDML, более-менее полно документированный и представляющий собой упакованный XML.
    Зачем сейчас мучиться с форматом программы, до сих пор существующей только из-за жадности одного монополиста?
     
     
  • 2.21, prokoudine (??), 05:03, 15/04/2015 [^] [^^] [^^^] [ответить]  
  • +5 +/
    > Формат пижамкера? Зачем?!

    Это один из самых частых запросов от мигрантов на Scribus.

     
     
  • 3.30, тоже Аноним (ok), 09:30, 15/04/2015 [^] [^^] [^^^] [ответить]  
  • +/
    Ну, вопрос, полагаю, не "Зачем?!", а "Как перетащить пыжиковую верстку?"
    Это понятно, но тот же пыжик, например, PDF умел выгонять.
    Импорт PDF-файла в виде, разобранном до элементов верстки, мне кажется более вменяемым решением.
    Просто вспоминая капризы пыжика и представляя, сколько головной боли с тем форматом, поневоле сожалеешь даже о чужих потраченных усилиях.
     
     
  • 4.34, prokoudine (??), 12:01, 15/04/2015 [^] [^^] [^^^] [ответить]  
  • +/
    Что в вашем понимании является элементами вёрстки?
     
     
  • 5.39, тоже Аноним (ok), 12:59, 15/04/2015 [^] [^^] [^^^] [ответить]  
  • +/
    Ну, хотя бы то, что может из той PDF вытащить и редактировать тот же Иллюстратор.
    Отдельно картинки, отдельно кривые, отдельно текст (он вроде бы даже умудряется собрать его обратно в абзацы - видимо, эмпирически).
    Ну не будет же кто-то всерьез рассчитывать перетащить из пыжика в Скрибус серьезную многостраничную верстку. Так, шаблоны да небольшие макеты. Сомневаюсь, что открытый фильтр импорта пыжика способен выдать верстку один в один - там, помнится, встречались феерические грабли типа зависимости компоновки от разрешения принтера, установленного в системе (читай - виндах) по умолчанию.
     
     
  • 6.44, prokoudine (??), 14:19, 15/04/2015 [^] [^^] [^^^] [ответить]  
  • +/
    Scribus 1.5.0 (а то и 1.4.х -- сходу не вспомню) и так умеет читать PDF через libpodofo. Надо просто заранее понимать, что PDF хреново рассчитан на редактирование.
     
     
  • 7.46, тоже Аноним (ok), 14:29, 15/04/2015 [^] [^^] [^^^] [ответить]  
  • +/
    Это конечно. Весь этот тред я начал из-за серьезного подозрения, что формат пыжика тоже не очень-то рассчитан на редактирование чем-либо, кроме самого пыжика ;)
     
  • 4.37, Crazy Alex (ok), 12:44, 15/04/2015 [^] [^^] [^^^] [ответить]  
  • +/
    Я ни хрена не понимаю в издательском деле но с PageMaker когда-то чуть поводиться пришлось. И крайне сомневаюсь, что через PDF можно корректно экспортировать, например, "переливающиеся" текстовые поля.
     
     
  • 5.40, тоже Аноним (ok), 13:03, 15/04/2015 [^] [^^] [^^^] [ответить]  
  • +/
    Переливающиеся - это с градиентной заливкой, что ли?
    Так в PS, насколько я помню, это делается настройкой градиента и наложением его на путь, полученный из текста. В PDF вполне может сохраниться вся необходимая для реверса информация.
     
     
  • 6.41, prokoudine (??), 13:06, 15/04/2015 [^] [^^] [^^^] [ответить]  
  • +/
    > Переливающиеся - это с градиентной заливкой, что ли?

    Переливающиеся -- это когда текст перетекает из одного блока в другой.

     
     
  • 7.42, тоже Аноним (ok), 13:31, 15/04/2015 [^] [^^] [^^^] [ответить]  
  • +/
    Тут тупик, конечно. Равно как и с привязкой материалов к файлам, из которых они вставлены.
    Но я еще раз усомнюсь в том, что кто-то будет перетаскивать готовую серьезную верстку из Пыжика. И в том, что сделанный фильтр действительно когда-нибудь вменяемо ее импортирует.
     

  • 1.19, Аноним (-), 04:29, 15/04/2015 [ответить] [﹢﹢﹢] [ · · · ]  
  • –1 +/
    LibreOffice уже Java не требует?
     
     
  • 2.35, Аноним (-), 12:07, 15/04/2015 [^] [^^] [^^^] [ответить]  
  • +/
    Он никогда и не требовал. Ключик ставишь при сборке, чтобы не только не требовал, но даже и не умел :-).
    Все вопросы к сборщикам пакетов.
     
     
  • 3.51, vlikhachev (ok), 13:42, 16/04/2015 [^] [^^] [^^^] [ответить]  
  • +/
    > Он никогда и не требовал. Ключик ставишь при сборке, чтобы не только
    > не требовал, но даже и не умел :-).
    > Все вопросы к сборщикам пакетов.

    А импорт-экспорт из/в другие форматы после этого не отрубается случайно? Мне казалось, что он однозначно на Яве завязан, ибо если на компьютере (Виндовом, увы) вообще нет Явы - работает только с od* и csv форматами...

     

  • 1.20, prokoudine (??), 05:02, 15/04/2015 [ответить] [﹢﹢﹢] [ · · · ]  
  • +2 +/
    > За год существования проекта сформирована коллекция библиотек для работы с форматами Corel WordPerfect, Corel Draw, Microsoft Works, AbiWord, Microsoft Publisher, Microsoft Visio, Apple Keynote, Adobe FreeHand, Aldus PageMaker, и многих форматов документов Mac.

    Это совершенно некорректное утверждение, которого, к тому же, нет в оригинальном посте. По факту:

    — проекты libcdr и libvisio начаты и доведены до юзабельного уровня в 2011 году;
    — проект libmspub начат в 2012 году и более-менее нормально работал уже в 2013 году;
    — проект libfreehand начат в виде заглушки в 2012 году, фактическая работа начата в 2013 году; это самый проблематичный из всех разобранных форматов;
    — фильтру импорта WordPerfect около 13 лет, он просто был переписан на фреймворке librevenge.

    Такие дела.

     
     
  • 2.24, prokoudine (??), 05:59, 15/04/2015 [^] [^^] [^^^] [ответить]  
  • +/
    Даже уточню: libmspub неплохо открывал файлы уже в конце 2012 года.
     
  • 2.27, Аноним (-), 08:24, 15/04/2015 [^] [^^] [^^^] [ответить]  
  • +/
    >> За год существования проекта сформирована коллекция библиотек для работы с форматами Corel WordPerfect, Corel Draw, Microsoft Works, AbiWord, Microsoft Publisher, Microsoft Visio, Apple Keynote, Adobe FreeHand, Aldus PageMaker, и многих форматов документов Mac.
    > Это совершенно некорректное утверждение, которого, к тому же, нет в оригинальном посте.
    > По факту:

    Почему неверная? Написано же "сформирована коллекция", т.е. собраны в одном месте, а не созданы с нуля.

     
     
  • 3.28, prokoudine (??), 08:34, 15/04/2015 [^] [^^] [^^^] [ответить]  
  • +1 +/
    > Написано же "сформирована коллекция"

    Это бессмысленное утверждение. Оно ничего не говорит о том, какая именно работа проделана. Его можно понимать как угодно (например, так, как понял я).

    Что сделано в реальности: куча уже существующих библиотек переписана на фреймворке librevenge, плюс на нём же написана библиотека для генерирования файлов EPUB.

     
     
  • 4.38, Аноним (-), 12:51, 15/04/2015 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Есил ты что-то не правильно понял — попрорбуй перечитать ещё раз.
     
  • 2.32, Аноним (-), 10:40, 15/04/2015 [^] [^^] [^^^] [ответить]  
  • +/
    >Это совершенно некорректное утверждение, которого, к тому же, нет в оригинальном посте

    Ну, в интернете кто-то опять не прав. Значит, всё как обычно.

     
  • 2.43, nmorozov (ok), 14:05, 15/04/2015 [^] [^^] [^^^] [ответить]  
  • +/
    >  проект libfreehand начат в виде заглушки в 2012 году

    О как раз хотел спросить где там freehand поддерживатся, теперь все понятно

     
     
  • 3.45, prokoudine (??), 14:23, 15/04/2015 [^] [^^] [^^^] [ответить]  
  • +/
    > О как раз хотел спросить где там freehand поддерживатся, теперь все понятно

    Там формат феерический совершенно. Цитирую коммент к новости про Gravit:

    As Alexandre says, the FreeHand code is convoluted. Many years ago, I had a conversation with one of the devs about FreeHandMX. This is what they said at the time:

    “Our file format is based a mechanism that sends a message to each object instance asking it to tell us about itself. The method then sends messages to a passed in interface telling the interface about it’s structure in file format/chronological order (i.e.. first comes a reference to another instance then a 32 bit number then ...). Therefore the only real documentation on what is in the file format is the FreeHand code itself. Also, there is a header and a trailer. If I remember correctly the header contains a file format identifier, version number and a pointer to the trailer at the end (I forgot the rest of the header if there is any). The body of the document is is saved in zip file format using a build of zlib. The trailer contains a mapping of the object type index to an object class name. This allows us to save off arbitrary indexes (small numbers) for the object types and then remap them to the current class names in FreeHand. Each object reference contains an arbitrary numeric identifier and a object type identifier. We would read the trailer at the end first and create a mapping of object class indexes to classes to start off with. The file format was designed to be as small and tight as possible because we had customers who wanted to transfer files over the internet (which wasn’t as fast in those days).”

     

  • 1.47, adolfus (ok), 15:36, 15/04/2015 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Формат навителовских карт случайно в список не попадает?
     
     
  • 2.48, prokoudine (??), 15:51, 15/04/2015 [^] [^^] [^^^] [ответить]  
  • +/
    Не попадает, поскольку в LO он нафиг не нужен.

    Но если есть а) желание генерить файлы для разбора и б) пользовательский софт (QGIS? GRASS?), куда есть реальная возможность впилить поддержку этих карт (например, разработчики или вы лично готовы писать код), Валентин обычно согласен поковырять формат и написать парсер на Python, которым можно пользоваться для изучения формата.

     
     Добавить комментарий
    Имя:
    E-Mail:
    Текст:



    Спонсоры:
    Слёрм
    Inferno Solutions
    Hosting by Ihor
    Хостинг:

    Закладки на сайте
    Проследить за страницей
    Created 1996-2019 by Maxim Chirkov
    Добавить, Поддержать, Вебмастеру