The OpenNET Project / Index page

[ новости/++ | форум | wiki | теги ]

Преобразование CHM в PDF
Для преобразования формата CHM в PDF существует утилита chm2pdf, написанная на языке Python.
Если Python нет, можно пойти в обход:

1. Нам нужна библиотека chmlib, в популярных дистрибутивах она есть.

2. Так же, нужна утилита extract_chmLib, находиться в пакете, где-то в
chmlib-examples, где-то в chmlib-bin.

3. Утилита htmldoc,так же везде есть.

4. И объект испытаний, например RHCE.chm

Кстати, для chm2pdf так же нужна chmlib, Python и дополнительная библиотека на питоне.

И так, делаем два каталога:

   mkdir /tmp/CHM/PDF /tmp/CHM/HTML;

и переходим в первый

   сd /tmp/CHM

Извлекаем html страницы в каталог HTML

   extract_chmLib RHCE.chm ./HTML

В каталоге HTML обнаруживаем следующие файлы:

   18196.hhc
   $FIftiMain
   final
   #IDXHDR
   #ITBITS
   $OBJINST
   #STRINGS
   #SYSTEM
   #TOPICS
   #URLSTR
   #URLTBL
   #WINDOWS
   $WWAssociativeLinks
   $WWKeywordLinks

Кто что значит, рассказывать не буду, смотрите Википедию и MSDN.
Нас интересует каталог ./final/, именно в нем находятся все страницы с текстом
и картинки, если они были в книге.

Этот каталог и станет исходным для формирования PDF, который мы передадим в
качестве параметра в утилиту htmldoc.
Авторы рекомендуют делать два прохода при конвертации.

Первый - индексация, сортировка, удаление лишних элементов и объединение в один каталог.

   htmldoc -d PDF/ HTML/final/*.html

И второй - сама конвертация, но уже из каталога PDF:

   htmldoc --compression=9 --book --size a4 --jpeg=100 -t pdf14 -f RHCE.pdf PDF/*.html

html --help для краткой справки
man htmldoc - для более подробного описания параметров.

В итоге получился правильный формат книги и на 2 мегабайта меньше размер.
 
27.01.2011 , Автор: pavlinux , Источник: http://pavlinux.ru/2011/01/27/110...
Ключи: pdf, chm, convert / Лицензия: CC-BY
Раздел:    Корень / Пользователю / Файлы, копирование, архивация

Обсуждение [ Линейный режим | Показать все | RSS ]
 
  • 1.1, AHAH, 08:37, 28/01/2011 [ответить] [смотреть все]
  • +/
    на сколько помню 7зип умеет распаковывать цшм , на счет порта п7зип-фул не уверен =)
     
  • 1.2, gegMOPO4, 17:31, 28/01/2011 [ответить] [смотреть все]
  • +/
    И "жёсткий" немасштабируемый формат.

    Если волнует размер -- запакуйте вытащенные html в tar.xz, ещё меньше будет.

     
     
  • 2.5, pavlinux, 18:34, 29/01/2011 [^] [ответить] [смотреть все]
  • +/
    Электронные книги понимают html.tar.xz ? :)
     
     
  • 3.6, gegMOPO4, 20:04, 30/01/2011 [^] [ответить] [смотреть все]
  • +/
    Не понял.
     
     
  • 4.7, pavlinux, 23:07, 30/01/2011 [^] [ответить] [смотреть все]
  • +/
    > Не понял.

    https://www.amazon.com/kindle

     
     
  • 5.8, gegMOPO4, 00:30, 31/01/2011 [^] [ответить] [смотреть все]  
  • +/
    А-а-а... Не знаю, какой там софт и что он принимает.
     
     
  • 6.9, pavlinux, 01:10, 31/01/2011 [^] [ответить] [смотреть все]  
  • +/
    > А-а-а... Не знаю, какой там софт и что он принимает.

    Content Formats Supported:
    Kindle (AZW), TXT, PDF, Audible (Audible Enhanced (AA, AAX)), MP3, unprotected MOBI,
    PRC natively; HTML, DOC, JPEG, GIF, PNG, BMP through conversion.

     
     
  • 7.10, Пользователь Debian, 17:59, 01/02/2011 [^] [ответить] [смотреть все]  
  • +/
    Какой ужас.

    Есть же PocketBook, который умеет CHM, FB2 и сбственно HTML (ну, кроме неудобных для чтения PDF, DjVu и остальной ерунды).

     
     
  • 8.11, pavlinux, 18:32, 01/02/2011 [^] [ответить] [смотреть все]  
  • +/
    > Какой ужас.
    > Есть же PocketBook, который умеет CHM, FB2 и сбственно HTML (ну, кроме
    > неудобных для чтения PDF, DjVu и остальной ерунды).

    А для прослушивания RealAudio мне надо покупать Apple?!

     
     
  • 9.12, Аноним, 04:12, 04/02/2011 [^] [ответить] [смотреть все]  
  • +/
    Если производитель Вашего компьютера запрещает Вам слушать RealAudio, то 8212 ... весь текст скрыт [показать]
     
  • 1.3, Слакварявод, 18:21, 28/01/2011 [ответить] [смотреть все]  
  • +/
    тока сёдня ковырялся... вот.. в помощь многим...
    http://lists.slackbuilds.org/pipermail/slackbuilds-users/2009-September/00449
     
  • 1.4, x0r, 00:30, 29/01/2011 [ответить] [смотреть все]  
  • +/
    а как с русскими кодировками?
    все нормально?
     

    Ваш комментарий
    Имя:         
    E-Mail:      
    Заголовок:
    Текст:



      Закладки на сайте
      Проследить за страницей
    Created 1996-2017 by Maxim Chirkov  
    ДобавитьРекламаВебмастеруГИД  
    Hosting by Ihor