The OpenNET Project / Index page

[ новости/++ | форум | wiki | теги ]

Оформление TeX для создание правильных PDF с русским текстом (tex rus pdf)


<< Предыдущая ИНДЕКС Правка src / Печать Следующая >>
Ключевые слова: tex, rus, pdf,  (найти похожие документы)
From: Sergey Sinitsa <podrugomu@gmail.com.> Date: Mon, 24 Apr 2007 14:31:37 +0000 (UTC) Subject: Оформление TeX для создание правильных PDF с русским текстом Оригинал: http://rulinux.net.ru/node/44 Делаем правильные русские PDF с помощью свободного софта: OO Writer, AbiWord, KOffice KWord, Scribus, PDFLaTeX + cmap PDF с русским текстом оказывается можно сделать неправильно. Если русский будет находиться в PDF-файле в неправильной кодировке, то не смотря на то, что документ прекрасно отображается и печатается, с ним возникают следующие проблемы: * не работает поиск русских слов при просмотре документа; * нельзя скопировать текст через буфер обмена; * люди с ослабленным зрением не смогут использовать программы чтения текста; * быстро не посмотреть содержимое присланного документа в виде HTML при чтении почты в GMail; * русский текст в документе не индексируется поисковыми машинами в Сети. Последний пункт наиболее важен при публикации документов в Сети: такой PDF сложно будет найти в Google. Одним из преимуществ Open Office Writer перед MS Office Word является встроенная возможность экспорта в PDF. Причем Writer из Open Office 2 сохраняет русский правильно. Легковесный свободный текстовый процессор AbiWord версии 2.4 сохраняет русский в PDF некорректно. Кроме того, PDF-файл получается в 2,5 раза больше, чем при сохранении в OO Writer. Программа вёрстки документов KWord из пакета KOffice под KDE (только для Linux) также умеет сохранять в PDF. Уникальной особенностью KWord является возможность импортировать PDF-файлы для редактирования. Как у KWord обстоит с русским в PDF уточняется, следите за обновлением поста) Scribus является свободным аналогом профессиональных программ для верстки Page Maker и Quark Express. Умеет экспортировать в PDF, детали уточняются... Вопрос на $100. Единственный способ делать правильные PDF в TeX, который мне удалось освоить, заключается в использовании пакета cmap. А это автоматически означает что для создания PDF можно использовать только PDFLaTeX, но не dvitopdf. Это, в свою очередь, означает невозможность использования векторных рисунков в формате eps напрямую. Я нашел следующее решение... В Debian cmap находится в пакете tetex-extra. Чтобы подключить cmap надо использовать в документе TeX заголовок следующего вида: \RequirePackage{cmap} \RequirePackage[cp1251]{inputenc} \RequirePackage[TS1,T2A]{fontenc} \RequirePackage[english,russian]{babel} Причем именно в таком порядке: cmap первый. Иначе работать не будет! Все. Теперь, если делать PDF с помощью PDFLaTeX, русский будет в порядке. Если надо вставить график или схему в векторном формате, то теперь единственный вариант вместо eps использовать скрипты MetaPost или PSTricks, либо конвертировать eps в PDF. Я пошел по первому пути воспользовавшись тем, что мой рабочий редактор диаграмм Dia умеет экспортировать в MetaPost напрямую. Что делать с этим *.mp-файлом мне, избалованному удобством LaTeX-фронтэнда Kile пользователю, было решительно не ясно. Не помогла и документация tetex на 50Мб. Повезло что удалось нагуглить страничку одного техасского парня, описывающего свой опыт использования подготовленной в свободных программах векторной графики в TeX. Оказалось, надо откомпилировать mp-файл командой mpost example.mp, переименовать выходной файл (что-то типа example.1) в example.mps и вставить в документ следующим образом: \begin{figure}[ht] \centering \includegraphics[width=150mm]{example.mps} \caption{Подпись} \label{fig:MyLabel} \end{figure} Если диаграмма содержала надписи на русском языке, то в PDF их видно не будет и для их появления требуются следующее шаманство: открываем файл example.mp текстовым редактором, заменяем во всем документе {OT1} на {T2A}, вставляем в заголовок перед \begin{document} руссифицирующее заклятие: \RequirePackage[cp1251]{inputenc} \RequirePackage[TS1,T2A]{fontenc} Потом сохраняем файл в кодировке cp1251, и далее по схеме выше. Пол дня жизни ушло на пробы и ошибки, во время эксперементов ни одного пингвина не пострадало. Все было проделано на свежей инсталляции Debian GNU/Linux 4.0 Etch. Причем все упомянутые программы находятся на 1-м DVD из 3-х DVD-дисков дистрибутива, за которые огромное спасибо Михаилу Коннику. Debian 4.0 Etch добавился в список свободного софта, которым я могу поделиться.

<< Предыдущая ИНДЕКС Правка src / Печать Следующая >>

Обсуждение [ RSS ]
 
  • 1, Клаус Гена, 22:15, 13/12/2007 [ответить] [смотреть все]
  • +/
    А UTF-8? Почему Вы ее не выбираете? И Xetex вместо pdftex? И Context вместо Latex?
     

    Ваш комментарий
    Имя:         
    E-Mail:      
    Заголовок:
    Текст:





      Закладки на сайте
      Проследить за страницей
    Created 1996-2017 by Maxim Chirkov  
    ДобавитьРекламаВебмастеруГИД  
    Hosting by Ihor