The OpenNET Project
 
Поиск (ключи):    ПРОГРАММЫ СТАТЬИ СОВЕТЫ ФОРУМ
  WIKI НОВОСТИ (+) MAN'ы ДОКУМЕНТАЦИЯ

Оформление TeX для создание правильных PDF с русским текстом (tex rus pdf)


<< Предыдущая ИНДЕКС Правка src / Печать Следующая >>
Ключевые слова: tex, rus, pdf,  (найти похожие документы)
From: Sergey Sinitsa <podrugomu@gmail.com.> Date: Mon, 24 Apr 2007 14:31:37 +0000 (UTC) Subject: Оформление TeX для создание правильных PDF с русским текстом Оригинал: http://rulinux.net.ru/node/44 Делаем правильные русские PDF с помощью свободного софта: OO Writer, AbiWord, KOffice KWord, Scribus, PDFLaTeX + cmap PDF с русским текстом оказывается можно сделать неправильно. Если русский будет находиться в PDF-файле в неправильной кодировке, то не смотря на то, что документ прекрасно отображается и печатается, с ним возникают следующие проблемы: * не работает поиск русских слов при просмотре документа; * нельзя скопировать текст через буфер обмена; * люди с ослабленным зрением не смогут использовать программы чтения текста; * быстро не посмотреть содержимое присланного документа в виде HTML при чтении почты в GMail; * русский текст в документе не индексируется поисковыми машинами в Сети. Последний пункт наиболее важен при публикации документов в Сети: такой PDF сложно будет найти в Google. Одним из преимуществ Open Office Writer перед MS Office Word является встроенная возможность экспорта в PDF. Причем Writer из Open Office 2 сохраняет русский правильно. Легковесный свободный текстовый процессор AbiWord версии 2.4 сохраняет русский в PDF некорректно. Кроме того, PDF-файл получается в 2,5 раза больше, чем при сохранении в OO Writer. Программа вёрстки документов KWord из пакета KOffice под KDE (только для Linux) также умеет сохранять в PDF. Уникальной особенностью KWord является возможность импортировать PDF-файлы для редактирования. Как у KWord обстоит с русским в PDF уточняется, следите за обновлением поста) Scribus является свободным аналогом профессиональных программ для верстки Page Maker и Quark Express. Умеет экспортировать в PDF, детали уточняются... Вопрос на $100. Единственный способ делать правильные PDF в TeX, который мне удалось освоить, заключается в использовании пакета cmap. А это автоматически означает что для создания PDF можно использовать только PDFLaTeX, но не dvitopdf. Это, в свою очередь, означает невозможность использования векторных рисунков в формате eps напрямую. Я нашел следующее решение... В Debian cmap находится в пакете tetex-extra. Чтобы подключить cmap надо использовать в документе TeX заголовок следующего вида: \RequirePackage{cmap} \RequirePackage[cp1251]{inputenc} \RequirePackage[TS1,T2A]{fontenc} \RequirePackage[english,russian]{babel} Причем именно в таком порядке: cmap первый. Иначе работать не будет! Все. Теперь, если делать PDF с помощью PDFLaTeX, русский будет в порядке. Если надо вставить график или схему в векторном формате, то теперь единственный вариант вместо eps использовать скрипты MetaPost или PSTricks, либо конвертировать eps в PDF. Я пошел по первому пути воспользовавшись тем, что мой рабочий редактор диаграмм Dia умеет экспортировать в MetaPost напрямую. Что делать с этим *.mp-файлом мне, избалованному удобством LaTeX-фронтэнда Kile пользователю, было решительно не ясно. Не помогла и документация tetex на 50Мб. Повезло что удалось нагуглить страничку одного техасского парня, описывающего свой опыт использования подготовленной в свободных программах векторной графики в TeX. Оказалось, надо откомпилировать mp-файл командой mpost example.mp, переименовать выходной файл (что-то типа example.1) в example.mps и вставить в документ следующим образом: \begin{figure}[ht] \centering \includegraphics[width=150mm]{example.mps} \caption{Подпись} \label{fig:MyLabel} \end{figure} Если диаграмма содержала надписи на русском языке, то в PDF их видно не будет и для их появления требуются следующее шаманство: открываем файл example.mp текстовым редактором, заменяем во всем документе {OT1} на {T2A}, вставляем в заголовок перед \begin{document} руссифицирующее заклятие: \RequirePackage[cp1251]{inputenc} \RequirePackage[TS1,T2A]{fontenc} Потом сохраняем файл в кодировке cp1251, и далее по схеме выше. Пол дня жизни ушло на пробы и ошибки, во время эксперементов ни одного пингвина не пострадало. Все было проделано на свежей инсталляции Debian GNU/Linux 4.0 Etch. Причем все упомянутые программы находятся на 1-м DVD из 3-х DVD-дисков дистрибутива, за которые огромное спасибо Михаилу Коннику. Debian 4.0 Etch добавился в список свободного софта, которым я могу поделиться.

<< Предыдущая ИНДЕКС Правка src / Печать Следующая >>

Обсуждение [ RSS ]
 
  • 1, Клаус Гена, 22:15, 13/12/2007 [ответить] [смотреть все]
  • +/
    А UTF-8? Почему Вы ее не выбираете? И Xetex вместо pdftex? И Context вместо Latex?
     

    Ваш комментарий
    Имя:         
    E-Mail:      
    Заголовок:
    Текст:



    АКЦИЯ! ПОДПИШИСЬ на журнал Linux Format до 31 января 2012 года и выиграй СУПЕРПРИЗ!

    Журнал "Linux Format" (Линукс Формат)- Единственный в России и странах СНГ журнал на русском языке, посвящённый Linux и свободному ПО. Журнал для IT-директоров, IT-менеджеров, программистов, системных администраторов, учителей школ и преподавателей ВУЗов и всех пользователей ПК. В каждом выпуске: Новости индустрии OpenSource, обзоры новинок свободного ПО, обучающие и методические статьи.

    Каждый, кто оформит подписку, получает бонус- объёмные наклейки на системный блок и подарки: с одним из первых выпусков журнала в 2012 году- диск с архивом номеров за 2005-2011 г.г. и ежемесячно электронную версию журнала в pdf-формате.

    Подробнее о проведении акции вы можете прочитать на странице сайта.


      Закладки на сайте
      Проследить за страницей
    Created 1996-2012 by Maxim Chirkov  
    ДобавитьРекламаВебмастеруГИД  
    RUNNet TopList