The OpenNET Project / Index page

[ новости/++ | форум | wiki | теги ]

pstotext - extract plain text from PostScript and PDF files

Дата
13 Jan 2005
Заголовокpstotext - extract plain text from PostScript and PDF files
ПояснениеПрограмма для преобразования PS или PDF файлов в текстовый формат (для поддержки русского нужно патчить).
  • Единственное нормальное средство для конвертации в текст из PDF или PS с кириллицей внутри, утилита pdftotex из комплекта xpdf: "pdftotext -enc KOI8-R test.pdf";
  • PreScript - утилита на Python для вытаскивания текста из PostScript файлов , возможен вывод в HTML формате;
  • ps2html - конвертирует PostScript в HTML с максимальным сохранением форматирования.
  • PsToEdit - ковертирует PostScript и PDF во всевозможные форматы, включая текст и HTML;
  • Из pdf можно сконвертировать в PS используя pdf2ps.
  • Используя ghostscript можно конвертировать так:
    gs -q -dNODISPLAY -dNOBIND -dWRITESYSTEMDICT -dSIMPLE -c save -f ps2ascii .ps fite.ps -c quit
  • Home URLhttp://www.research.compaq.com/SRC/virtualpaper/pstotext.html
    Флагenglish
    РазделПреобразование из одного формата в другой
    Ключи

    Обсуждение [ RSS ]
     
  • 1, Alexey, 14:57, 19/09/2007 [ответить] [смотреть все]
  • +/
    А как при этом сконвертировать немецкие, датские, шведские и т.д. символы?
     

    Ваш комментарий
    Имя:         
    E-Mail:      
    Заголовок:
    Текст:



     Добавить ссылку
     
     Поиск ссылки (regex):
     

    Последние заметки
    - 10.09 Использование CAA записей в DNS для защиты от генерации фиктивных HTTPS-сертификатов
    - 08.09 Настройка ротации логов MongoDB
    - 26.07 Быстрый посмотр конфигурации GEOM во FreeBSD
    - 25.07 Проверка безопасности беспроводной сети WPA/WPA2 при помощи Aircrack-ng и Hashcat
    - 08.07 Наиболее простой способ получения и обновления сертификатов Let's Encrypt
    - 09.06 Создание QR-кода в консоли, чтобы быстро перенести текст на смартфон
    - 24.05 Просмотр подсказок/шпаргалок по командам UNIX/Linux в командной строке
    - 21.04 Как подключить в Ubuntu диски Seagate Business NAS и восстановить данные
    - 07.04 Разбираемся с "треском" в PulseAudio
    - 06.04 Развёртывание нейросети, используя готовый образ Docker
    RSS | Следующие 15 записей >>



      Закладки на сайте
      Проследить за страницей
    Created 1996-2017 by Maxim Chirkov  
    ДобавитьРекламаВебмастеруГИД  
    Hosting by Ihor