Авг
Как конвертировать PDF файл в текст или HTML
Мы постоянно сталкиваемся с ситуацией, когда найден или получен по почте интересный документ в PDF формате (для просмотра таких документов необходим Adobe Acrobat Reader) и требуется его отредактировать для использования в другом контексте и возможно в дальнейшем разместить содержимое этого файла у себя на сайте.
Для этих целей могут быть использованы платные программы: ABBYY FineReader - распознования текстов, PDF Transform - преобразование PDF в тестовые форматы.
Но для экономии корпоративного или семейного бюджета можно воспользоваться следующими бесплатным решениям.
Преобразование Adobe PDF файлов в текст или HTML в онлайн
Компания Abode на своем сайте предлагает онлайн сервис по конвертированию содержимого PDF файла в текст или HTML 3.2.
Online conversion tools for Adobe PDF documents - Adobe PDF conversion:
http://www.adobe.com/products/acrobat/access_onlinetools.html
Для конвертации необходимо зайти на указанный выше онлайн сервис по извлечению содержимого PDF файла в текст, указать URL PDF файла (обратите внимание, PDF файл должен быть размещен в Интернете).
К примеру, на необходимо преобразовать PDF файл в текс: DM_BlogsThatFollow.pdf (www.digeratimarketing.co.uk, High Traffic / PR Blogs that follow links), указываем в адресе файла ссылку:
- http://www.digeratimarketing.co.uk/toolshop/DM_BlogsThatFollow.pdf
Далее выбираем формат назначения:
- HTML 3.2
- Text
заполняем справочные поля - по какой причине вам пришлось воспользоваться этим сервисом, возможные варианты:
- отсутствие программы Adobe Acrobat Reader под вашу платформу,
- Reader несовместим с вашими ПО
- или другое
указать свою платформу:
- Windows
- Macintosh
- Unix
- Linux
- мобильное устройство
- или другое
Начинаем процесс преобразования PDF в HTML, нажав кнопку - Convert, время преобразования PDF документа в редактируемый вид зависит от сложности документа и загруженности сервиса Адобе заявками на преобразование текста.
Конвертация Adobe PDF документов через отправку pdf по электронной почте
Что же делать если вы скачали документ на свой компьютер, а ссылку на него не помните? Или вам прислали документ по почте и теперь сохранен локально на компьютере. В этом случае преобразовать Adobe PDF файла можно разместив PDF файл в Интернете и воспользовавшись сервисом указанным выше.
Альтернативный способ - воспользоваться другим сервисом от Adobe, отправив письмо с вложенным (MIME encoded) документом по адресам:
- pdf2txt@adobe.com - для преобразования PDF документа в txt
- pdf2html@adobe.com - для преобразования PDF файла в HTML.
В ответ на ваше письмо придет конвертированный файл в запрошенном формате.
Современные поисковики (Google) умеют индексировать содержимое PDF документов и позволяют просмотреть содержимое документа в HTML виде, не скачивая сам PDF файл.