PDF to HTML converter 1.0

Скачать конвертер PDF to HTML (3.6 Mb): depositfiles.com

В интернете размещаются сотни книг в pdf формате. Некоторые веб мастера (администраторы онлайн библиотек, тематических порталов) сталкиваются с задачей конвертирования pdf в html. С помощью такой конвертации можно разместить отрывок предлагаемой для скачивания книги или журнала.

Конвертация html в html
Рис.1. PDF to HTML converter 1.0.

Преобразование PDF документа с помощью программы PDF to HTML converter не вызовет затруднений, интерфейс очень простой. Кроме стандартного запуска поддерживается вызов из командной строки:
Синтаксис:
Pdf2Html.exe.exe -input<PATH> -output<PATH>
Пример:
Pdf2Html.exe.exe -inputC:\source.pdf -outputC:\result.html

Html файл, полученный в процессе конвертации, в точности передает исходный вид pdf документа, но далек от идеала в плане верстки. Обязательным условием является создание фоновой картинки, даже если преобразовался сплошной текст.

Границы таблиц, подчеркивания и другие параметры форматирования переводятся в графику, а текст построчно заключается в тег <div> </div>, у которого жестко прописана позиция на странице. Казалось бы, использование тега <pre> </pre> значительно упростило верстку, но для документов, в которых присутствуют таблицы и изображения это единственный универсальный подход.

Для теста использовались два pdf документа. Первый файл представлял собой отрывок книги и состоял исключительно из текста. Несмотря на то, что никакого оформления текста и страницы в целом не использовалось, фоновый рисунок все равно создан. Результат конвертации pdf в html можно скачать ниже.

Скачать пример конвертации pdf в html:
Исходный PDF файл (книга) 0.1 Mb
Конвертация в Html (архив) 4 Kb

Второй pdf файл представлял собой таблицу данных с изображением (графиком). Результат конвертации выглядит достойно, текст доступен для копирования и индексации поисковыми системами. На этом примере хорошо видно, что без точных координат расположения блоков создать страницу, похожую на оригинал практически невозможно.

Скачать пример создания html из pdf:
Исходный PDF файл (таблица) 0.2 Mb
Созданная html страница (архив) 0.1 Mb

Программу PDF to HTML можно использовать, когда нужно срочно создать html страницу или сайт из pdf документа. Конвертор создает большое количество не всегда нужного html кода, но это цена сохранения внешнего вида, близкого к оригиналу.