Как извлечь текст или изображения из файла PDF

Файлы PDF отлично подходят для обмена отформатированными файлами между платформами и между людьми, которые не используют одно и то же программное обеспечение, но иногда нам нужно извлечь текст или изображения из файла PDF и использовать их на веб-страницах, документах обработки текста, презентациях PowerPoint, или в программном обеспечении настольных издательских систем.

В зависимости от ваших потребностей и параметров безопасности, установленных в отдельном PDF-файле, у вас есть несколько вариантов извлечения текста, изображений или того и другого из PDF-файла. Выберите наиболее подходящий для вас вариант.

  • Используйте Adobe Acrobat Professional. Если у вас есть полная версия Adobe Acrobat, а не только бесплатная программа Acrobat Reader, вы можете извлекать отдельные изображения или все изображения, а также текст из PDF-файла и экспортировать в различные форматы, такие как EPS, JPG и TIFF. Чтобы извлечь информацию из PDF-файла в Acrobat DC, выберите Инструменты > Экспорт PDF и выберите вариант. Чтобы извлечь текст, экспортируйте PDF-файл в формат Word или формат RTF и выберите один из нескольких дополнительных параметров, которые включают:

    • Сохранить плавный текст
    • Сохранить макет страницы
    • Включить комментарии
    • Включить изображения

  • Копирование и вставка из PDF с помощью Acrobat Reader. Если у вас есть Acrobat Reader, вы можете скопировать часть файла PDF в буфер обмена и вставить его в другую программу. Для текста просто выделите часть текста в PDF и нажмите Ctrl + C чтобы скопировать его.

    Затем откройте текстовый редактор, например Microsoft Word, и нажмите Ctrl + V чтобы вставить текст. С изображением щелкните изображение, чтобы выбрать его, а затем скопируйте и вставьте его в программу, поддерживающую изображения, используя те же команды клавиатуры.

  • Откройте файл PDF в графической программе. Если вашей целью является извлечение изображений, вы можете открыть PDF-файл в некоторых программах для иллюстраций, таких как более новые версии Photoshop, CorelDRAW или Adobe Illustrator, и сохранить изображения для редактирования и использования в настольных издательских приложениях.

  • Используйте сторонние программные инструменты для извлечения PDF. Доступно несколько автономных утилит и подключаемых модулей, которые конвертируют файлы PDF в HTML с сохранением макета страницы, извлекают и конвертируют содержимое PDF в форматы векторной графики, а также извлекают содержимое PDF для использования в программах обработки текстов, презентаций и настольных издательских систем. Эти инструменты предлагают различные варианты, включая пакетное извлечение / преобразование, извлечение всего файла или частичного содержимого, а также поддержку нескольких форматов файлов. В основном это коммерческие и условно-бесплатные утилиты для Windows.

  • Используйте онлайн-инструменты для извлечения PDF-файлов. С помощью онлайн-инструментов извлечения вам не нужно загружать или устанавливать программное обеспечение. Сколько каждый может извлечь, варьируется. Например, с помощью ExtractPDF.com вы загружаете файл размером до 14 МБ или указываете URL-адрес PDF-файла для извлечения изображений, текста или шрифтов.

  • Сделайте снимок экрана. Прежде чем сделать снимок экрана с изображением в PDF-файле, максимально увеличьте его в окне на экране. На ПК выберите строку заголовка окна PDF и нажмите другой + PrtScn. На Mac нажмите команда + сдвиг + 4 и используйте появившийся курсор, чтобы перетащить и выбрать область, которую вы хотите захватить.