Как скопировать с пдф если не копируется. Копируем фрагмент PDF-файла в Word. Как скопировать текст из pdf-файла стандартным способом

Данные, извлеченные из PDF-файлов, используйте в собственных документах или электронных таблицах. Копирование данных из одного электронного документа в другой должно быть предсказуемым, как, например, процесс, изображенный на рисунке. Попытка скопировать данные из PDF-документа, однако, может оказаться неудачной. Наилучшим решением для пользователей Acrobat 6 и Adobe Reader в Windows является использование Acrobat 5.

Программа Adobe Acrobat 5 содержит превосходное дополнение для выделения текста/таблиц - TAPS. Adobe Acrobat 6 его не имеет. Поскольку дополнения к программе Acrobat являются модульными, можно скопировать TAPS-папку (под названием Table) из папки Acrobat 5 plug_ins (см. ) и вставить ее в папку Acrobat 6 plug_ins. Вот так-то! У вас нет Acrobat 5? Лицензия TAPS разрешает его свободное распространение. Посетите сайт http://www.pdfhacks.com/TAPS/, ознакомьтесь с лицензией и загрузите копию. У вас нет и Acrobat 6? Используйте Adobe Reader вместо этой программы. Дополнение TAPS работает и в Adobe Acrobat и в Adobe Reader.

Adobe Reader 5 и 6

В имеется простой инструмент Text Select (Выделение текста), который хорошо работает с отдельными строками текста. Чтобы выделить нужный фрагмент текста, удерживайте нажатыми клавиши Alt (Версия 6) или Ctrl (Версия 5) и вытягивайте прямоугольник выделения. Многострочные параграфы, скопированные с помощью этого инструмента, не сохраняют свой формат, и будучи вставленной в программу Word каждая строка становится отдельным параграфом.

Поэтому лучше использовать дополнение TAPS, которое точно копирует параграфы и таблицы. Скопируйте полную папку Table из каталога дополнений к программе Adobe Acrobat 5 (например, C:\Program Files\Adobe\Acrobat 5.0\Acrobat\plug_ins\Table) в каталог дополнений к программе Adobe Reader (например, C:\Program Files\Adobe\Acrobat 6.0\ Reader\plug_ins). Перезапустите программу Reader.

Если у вас нет Acrobat 5, посетите сайт http://www.pdfhacks.com/TAPS/ и скачайте файл архива Acrobat _5_TAPS.zip. Разархивируйте его, а затем поместите папку TAPS в каталог plugjns программы Reader. Перезапустите программу. Теперь у вас есть инструмент выделения таблиц/форматированного текста, как показано на рисунке.

Советы по использованию TAPS

  • Adobe Acrobat 5

Программа Adobe Acrobat 5 содержит такой же инструмент Text Select (Выделение текста), как и Adobe Reader. Используйте его для копирования небольших фрагментов неформатированного текста, как было описано выше.

Для того чтобы копировать форматированный текст, например параграфы, столбцы и таблицы, используйте инструмент Table\Formatted Text Select (Таблица\Форматированный текст). Он сохраняет формат параграфа и стиль текста. Проверьте его параметры настройки командой меню Edit\Preferences\Table\Formatted Text (Правка\Параметры настройки\Таблица\Форматированный текст) и убедитесь, что они соответствуют вашим целям.

Выберите инструмент TAPS, затем растяните прямоугольник вокруг текста, который хотите скопировать. Отпустите кнопку мыши, и прямоугольник выделения превратится в зону изменяемого размера. Есть два типа зон: Table (Таблица) (синяя) и Text (Текст) (зеленая). Если автоматическое определение инструмента создает неправильный тип зоны, щелкните правой кнопкой мыши на ней и в контекстном меню выберите нужный тип.

Скопируйте выбранный текст или таблицу в буфер обмена или поместите в целевую программу.

  • Adobe Acrobat 6

С выделением текста в Adobe Acrobat 6 что-то пошло не так, как надо: фирма Adobe опустила инструмент выделения таблиц/форматированного текста и добавила инструмент Select Table (Выделение таблицы). Этот инструмент работает медленно и плохо во многих документах формата PDF.

Решение состоит в том, чтобы получить копию дополнения TAPS и установить ее в Adobe Acrobat 6. Предыдущий раздел «Adobe Reader 5 и 6» объясняет, как найти и установить TAPS, а раздел «Adobe Acrobat 5» - как использовать ее.

Владелец PDF-документа может запретить копирование текста документа. В таких случаях инструменты выделения текста будут заблокированы. См. раздел «Шифрование и расшифровка PDF-документов (без помощи Adobe Acrobat)», где обсуждаются вопросы PDF-безопасности.

Выделение текста на отсканированных страницах

Если страницы вашего документа - растровые изображения, а не текст, попробуйте использовать инструмент Paper Capture OCR. Он конвертирует изображение страницы в оперативный текст, хотя качество преобразования зависит от четкости растрового изображения. Проверить, является ли страница растровым изображением, можно, активизировав инструмент Text Select (Выделение текста) и затем выделив весь текст командой Edit\Select All (Правка\Выделить все). Если страница имеет какой-либо текст, инструмент выделит его. Если ничего не выделено, но страница содержит текст, то это, вероятно, растровое изображение.

Иногда текст страницы создается с помощью векторной графики. Этот вид текста не является оперативным текстом (поэтому вы не можете копировать его) и не поддается оптическому распознаванию символов.

Пользователи Adobe Acrobat 6 могут копировать PDF-документ, используя команду меню Start Capture\Paper Capture\Document (Начало сбора данных\Сбор данных с бумаги\Документ). В отличие от Acrobat 5, Acrobat 6 не имеет никакого встроенного предела количества страниц, для которого можно применять оптическое распознавание символов.

Пользователи Adobe Acrobat 5 (в Windows) должны загрузить дополнение Paper Capture от Adobe. Откройте командой меню Tools\Download Paper Capture Plug-in (Сервис\3агрузить дополнение Paper Capture) веб-страницу с командами и ссылкой к странице загрузки. Или загрузите его непосредственно с веб-страницы http://www.adobe.com/support/downloads/detail.jsp?ftpID=1907. Это дополнение к программе выполняет оптическое распознавание символов только с 50 страниц PDF-документа за один раз.

Когда возникает необходимость извлечь картинку из PDF файла, многие пользователи испытывают трудности. Дело в том, что PDF файлы не так просто редактировать.

Формат PDF (Portable Document Format), разработанный компанией Adobe Systems, широко распространен и используется для хранения документов, инструкций, электронных книг. Преимуществами формата является то, что документ, созданный в формате PDF, одинаково отображается на любом устройстве.

Как из PDF файла вытащить картинки? Для этого, существуют продвинутые платные программы для редактирования PDF файлов. В этой статье мы рассмотрим способы извлечения изображений из PDF, без использования платных инструментов.

Вы познакомитесь с тремя самыми простыми способами для извлечения картинок из PDF. Файл в формате PDF может иметь разные свойства. Поэтому для решения проблемы: извлечения картинки из PDF, мы будем применять разные способы.

Для этого, нам понадобится бесплатная программа Adobe Acrobat Reader - просмотрщик PDF файлов, и приложение для создания скриншотов.

Если вам, наоборот, нужно сделать PDF файл из изображений, прочитайте статью на моем сайте.

Как извлечь изображение из PDF (1 способ)

Сначала рассмотрим самый простой способ, при котором файл в формате PDF состоит текста и изображений. В данном случае, мы осуществим копирование изображения непосредственно из PDF файла.

Откройте PDF файл в программе Adobe Acrobat Reader. На странице документа нажмите на нужное изображение, картинка выделится в голубом фоне. Далее кликните по изображению правой кнопкой мыши, в открывшемся контекстном меню нажмите на «Копировать изображение».

Картинка из PDF файла скопирована в буфер обмена. Вставьте изображение в другой текстовый редактор, например, в Word, или откройте картинку в графическом редакторе, для сохранения файла в нужном графическом формате (JPEG, PDF, BMP, GIF и т. д.).

Откройте графический редактор Paint, встроенный в операционную систему, который вы найдете в меню «Пуск», в Стандартных программах Windows.

В программе Paint нажмите на меню «Файл», в контекстном меню выберите пункт «Сохранить как». Выберите необходимый графический формат для данного изображения, место сохранения, изображение на компьютер.

Как достать картинку из PDF (2 способ)

Во многих случаях файлы в формате PDF создаются из изображений, особенно это касается электронных книг. В таком файле целая страница является одним изображением, а нам необходимо извлечь только определенную картинку (на странице может быть много картинок) из данной страницы. Первый способ, в этом случае, нам не подойдет.

Для копирования картинки в программе Adobe Reader, мы воспользуемся встроенным в программу инструментом «Снимок».

Откройте нужную страницу в Adobe Acrobat Reader. Выделите картинку в PDF файле вручную с помощью курсора мыши. Войдите в меню «Редактирование», в выпадающем контекстном меню нажмите на пункт «Сделать снимок».

В окне программы Adobe Reader появится сообщение о том, что выделанная область скопирована в буфер обмена.

Теперь изображение можно открыть в Paint, в другом графическом редакторе, или вставить в текстовый редактор, поддерживающий вставку изображений.

Как вытащить изображение из PDF (3 способ)

В некоторых случаях, у пользователей возникают затруднения, когда они пытаются вытащить картинку из PDF первыми двумя способами, а ничего не получается.

Файл в формате PDF может быть защищен. Поэтому, извлечь картинки из PDF файла такими способами не удается.

В некоторых случаях, необходимо скопировать картинку из PDF, которая не имеет четких прямоугольных границ. Давайте усложним задачу. Как быть, если из защищенного PDF файла нужно скопировать изображение, не имеющее четких границ (обрамленное текстом или другими элементами дизайна)?

Можно очень легко обойти эти препятствия. Решение очень простое: необходимо воспользоваться программой для создания снимков экрана. Потребуется всего лишь сделать скриншот (снимок экрана) необходимой области, которую входит интересующее нас изображение.

Откройте PDF файл в программе Adobe Acrobat Reader. Затем запустите программу для создания скриншотов. Для этого подойдет стандартная программа «Ножницы», входящая в состав операционной системы Windows, или другая подобная более продвинутая программа.

Я открыл в Adobe Reader электронную книгу в формате PDF, которая имеет защиту. Я хочу скопировать изображение, которое не имеет четких прямоугольных границ.

Для создания снимка экрана, я использую бесплатную программу (можно использовать встроенное в Windows приложение ). В программе для создания скриншотов, нужно выбрать настройку «Захват произвольной области».

После захвата изображения произвольной области, картинка откроется в окне программы для создания скриншотов. Теперь изображение можно сохранить в необходимый графический формат на компьютере. В настройках приложения выберите сохранение картинки в соответствующем формате.

Выводы статьи

С помощью трех простых способов можно легко извлечь картинки из PDF файла. Картинки будут вытащены из PDF, даже в том случае, если на файле PDF стоит защита, или нужное изображение на странице документа PDF не имеет четких прямоугольных границ.

Чтобы скопировать текст из файла формата PDF, необходимо провести некоторые простые процедуры. Какие именно, мы сейчас расскажем.

Как скопировать текст в простом файле

Как скопировать текст из PDF проще всего? Если в PDF просто текст, а не текст в виде картинки, то посмотрите на верхнюю панель программы. Если там найдете значок с большой буквой «T», то смело жмите на него. Это инструмент «Select text», после выбора его вы можете копировать нужный текст и потом вставлять в Word.

Если есть Adobe Reader, откройте PDF-документ при помощи этой программы, и сможете скопировать текст. Если же эти варианты невозможны, то нужно попробовать скопировать текст иначе.

Перед тем как скопировать текст из PDF, нужно выбрать в Интернете программу, которая переведёт документ из формата PDF в обычный текстовый документ. Подобных программ-помощников существует много, их можно скачать, а можно и провести процедуру перевода в режиме онлайн. Такими программами можно пользоваться бесплатно. Просто вставляете необходимый вам текст в окно на сайте, указываете свою электронную почту, прикрепляете файл с документом PDF и получаете письмо с текстовым документом.

Можно загрузить на компьютер программу, которая распознает файл и конвертирует его в простой текстовый документ из формата PDF в формат doc. Программа называется «ABBYY FineReader». Вот в этой программе и открывайте ваш файл. Загрузите файл в программу, она распознает и сконвертирует документ. Сохраните его в Word. Теперь можно читать и пользоваться файлом без путаницы и странных символов.

Работа с защищённым файлом

Можно столкнуться с такой проблемой, как защита от копирования или перевода в документе PDF. Скопировать текст не удаётся, а информация просто необходима. Что же делать, если скопировать текст из защищенного PDF просто не получается? Необходимо снять защиту, перевести документ в формат doc способом, указанным выше. Введите в поисковике запрос «программа для снятия защиты с PDF файла» и найдите подходящую. Нужный документ требуется перенести в окно программы, нажать на кнопку «Снять защиту» или «Снять кодировку» (зависит от ресурса, которым вы пользуетесь). Снимите ограничения - защиту с файла, сохраните его в Word. Или в окне может быть указано «Загрузить файл». Нажимаете на окно, выбираете нужный документ, нажимаете «Ок».

Можно, конечно, использовать вирусы, которые снимают защиту с документа PDF. Но это небезопасно, поскольку имеется вероятность, что после использования такого способа перевести файл в формат doc не получится.

Возможно, вам не удастся скопировать текст из PDF с помощью программы, которую вы используете. В таком случае нужно попытаться воспользоваться другими программами. Методом проб найдите оптимальную программу, даже если она англоязычная. Такие программы переводят файлы и на русском языке.

Песочница

рыцарь со стволом 27 мая 2014 в 19:11

Обходим защиту от копирования в pdf-файле

С января этого года я окончательно пересел на ОС Linux, а конкретно на Ubuntu. Я учусь на третьем курсе по специальности «Информатика и ВТ». На третьем курсе есть такой интересный предмет – схемотехника. А ещё по ним есть лабораторные работы, которые мы можем выполнять дома и отправлять преподавателю по e-mail. Поскольку преподаватель может использовать старую версию Microsoft Office, а я же работаю в LibreOffice, могут возникнуть ошибки при открытии odt на Microsoft Office, либо при сохранении doc\docx в LibreOffice. Я принял решение сохранять работу как pdf-файл и отсылать преподавателю. Кроме того, он выкладывает готовые лабораторные работы на свой сайт, чтобы любой студент мог ознакомиться с другими работами. К сожалению, у меня есть негативная черта – я не люблю, когда у меня копирую текст. Я решил защитить документ от копирования, я точнее установить запрет на копирование и поставил пароль.

Для того, чтобы убедиться, что документ нормально создан и защищён от копирования, я попробовал открыть его в стандартной программе просмотра pdf, который установлен в Ubuntu – а именно Evince. До чего же было моё удивление, когда я обнаружил, что текст можно легко скопировать. «Ну я неправильно сохранил»,- подумал я, и проделал опять те же действия. Открыл второй раз – опять текст легко копируется.

Ну тут я немало удивился и решил отослать одному товарищу этот pdf-файл. Он же сказал, что он не мог скопировать текст ни в Foxit Reader, ни в Adobe Reader.

Ну и дальнейший вполне логичный шаг с моей стороны – я попросил его скачать Evince . Благо продукт с открытым исходным кодом и кроссплатформенный. С установкой на ОС Windows не возникло проблем. Мой товарищ открыл защищённый pdf с помощью свежеустановленной Evince и смог без проблем скопировать текст.

Вывод: для обхода защиты от копирования pdf можно использовать программу Evince. Данный вариант наиболее оптимален и не требует никаких дополнительных действий и является наиболее удобным вариантом. На мой взгляд, конечно.

Я на этом не остановился, ведь возможно, проблема в самом LibreOffice, подумаете вы. Я скачал триальный Adobe Acrobat Pro и создал там pdf-файл и защитил паролем.

Я получил аналогичные результаты, Evince справился без проблем.

Теги: pdf, Evince

Данная статья не подлежит комментированию, поскольку её автор ещё не является

Есть как минимум два способа как копировать текст из PDF и оба я вам расскажу. В зависимости от того, как много текста вам нужно скопировать, будет завесить более подходящий для Вас способ.

Итак, если Вам нужно скопировать несколько страниц из PDF книги , или даже пару предложений, то в таком случае я предлагаю использовать программу, с помощью которой вы читаете такие книги.

Я считаю, что - STDU Viewer , поэтому использую её. Она работает с большинством популярных форматов, в том числе с PDF. C помощью неё можно легко копировать текст. Для этого нужно открыть книгу и выбрать инструмент Выделение текста . Выделяем нужную часть и Копируем .

Это самый простой способ скопировать текст из PDF, и он подойдет для большинства случаев. Но если же вам нужна целая книга , то такое копирование может затянуться на долгие часы.

Чтобы копировать весь текст из PDF книги я предлагаю использовать второй способ, а точнее программу Adobe Acrobat Pro . Она конвертирует книгу в WORD-файл.

Находим программу Adobe Acrobat Pro и устанавливаем. Она платная, но я уверен, что если она вам сильно нужна, то найдёте где-то на просторах интернета.

Жмём по PDF книге правой кнопкой и открываем с помощью установленной программы.

Теперь сохраним в WORD-файл. Нажимаем меню Файл – Сохранить как .

Нужно указать тип файла Документ Word или Текст (.txt). Потом ввести название и Сохранить .

Буквально несколько минут или секунд придётся подождать пока пройдёт распознавание текста и сохранение его в файл.

По завершению можно смотреть на результат.

Если нужно скопировать текст из PDF в объёмном количестве, то конечно второй способ наиболее подходящий, а первый это так – если нужно копировать несколько предложений или абзацев.