Youtubezilla.ru

Мастер бытовой техники
0 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Импорт данных из PDF в Excel через Power Query

Импорт данных из PDF в Excel через Power Query

Задача переноса данных из таблицы в PDF-файле на лист Microsoft Excel — это всегда «весело». Особенно если у вас нет дорогих программ распознавания типа FineReader или чего-то подобного. Прямое копирование обычно ни к чему хорошему не приводит, т.к. после вставки скопированных данных на лист, они, скорее всего, «слипнутся» в один столбец. Так что их потом придется кропотливо разделять с помощью инструмента Текст по столбцам с вкладки Данные (Data — Text to Columns) .

И само-собой, копирование возможно только для тех PDF-файлов, где есть текстовый слой, т.е. с только что отсканированным с бумаги в PDF документом это не сработает в принципе.

Но все не так грустно, на самом деле 🙂

Если у вас Office 2013 или 2016, то за пару минут без дополнительных программ вполне можно реализовать перенос данных из PDF в Microsoft Excel. А помогут нам в этом Word и Power Query.

Для примера, давайте возьмем вот такой PDF-отчет с кучей текста, формул и таблиц с сайта Европейской Экономической Комиссии:

Исходный PDF

. и попробуем вытащить из него в Excel, скажем первую таблицу:

Нужная таблица в PDF

Шаг 1. Открываем PDF в Word

Почему-то мало кто знает, но начиная с 2013 года Microsoft Word научился открывать и распознавать PDF файлы (даже отсканированные, т.е. без текстового слоя!). Делается это совершенно стандартным образом: открываем Word, жмем Файл — Открыть (File — Open) и уточняем PDF-формат в выпадающем списке в правом нижнем углу окна.

Затем выбираем нужный нам PDF-файл и жмем Открыть (Open) . Word сообщает нам, что собирается запустить распознавание этого документа в текст:

Запуск распознавания PDF в Word

Соглашаемся и через несколько секунд увидим наш PDF открытым для редактирования уже в Word:

Распознанный PDF в Word

Само-собой, у документа частично слетит дизайн, стили, шрифты, колонтитулы и т.п., но для нас это не важно — нам нужны только данные из таблиц. В принципе, на этом этапе уже возникает соблазн дальше просто скопировать таблицу из распознанного документа в Word и просто вставить ее в Excel. Иногда это срабатывает, но чаще приводит ко всевозможным искажениям данных — например числа могут превратиться в даты или остаться текстом, как в нашем случае, т.к. в PDF используется не российские разделители:

Читайте так же:
Драйвера для ATI Radeon HD 4800

Искаженные данные

Так что давайте не будем срезать углы, а сделаем все чуть сложнее, но правильно.

Этап 2. Сохраняем документ как веб-страницу

Чтобы потом загрузить полученные данные в Excel (через Power Query), наш документ в Word нужно сохранить в формате веб-страницы — этот формат является, в данном случае, неким общим знаменателем между Word’ом и Excel’ем.

Для этого идем в меню Файл — Сохранить как (File — Save As) или жмем клавишу F12 на клавиатуре и в открывшемся окне выбираем тип файла Веб-страница в одном файле (Webpage — Single file) :

Сохраняем как веб-страницу

После сохранения должен получиться файл с расширением mhtml (если у вас в Проводнике видны расширения файлов).

Этап 3. Загружаем файл в Excel через Power Query

Можно открыть созданный MHTML-файл в Excel напрямую, но тогда мы получим, во-первых сразу все содержимое PDF вместе текстом и кучей ненужных таблиц, а, во-вторых, опять потеряем данные из-за неправильных разделителей. Поэтому импорт в Excel мы будем делать через надстройку Power Query. Это совершенно бесплатная надстройка, с помощью которой можно загружать в Excel данные практически из любых источников (файлов, папок, баз данных, ERP-систем) и всячески затем полученные данные трансформировать, придавая им нужную форму.

Если у вас Excel 2010-2013, то скачать Power Query можно с официального сайта Microsoft — после установки у вас появится вкладка Power Query. Если у вас Excel 2016 или новее, то качать ничего не нужно — весь функционал уже встроен в Excel по-умолчанию и находится на вкладке Данные (Data) в группе Загрузить и преобразовать (Get & Transform) .

Так что идем либо на вкладку Данные, либо на вкладку Power Query и выбираем команду Получить данные или Создать запрос — Из файла — Из XML. Чтобы были видны не только XML-файлы — меняем в выпадающем списке в правом нижнем углу окна фильтры на Все файлы (All files) и указываем наш MHTML-файл:

Выбираем MHTML-файл для импорта в Excel

Обратите внимание, что импорт успешно не завершится, т.к. Power Query ждет от нас XML, а у нас, на самом деле, HTML-формат. Поэтому в следующем появившемся окне нужно будет щелкнуть правой кнопкой мыши по непонятному для Power Query файлу и уточнить его формат:

Уточняем настоящий формат файла

После этого файл будет корректно распознан и мы увидим список всех таблиц, которые в нем есть:

Читайте так же:
Установка и настройка файлового сервера Samba на Ubuntu

Выбираем таблицу для импорта

Посмотреть содержимое таблиц можно, если щелкать левой кнопкой мыши в белый фон (не в слово Table!) ячеек в столбце Data.

Когда нужная таблица определена, щелкните по зеленому слову Table — и вы «провалитесь» в её содержимое:

Нужная нам таблица

Останется проделать несколько простых действий, чтобы «причесать» ее содержимое, а именно:

  1. удалить ненужные столбцы (правой кнопкой мыши по заголовку столбца — Удалить)
  2. заменить точки на запятые (выделить столбцы, щелкнуть правой — Замена значений)
  3. удалить знаки равно в шапке (выделить столбцы, щелкнуть правой — Замена значений)
  4. удалить верхнюю строку (Главная— Удалить строки — Удаление верхних строк)
  5. удалить пустые строки (Главная — Удалить строки — Удаление пустых строк)
  6. поднять первую строку в шапку таблицы (Главная — Использовать первую строку в качестве заголовков)
  7. отфильтровать лишние данные с помощью фильтра

Когда таблица будет приведена в нормальный вид, ее можно выгрузить на лист командой Закрыть и загрузить (Close & Load) на Главной вкладке. И мы получим вот такую красоту, с которой уже можно работать:

Онлайн способы перевода файлов pdf в excel

Преимущества, которые вы получаете при преобразовании PDF в Excel с помощью интернет-сервисов, заключаются в том, что вам не нужно устанавливать дополнительное приложение и вы можете делать это с любого устройства. Кроме того, все эти способы абсолютно бесплатны.

Просто следуйте инструкциям по преобразованию на выбранном вами сайте. Вот несколько рекомендуемых сайтов для преобразования PDF в Excel.

iLove PDF

Все так же, как и раньше, посетите сайт ilovepdf.com. После этого выберите файл, который хотите преобразовать, и убедитесь, что вы выбрали формат PDF, затем нажмите «Открыть». Подождите, пока ваш PDF-документ будет успешно загружен. Если все прошло успешно, нажмите кнопку «Преобразовать в Excel» и дождитесь завершения процесса преобразования.

Самые простые способы конвертировать PDF в файлы Excel

Затем выберите «Загрузить Excel», чтобы сохранить файл на своем устройстве, или воспользуйтесь параметрами Google Диска или другого облачного хранилища, если хотите сохранить его в Интернете.

PDF в Excel

Есть и другой способ — открыть сайт pdftoexcel.com. Через этот сайт вы можете конвертировать файлы PDF только в один формат, а именно в Excel. После открытия вы можете перетащить файл, который нужно преобразовать, затем нажмите «Загрузить» и выберите «Формат файла PDF».

Следующим шагом нажмите кнопку Открыть и дождитесь окончания процесса загрузки, чтобы завершить преобразование, если вы хотите, чтобы это было быстрее, вы можете использовать платную версию. В обратном случае не забудьте выбрать «Бесплатная загрузка», чтобы сохранить результаты преобразования.

Читайте так же:
Лучшие антивирусные сканеры, не требующие установки на компьютер

HipdfPDF

Сайт, который не менее хорош для процесса конвертации — это hipdf.com. Чтобы загрузить документ, который нужно преобразовать в Excel, щелкните параметр «Выбрать файл» и выберите « Формат файла PDF» . Затем нажмите «Открыть» и дождитесь успешной загрузки файла.

hipdf приложение для конвертирования в эксель

Если это произошло, выберите «Преобразовать», подождите несколько секунд, прежде чем появится кнопка загрузки, выбрав «Загрузить». Готово, теперь ваш PDF-файл превратился в Excel.

Sodapdf

Следующий наиболее практичный способ — конвертировать файлы через веб-сайт sodapdf.com, который, предоставляет множество вариантов форматирования. Шаги действительно просты: перейдите на сайт и нажмите кнопку Выбрать PDF.

Когда документ будет найден, выберите «открыть» для загрузки. После успешной загрузки файл будет автоматически преобразован веб-сайтом в формат Excel. Дождитесь завершения процесса, затем нажмите «Загрузить» или выберите опцию «Отправить файлы по электронной почте».

Clever PDF

Собственно, вы можете сделать этот метод онлайн или офлайн, приложение также можно установить на компьютер с Windows и Mac. Но на этот раз этапы, представленные для онлайн-версии. Сайт вы найдете — cleverpdf.com.

Clever PDF

После посещения веб-сайта вы можете сразу загружать файлы, выбрав «Файл». Затем нажмите «Начать преобразование» , дождитесь завершения процесса и выберите «Загрузить».

Конвертация файлов pdf в excel через SmallPDF

Этот метод намного проще предыдущего. Вместо того чтобы копировать отдельные файлы вручную, вы можете загрузить редактируемый файл PDF на сайт SmallPDF.com. После загрузки сайт создаст версию XLS, которую вы можете редактировать, используя те же форматы столбцов и строк, что и оригинал.

Конвертация файлов pdf в excel через SmallPDF

Затем нажмите на опцию PDF to Excel, как на изображении выше. Нажмите Выбрать файл и выберите PDF-файл для преобразования. Вам будет предложено два варианта: «Преобразовать в Excel» и «Преобразовать в Excel с распознаванием текста». Выберите параметр «Преобразовать в Excel», потому что для вашего PDF-файла были выполнены предыдущие шаги распознавания текста.

Нажмите на опцию «Выбрать», и процесс конвертации начнется. Щелкните Загрузить, чтобы загрузить результат преобразования в формате XLSX.Откройте файл Excel с помощью Microsoft Excel. Таблица внутри была верна оригиналу — числа были в нужных строках и столбцах. Таким образом, вы можете сразу использовать таблицу без необходимости корректировки форматирования.

Читайте так же:
Программа, приложения для скачивания видео на айфон,

Конвертер PDF в Excel

Конвертировать электронную таблицу PDF в файл ExcelВыберите файл Начать преобразование Скачать

Используя Сервисы SanPDF, вы соглашаетесь с нашими 《политика конфиденциальности》

Как конвертировать PDF в Excel

Как конвертировать PDF в Excel

Нажмите кнопку выбора файла, чтобы загрузить файл PDF на нашу платформу. После завершения преобразования вы сможете загрузить его.

Мы храним ваши файлы в безопасности

Мы храним ваши файлы в безопасности

Мы уважаем конфиденциальность. Все файлы будут удалены с наших серверов навсегда через 24 часа. Для получения дополнительной информации, пожалуйста, прочитайте нашу политику конфиденциальности.

Работа для всех платформ

Работа для всех платформ

Конвертер PDF в Excel доступен для всех компьютеров, включая Mac, Windows и Linux.

Решение проблемы, когда значения скопированных ячеек из табличных документов 1С в Excel воспринимаются последним как текст, т.е. без дополнительного форматирования значений невозможно применить арифметические операции. Поводом для публикации послужило понимание того, что целое предприятие с более сотней активных пользователей уже на протяжении года мучилось с такой, казалось бы на первый взгляд, тривиальной проблемой. Варианты решения, предложенные специалистами helpdesk, обслуживающими данное предприятие, а так же многочисленные обсуждения на форумах, только подтвердили убеждение в необходимости описания способа, который позволил мне качественно и быстро справиться с ситуацией.

15.01.2019 34909 itriot11 27

In a Hurry?

Always be the first in the line and avoid waiting!

Excel To Pdf Converter OnlineMicrosoft excel to pdf converter onlineExcel To Pdf Converter Online

Upload the document, the conversion will start automatically.

No need to leave an email or other personal information.

All files are deleted from our servers after 6h max (without a trace).

Safe and Secure

All data uploaded to our servers will be used for conversion purposes only and deleted promptly after conversion. Your files are accessed only by automated software agents.

Full Document Conversion

The web app converts documents of all sizes. No matter how complex your data tables are, they will be converted accurately without the need for further formatting.

Exact Spreadsheet Recognition

Excel To Pdf Converter Online Converter

All tables trapped in PDF will be extracted accurately. The rows and columns structure will be the same as in the original file, but fully editable and ready for reuse.

Excel’s .xlsx Format

The new spreadsheet will be in .xlsx format ready to use in Microsoft Excel (versions 7, 10, 13), LibreCalc, OpenCalc or any other office suite compatible with MS Office.

Читайте так же:
Прошивка Lenovo IdeaPhone A369i

There is no need to leave an email address or other identifiable data. Upload your file and the document will be converted right on the page.

Extract Scanned Tables

Besides regular PDF files, the service works with scanned PDFs as well. Using the latest OCR technology, it accurately recognizes numbers and data.

Conversion speed depends on the file size and servers overload.

Drive, Dropbox and OneDrive

Import PDFs from your Google Drive, Dropbox or OneDrive account. Log in, choose a file and start converting.

Excel To Pdf Converter online, free Fast Without Email

This service is free to use, without any file conversion limits. Try it out right now.

How to convert PDF to Excel Free Online

  1. Upload or drag and drop any PDF (regular or scanned) to PDFtoExcel.com. Alternatively, you can import the PDF for conversion directly from Google Drive, Dropbox or OneDrive.
  2. The conversion starts automatically as soon as the file has been uploaded.
  3. Wait for PDFtoExcel.com to finish conversion.
  4. Download your .XLSX spreadsheet by clicking on the Free Download button.

Excel To Pdf

This website uses cookies to ensure you get the best possible experience.
By continuing you agree to our Terms of Service and Privacy Policy

Онлайн-сервисы для конвертации PDF

Онлайн-сервисы для перевода PDF в эксель далеко не всегда приносят хороший результат

Онлайн-сервисы для перевода PDF в эксель далеко не всегда приносят хороший результат

Основным недостатком рассмотренных программ является их высокая цена. Чтобы бесплатно преобразовать PDF в формат .xls, можно воспользоваться одним из онлайн-сервисов, например, Nitro Cloud или FreePDFConvert.

Загрузите файл на сайт-конвертер и укажите адрес вашей электронной почты. Начнется экспорт, который в зависимости от объема данных и выбранного сервиса может продлиться до 30 минут. Результат будет отправлен на указанный адрес.

Скачайте полученный документ и откройте его в Excel. В некоторых случаях таблицы придется редактировать вручную, так как при экспорте их формат может быть нарушен. Воспользовавшись услугами онлайн-конвертера, после обработки данных вы можете снова конвертировать Excel в PDF.

Почти все онлайн-конвертеры имеют ограничения по количеству бесплатного экспорта. Если вы планируете пользоваться сервисом часто, то лучше зарегистрироваться на выбранном сайте и оформить подписку на его платные услуги.

голоса
Рейтинг статьи
Ссылка на основную публикацию
Adblock
detector