Python初心者です。会社でPythonでPDFを読み取りたいと考えています。PDFからデータを取り出すようなライブラリを教えていただけないでしょうか?
環境
Windows
Python3.7
Anaconda
tabula-py 2.3.0
がおすすめ。Javaが必要。ファイルから自動でデータフレームにしてくれる。
import tabula
df = tabula.read_pdf("test.pdf", pages='all')
回答した時点で利用規約に同意したものとみなされます。住所や電話番号などの個人情報、個人の名誉を傷つけるもの、暴力的または性的な内容、犯罪予告、営業、医学と薬学に関する知識、意味のないコンテンツは送信できません。