2024-07-12
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Notitias in tabulis e documentis PDF obtinendis etiam munus est quod in opere cotidiano officio facile implicatur. Exempli gratia, si velimus notitias tabulares obtinere in annuam relationem societatis, PDF facile centena paginarum notitiarum continere potest.
Effingo singillatim e tabula PDF ac deinde in Tabulam Excelsam transiens nimis inutilis est.
Methodum meam inspice et quomodo eum Pythone utentem solvas. Utere pdfplumber ut legas tabulas PDF, sponte mensas in singulis paginis extraho, easque in novas Praecedo tabellas scribe in ansa. Noli palpare, Modo opus est premere puga currere, et omnes operationes automatice generabuntur et nominabuntur. .
- ## 导入工具包
- import pdfplumber
- import pandas as pd
-
- ## 读取 PDF 文件
- p = pdfplumber.open("./贵州茅台2019年年报.pdf")
-
- # 选好读取全部页面
- for i in range(len(p.pages)):
- ## 读取一页中全部表格
- tables = p.pages[i].extract_tables()
- print(f'第{i+1}页一共有{len(tables)}个表格')
- for j in range(len(tables)):
- ## 生成表格
- df = pd.DataFrame(tables[j])
- ## 写入 Excel 文件
- df.to_excel(f'./贵州茅台2019年年报_第{i+1}页_第{j+1}张表.xlsx')
Effectus realization: