import pdfplumber from openpyxl import Workbook wb = Workbook() # 创建文件对象 ws = wb.active # 获取第一个sheet myfile = 'daima.pdf' # 把文件名改成自己的实际文件名即可 path = myfile pdf = pdfplumber.open(path) print('开始读取数据') print(pdf.pages[0].extract_tables()[0][0]) ws.append(pdf.pages[0].extract_tables()[0][0]) for page in pdf.pages: # 获取当前页面的全部文本信息,包括表格中的文字 # print(page.extract_text()) for table in page.extract_tables(): # print(table) for row in table: if "序号" not in row: # print(type(row)) rowlist = str(row).replace("[", "",).replace("]", "").replace( "'", "").replace("\\n", "").split(",") print(rowlist) ws.append(rowlist) #print('---------- 分割线 ----------') pdf.close() # 保存Excel表 wb.save(myfile+'.xlsx') print('\n') print('写入excel成功')