之前做PPT的时候有很多数据是嵌入的excel,后来excel的文件找不到了,再利用其中的数据则非常困难。
将PPT保存为xml
选择“另存为”,将ppt保存为“.xml”格式
用python beautifulsoup解析
from bs4 import BeautifulSoup
import xlwt
soup = BeautifulSoup(open("流畅度-工具类.xml",encoding="utf-8"),"lxml")
pt = soup.find_all("c:pt")
col = 0
data_out = xlwt.Workbook()
sheet = data_out.add_sheet("abc", cell_overwrite_ok=False)
for data in pt:
i = int(data["idx"])
if i == 0:
col+=1
sheet.write(i,col,data.text)
file_output = "result.xls"
data_out.save(file_output)