找回PPT中丢失的源文件数据

更新时间:2023-01-04 13:15:17

之前做PPT的时候有很多数据是嵌入的excel,后来excel的文件找不到了,再利用其中的数据则非常困难。

将PPT保存为xml

选择“另存为”,将ppt保存为“.xml”格式

用python beautifulsoup解析

from bs4 import BeautifulSoup
import xlwt

soup = BeautifulSoup(open("流畅度-工具类.xml",encoding="utf-8"),"lxml")

pt = soup.find_all("c:pt")

col = 0
data_out = xlwt.Workbook()
sheet = data_out.add_sheet("abc", cell_overwrite_ok=False)


for data in pt:
    i = int(data["idx"])
    if i == 0:
        col+=1
        
    sheet.write(i,col,data.text)    

file_output = "result.xls"
data_out.save(file_output)