excel_tmp.py 479 B

1234567891011121314151617
  1. import pandas as pd
  2. # 读取Excel文件
  3. excel_file = pd.ExcelFile('/Users/alvin/Downloads/元数据字段级记录.xlsx')
  4. # 读取指定表格名称的数据
  5. df = pd.read_excel(excel_file, '元数据字段级记录')
  6. # 输出表头名称
  7. print(list(df.columns))
  8. # 输出指定表头的去重数据
  9. # 根据多个字段去重
  10. df = df.drop_duplicates(subset=['数据表中文名', '字段名称'])
  11. # 将新的表格存入tmp.xlsx文件中
  12. df.to_excel('tmp.xlsx', index=False)