python入门之对比两份excel表格数据
今天老大交给我一个任务,对比两个版本的excel数据的异同(增删情况),唉,说多了都是泪,自从学会了python,再也不用担心老大这样的任务了~~~
好了直接上代码吧,代码中解释
import xlrd import xlwt #from xlutils.copy import copy #暂时用不上 import os l_p=[]#定义两个全局list,分别存储原始和目的需要对比的数据 l_t=[] def read_excel(): wb_pri = xlrd.open_workbook('verp.xlsx')#打开原始文件 wb_tar = xlrd.open_workbook('vert.xlsx')#打开目标文件 wb_result = xlwt.Workbook()#新建一个文件,用来保存结果 sheet_result = wb_result.add_sheet('result',cell_overwrite_ok=True) result_i =0 result_j =0 for sheet_i in range(2,21): sheet_pri = wb_pri.sheet_by_index(sheet_i) #通过index获取每个sheet,为了省心,我根据自己的需要限定为第2-21个sheet sheet_tar = wb_tar.sheet_by_index(sheet_i) sheet_backup = wb_backup.get_sheet(sheet_i) print(sheet_pri.name,sheet_tar.name) #为什么是取这一列,因为这就是需要对比的数据阿 l_p = sheet_pri.col_values(2) l_t = sheet_tar.col_values(2) #tmp =[var for val in a if val in b] #这个是求交集,老大没要求是用不上的 #求参数在pri(原始数据)中存在,而在tar(目标)中不存在的 tmp_pd = list(set(l_p).difference(set(l_t))) #求参数在tar中存在,而在pri中不存在的 tmp_td = list(set(l_t).difference(set(l_p))) if result_i <result_j: result_i =result_j else: result_j =result_i for pd_i in tmp_pd: result_i = result_i+1 sheet_result.write(result_i,0,sheet_pri.name) sheet_result.write(result_i,2,pd_i) for td_i in tmp_td: result_j =result_j +1 sheet_result.write(result_j,1,sheet_tar.name) sheet_result.write(result_j,3,td_i) #好了,可以去名为result的excel中查看结果了 wb_result.save('result.xls') if __name__ == '__main__': read_excel()
原文地址:https://segmentfault.com/a/1190000007824454