服务器之家

服务器之家 > 正文

Python处理excel根据全称自动填写简称

时间:2021-09-18 00:42     来源/作者:爱吃肠粉的小若

在工作中处理excel遇到需要根据器件生产供应商全称填写简称的一列,由于数据表格中器件数多达几万条,单纯靠excel筛选功能手动处理需要耗费大量时间,这里使用Python中的pandas模块,读取excel进行处理。

1、需求

根据存储有供应商全称简称对应的表格对应关系.xlsx,自动填写带有供应商全称的表格待处理文件.xlsx中简称的一列。

Python处理excel根据全称自动填写简称

Python处理excel根据全称自动填写简称

2.脚本思路

首先使用pandas读取第一个表格对应关系.xlsx,然后将其储存在一个字典中,字典的键为供应商的全称,字典的值为供应商的简称。

然后读取第二个表格待处理文件.xlsx,根据列的标题头,找到供应商全称所处在的列,根据这一列每一个供应商的全称查询字典中对应键的值,将其写入表格中对应行的简称处。(这里暂时假设对应关系和待处理文件中供应商的全称如果是同一家公司则公司全称是一模一样的,存在些许差别的处理的方法在下一篇文章中在记录)。

3.代码

  1. # -*- coding: utf-8 -*-
  2. """
  3. Created on Thu Mar 4 21:25:05 2021
  4. @author: ruofei
  5. """
  6.  
  7. import pandas as pd
  8.  
  9. #填写待处理文件和对应关系的excel文件路径
  10. #注意:脚本运行时需保证被使用excel文件处于关闭状态
  11. file1 = r'待处理文件.xlsx'
  12. file2 = r'对应关系.xlsx'
  13.  
  14. #填写待处理文件中 全称所在的列名和简称要放置的列名
  15. qc1="供应商"
  16. jc1="简称"
  17.  
  18. #填写对应关系中 全称所在的列数和简称所在的列数
  19. qc2="全称"
  20. jc2="简称"
  21.  
  22. #填写读取excel文件的sheet表名
  23. sheet1="Sheet1"
  24. sheet2="Sheet1"
  25.  
  26. #--------------------*-------------*--------------*---------------------
  27. #--------------------*-------------*--------------*---------------------
  28. data1 = pd.read_excel(file1, sheet_name = sheet1)
  29. data2 = pd.read_excel(file2, sheet_name = sheet2)
  30.  
  31. #print("输出表格所有")
  32. #print(data1)
  33.  
  34. row1 = data1.shape[0]#行数
  35. col1=data1.shape[1]#列数
  36.  
  37. row2 = data2.shape[0]#行数
  38. col2=data2.shape[1]#
  39.  
  40. #print("表格文件有"+str(row1)+"行,"+str(col1)+"列")
  41.  
  42. duiying=dict()
  43.  
  44. #生成对应关系的字典
  45. for i in range(row2):
  46.  
  47. quancheng=data2.loc[i,qc2]
  48. jiancheng=data2.loc[i,jc2]
  49.  
  50. duiying[quancheng]=jiancheng
  51.  
  52. #print(quancheng)
  53.  
  54. #company1=data1.loc[0][0]
  55. #company2=data1.loc[1][0]
  56. #print("公司一为"+str(company1)+"\n"+"公司二为"+str(company2))
  57.  
  58. for i in range(row1):
  59.  
  60. a=data1.loc[i,qc1]
  61. #[qc1-1]
  62. #print(str(a))
  63.  
  64. jiancheng=duiying.get(a)
  65. if a in duiying.keys():
  66.  
  67. #print(jiancheng)
  68. data1.loc[i,jc1]=jiancheng
  69. else:
  70.  
  71. #此处修改没有简称赋予值,若赋予全称值则=a,若为空则=" "
  72. data1.loc[i,jc1]=a
  73.  
  74. data1.to_excel('处理好的文件.xlsx',sheet_name='Sheet1')

4.实现功能

根据预先整理好的对应关系表格自动填写了表格中简称空白的一列,如果表格中存在对应关系中不存在的公司,则在相应的简称位置填写其全称本身。如下图中,由于表中的小米华为没有给出其简称,因此原样照填。

Python处理excel根据全称自动填写简称

5.存在问题

在实际应用中处理几万条数据时,绝大部分正常,存在问题是,比如对应关系中全称为(中国)茅台公司,而在要处理的文件中不存在括号,或者括号中英文不同,或者括号中空格数不同,都会在后面读取为不同的字符串,在查询字典中显示不存在。处理方式在下篇中解决。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持我们。

原文链接:https://blog.csdn.net/qq_33169543/article/details/114605319

相关文章

热门资讯

yue是什么意思 网络流行语yue了是什么梗
yue是什么意思 网络流行语yue了是什么梗 2020-10-11
2020微信伤感网名听哭了 让对方看到心疼的伤感网名大全
2020微信伤感网名听哭了 让对方看到心疼的伤感网名大全 2019-12-26
背刺什么意思 网络词语背刺是什么梗
背刺什么意思 网络词语背刺是什么梗 2020-05-22
苹果12mini价格表官网报价 iPhone12mini全版本价格汇总
苹果12mini价格表官网报价 iPhone12mini全版本价格汇总 2020-11-13
2021年耽改剧名单 2021要播出的59部耽改剧列表
2021年耽改剧名单 2021要播出的59部耽改剧列表 2021-03-05
返回顶部