python中excel数据分组处理

python中excel数据分组处理1.场景描述因文本相似性热度统计(python版)需求中要根据故障类型进行分组统计,需要对excel进行分组后再分词统计,简单记录下,有需要的朋友可以直接拿走,不客气!2.解决方案采用pandas包首先进行分组,然后获取具体明细再进行分词处理(分词处理这里就不展开了),只介绍下python下excel分组,然后对具体明细进行处理。2.1完整代码importpandasaspd…

大家好,欢迎来到IT知识分享网。

1.场景描述

文本相似性热度统计(python版)需求中要根据故障类型进行分组统计,需要对excel进行分组后再分词统计,简单记录下,有需要的朋友可以直接拿走,不客气!

2.解决方案

采用pandas包首先进行分组,然后获取具体明细再进行分词处理(分词处理这里就不展开了),只介绍下python下excel分组,然后对具体明细进行处理。

2.1 完整代码

import pandas as pd

if __name__ == '__main__':
    inputfile = '软件老王-source.xlsx'
    data = pd.read_excel(inputfile)
    grp1 = data.groupby('待分类列')
    rcount = 1
    for name, group in grp1:
        print(group)
        name = name.replace('\n', '').replace('/', '')
        for i in range(len(group)):
            row = group.iloc[i].values  # 返回一个list
            cell = row[1]
            if cell is None:
                continue
            if not isinstance(cell, str):
                continue
            item = cell.strip('\n\r').split('\t')
            string = item[0]
            if string is None or len(string) == 0:
                continue
            else:
                print('这里获取group后明细值,软件老王可以单独处理,类别:' +name + '具体值:' + string)

如果你觉得文章对你有些帮助,欢迎微信搜索「软件老王」第一时间阅读或交流!

2.2 执行效果

 待分类列      原因
0  软件老王1  主机不能加电
1  软件老王1  有时不能加电
2  软件老王1    开机加电
这里获取group后明细值,软件老王可以单独处理,类别:软件老王1具体值:主机不能加电
这里获取group后明细值,软件老王可以单独处理,类别:软件老王1具体值:有时不能加电
这里获取group后明细值,软件老王可以单独处理,类别:软件老王1具体值:开机加电
    待分类列       原因
3  软件老王2  自检报错或死机
4  软件老王2    机器噪音大
这里获取group后明细值,软件老王可以单独处理,类别:软件老王2具体值:自检报错或死机
这里获取group后明细值,软件老王可以单独处理,类别:软件老王2具体值:机器噪音大
    待分类列    原因
5  软件老王3  噪音问题
这里获取group后明细值,软件老王可以单独处理,类别:软件老王3具体值:噪音问题

2.3 软件老王-source.xlsx

待分类列 原因
软件老王1 主机不能加电
软件老王1 有时不能加电
软件老王1 开机加电
软件老王2 自检报错或死机
软件老王2 机器噪音大
软件老王3 噪音问题

更多知识请关注公众号:「软件老王」,IT技术与相关干货分享,回复关键字获取对应干货,java,送必看的10本“武功秘籍”;图片,送100多万张可商用高清图片;面试,送刚毕业就能月薪“20k”的java面试题,后续不断更新中,比如“软考”、“工具”等,已经在整理中。

在这里插入图片描述

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://yundeesoft.com/14580.html

(0)
上一篇 2024-02-26 13:26
下一篇 2024-02-27 11:33

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

关注微信