Python列表词频统计怎么实现?Python如何得到列表元素出现次数
罗西汉
优草派
python之中列表数据结构内是允许有重复元素存在的,而有些时候需要对列表进行词频统计,也就是统计每一个元素出现在列表中的次数。下文有详细代码示例和步骤分解,想了解和学习的小伙伴就一起往下看看吧。
1.那么第一步要做的事情就是定义列表对象,列表之中的数据可以由开发者自己去写。或者是从文件中读取出来,不过读取出来的数据要经过split()函数分隔之后才可以,因为列表元素都是逗号分隔单独存在的,示例如下:
import itertools list= [10, 1, 2, 20, 10, 3, 2, 1, 15, 20, 44, 56, 3, 2, 1]
在上面代码示例之中还导入了内置模块itertools,这是因为词频统计需要使用到其中的方法groupby。
2.准备工作做好之后先使用sort()方法将列表元素排序,排序之后相同的元素就会被放在一起。然后再去调用groupby()方法来对列表元素进行分组,分组的规则就是将相邻重复元素都放在一起,代码如下:
list.sort() temp_list= itertools.groupby(list)
3.在上一步完成分组操作之后会返回一个可迭代对象,在这个可迭代对象内有两个值,分别为分组名以及分组后的数据。所以需要使用for循环对其进行遍历,遍历之中要将分组后数据调用list()函数转为列表类型才能够对其进行读取等操作。之后使用print()函数输出分组元素名,以及len()函数获取到的分组列表长度,也就是元素出现次数了,代码如下所示:
for i,j in temp_list: tp = (f'{i}出现次数为',len(list(j))) print(tp)
以上就是关于“”Python列表词频统计怎么实现?Python如何得到列表元素出现次数的全部内容了,希望对你有所帮助。
【原创声明】凡注明“来源:优草派”的文章,系本站原创,任何单位或个人未经本站书面授权不得转载、链接、转贴或以其他方式复制发表。否则,本站将依法追究其法律责任。