单个字次数统计输出:
文字读取
>>> txt=open("C:\\WEXAM\\000000000000\\文本.txt","r").read()
1
标点符号识别
>>>for ch in ",。 ? : " :
txt = txt.replace(ch,"")
1
2
读取并统计
>>>d = {}
>>> for ch in txt:
d[ch]=d.get(ch,0)+1
>>> ls=list(d.items())
>>> ls.sort(key=lambda x:x[1],reverse=True)
>>> a,b=ls[0]
>>> print("{}:{}".format(a,b))
的:2557
1
2
3
4
5
6
7
8
输出词频统计top10
ls.sort(key=lambda x:x[1],reverse=True)
for i in range(10):
print(str(ls)[2],end="")
的\"一我了是不有他
---------------------
【转载,仅作分享,侵删】
作者:那个年轻人
来源:CSDN
原文:https://blog.csdn.net/tandelin/article/details/88372927
版权声明:本文为博主原创文章,转载请附上博文链接!
|
|