Hi , 欢迎!
开店!    曝光台    保障    地图    帮助中心
赞助广告
全站顶部广告

如何读取一个txt文件(英文)形成词频字典并画出一个词云图

  • 时间:2020-10-28 23:47 编辑:tju3018209331 来源: 阅读:538
  • 扫一扫,手机访问
摘要:

python课的一个小作业 也借鉴了csdn别人的代码
渣渣第一次分享一下23333333
import string
from wordcloud import WordCloud
import matplotlib.pyplot as plt

def txt_frequency_ananlysis(file):
with open (file,“r”)as f:
content=f.read()
punctuation_string = string.punctuation
no_meaning_words=[“and”,“or”,“is”,“are”,“the”,“that”,“to”,“of”,“in”]
for i in no_meaning_words:
content=content.replace(i,"")
for i in punctuation_string:
content=content.replace(i,"")
content=content.lower().split()
dict_index=dict()
# print(type(dict_index))
for i in content:
dict_index["%s"%i]=content.count(i)
# print(type(dict_index))
list_index = sorted(dict_index.items(), key=lambda dict1: dict1[1], reverse=True)
print(list_index)
return dict_index
# print(dict_index)

def wc_from_word_count(word_count):
wc = WordCloud(
max_words=500, # 最多显示词数
# max_font_size=100, # 字体最大值
background_color=“white”, # 设置背景为白色,默认为黑色
width = 1500, # 设置图片的宽度
height= 960, # 设置图片的高度
margin= 10 # 设置图片的边缘
)
wc.generate_from_frequencies(word_count) # 从字典生成词云
plt.imshow(wc) # 显示词云
plt.axis(‘off’) # 关闭坐标轴
plt.show() # 显示图像

test_analysis=txt_frequency_ananlysis(“test.txt”)
wc_from_word_count(test_analysis)

  • 全部评论(0)
最新发布的资讯信息
【技术前线|】小圈源码小圈app源码部主要功能(2021-05-06 11:10)
【技术文档|网络通讯】叮豚AI智能企业数字化营销系统带智能获客品牌推广致力于智能企业数字化应用系统应用(2021-01-30 16:46)
【技术前线|区块链】编译64位windows下可运行的.dll文件(2020-11-01 01:14)
【技术前线|物联网】ARM Cortex-A系列(A53、A57、A73等)处理器性能分类与对比(2020-11-01 01:04)
【技术前线|程序人生】加班丧?来看看这些句子给你满满正能量(2020-10-28 23:59)
【技术前线|音视频开发】JZ6(2020-10-28 23:58)
【技术文档|Python】Mac电脑上安装python,pycharm(2020-10-28 23:57)
【技术文档|Python】Python字典排序高级用法(2020-10-28 23:57)
【技术文档|Python】【Task04】Numpy学习打卡(2020-10-28 23:56)
【技术前线|程序人生】职业理念-10月28日(2020-10-28 23:53)
联系我们

平台客服:28292383

平台电话:400办理中.....

平台邮箱:28292383#qq.com(#更换@)

工作时间:早9:00 晚:24:00(节假日无休)

我的
足迹
收藏
社区投稿
推广赚佣
平台客服
APP

扫一扫进手机版
TOP