本文共 710 字,大约阅读时间需要 2 分钟。
(1)词云背景图(二值化图片)
(2)词集txt,本例用爬取到的哔哩哔哩弹幕
词云字体样式文件与弹幕文件:
import matplotlib.pyplot as pltfrom wordcloud import WordCloud#加载用于构建词云图的二值化背景图bg_img = plt.imread(r'C:\Users\Administrator\Desktop\timg (1).jpg')#爬取的哔哩哔哩弹幕words = open(r'C:\Users\Administrator\Documents\Tencent Files\1239112948\FileRecv\danmu.txt','r',encoding='utf-8').read()wordcloud = WordCloud( background_color='white',#词云背景图颜色 mask = bg_img,#词云背景图 #字体 font_path=r'C:\Users\Administrator\Documents\Tencent Files\1239112948\FileRecv\ZhengQingKeJingYaTi-ShouBan-2.ttf',#词云中的字体样式 width=1000,#词云宽度 height=800#词云高度).generate(words)#根据弹幕生成词云对象plt.imshow(wordcloud)plt.axis('off') #去掉图片的坐标轴plt.show()
效果(关键词会显示在二值化图片的黑色部分):
转载地址:http://bcwsi.baihongyu.com/