加入收藏 | 设为首页 | 会员中心 | 我要投稿 揭阳站长网 (https://www.0663zz.cn/)- 机器学习、行业智能、决策智能、云计算、AI应用!
当前位置: 首页 > 大数据 > 正文

Python数据可视化:WordCloud基础

发布时间:2021-06-05 09:52:07 所属栏目:大数据 来源:互联网
导读:WordCloud是一种很好的展现数据的方式,网上也有不少小工具和在线网页。 但是有些不支持中文,有些安装复杂,所以决定用Python实现。 主要参考官网,通过官网的例子,讲一下WordCloud的制作。 主要流程 获取内容的路径 如果是一段文字,系统自动算频次 你也
WordCloud是一种很好的展现数据的方式,网上也有不少小工具和在线网页。
但是有些不支持中文,有些安装复杂,所以决定用Python实现。
主要参考官网,通过官网的例子,讲一下WordCloud的制作。
主要流程
获取内容的路径
如果是一段文字,系统自动算频次
你也可以直接导入统计好的频次
设置字体
一般字体路径在C:WindowsFonts,你可以选自己喜欢的中文或者英文字体
切割中文字符
英文字符就不用切割了
输入WordCloud的参数
背景色
字号
生成的形状
颜色
字体大小
字体旋转等等
生成WordCloud
用matplotlib显示图片
效果图
Python数据可视化:WordCloud入门(大伙都在用)
Python数据可视化:WordCloud入门(大伙都在用)
Python数据可视化:WordCloud入门(大伙都在用)
Python数据可视化:WordCloud入门(大伙都在用)
Python数据可视化:WordCloud入门(大伙都在用)
Python数据可视化:WordCloud入门(大伙都在用)
安装库
老规矩,首先,你要安装库。
最基本的两个:
pip install wordcloud #这是WordCloud的库 
 
pip install matplotlib #显示图像 
一个单词构造WordCloud
在这个代码中,我们需要安装一个numpy库
(大部分小伙伴应该都装过,就不用再装了)
pip install numpy 
这里用这个库,主要是想用数学坐标生成一个简单的背景图案,比如圆形、方形
Python数据可视化:WordCloud入门(大伙都在用)
基本步骤
输入单词
用numpy 生成一个形状,下面生成了一个圆形mask
输入WordCloud的参数(包括背景色、是否重复、图案形状)
用matplotlib显示图片
import numpy as np 
import matplotlib.pyplot as plt 
from wordcloud import WordCloud 
text = "square" #输入你要的单词 
x, y = np.ogrid[:300, :300] #快速产生一对数组 
# 产生一个以(150,150)为圆心,半径为130的圆形mask 
mask = (x - 150) ** 2 + (y - 150) ** 2 > 130 ** 2 #此时mask是bool型 
mask = 255 * mask.astype(int) #变量类型转换为int型 
wc = WordCloud( 
 background_color="white", #背景颜色为“白色” 
 repeat=True, #单词可以重复 
 mask=mask #指定形状,就是刚刚生成的圆形 
 ) 
wc.generate(text) #从文本生成wordcloud 
plt.axis("off") #把作图的坐标轴关掉 
plt.imshow(wc, interpolation="bilinear") 
plt.show() 
生成WordCloud
最简单的生成方式,文本内容都是英文,直接用系统默认的形状(一个长方形)
我这边是导入了一个商务英语的txt,所以可以看到,出现次数最多的单词是company,然后是business、new、work等单词,我还看到了money,哈哈~
Python数据可视化:WordCloud入门(大伙都在用)
基本步骤
获取内容txt的路径
输入WordCloud的参数(包括背景色、字号等)
生成WordCloud
用matplotlib显示图片
*WordCloud有很多参数,如果你不写,都是默认的。比如背景色默认黑色。

(编辑:揭阳站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读