回到主页
回到主页

数据可视化之美

· 数据可视化资讯

随着大数据时代的来临,传统的统计图表很难对复杂数据进行直观地展示。这几年数据可视化作为一个新研究领域也变得越来越火。成功的可视化,如果做得漂亮,虽表面简单却富含深意,可以让观测者一眼就能洞察事实并产生新的理解。可视化(visualization)和可视效果(visual)两个词是等价的,表示所有结构化的信息表现方式,包括图形、图表、示意图、地图、故事情节图以及不是很正式的结构化插图。

基本的可视化展现方式,如条形图、折线图、饼图、雷达图可以很容易通过各种软件(如Excel)容易生成,这些方法是常见可视化问题的良好且强大的解决方案。然而,使用这些方法的最佳方式局限于一些特定的数据类型,而且其标准型和普遍性意味着它们基本无法达到新颖性。如果对地理空间数据、社会网络关系、多维数据进行可视化,直观地传递数据期望表达的信息是需要特定的图表类型来展示。


让我们一起来看几个经典的可视化,观测它们是如何充分利用其源数据结构的。

1.“美国大选”数据可视化


在美国大选期间,美国媒体做了不少与之相关的数据报道,让我们来回顾一下,他们是如何将美国大选的数据可视化的吧!


下图为各洲“选举人票”的占比情况。作者设计了两种表现方法,一是以“选举人票”的分布做为底图,一是直接以美国地图作为底图。除此图上方双方选举人票总体数量对比外,鼠标移至各洲上方还能显示各洲“选举人票”数量及对希拉里与特朗普的支持比例。

美国大选可视化

关于第三方选举人影响的情况(在只有两种选择和有四个选举人的情况下,选民的态度又是怎样呢?)

第三方选举人数据可视化

特朗普的粉丝更多的是公立学校出身,而希拉里的则大都为精英阶层。希拉里的粉丝大都较为“书生气”,使用与书籍相关的词汇,其中有很多被认证为教授或博士;而特朗普的粉丝更加喜欢流行文化,他们可能同时是流行歌手的粉丝,也更加关注球类运动等。

2. 地理信息可视化

在第一个例子中,我们已经见识到了地理信息可视化的魅力。接下来我们简单了解下如何利用Remap包快速绘制可交互的地图数据可视化。目前托管在github

百度迁徙图是近年来非常流行的一种地理信息可视化,可以通过连线动态查看人口流向。此处给大家绘制一幅动态航班图的地理信息可视化图

人口流向示意图

也可以利用Remap快速实现未来天气预报。

broken image

3. 社会关系可视化

社会网络分析(SocialNetwrok Analysis,SNA)是在传统的图与网络的理论之上对社会网络数据进行分析的方法。随着人类进入了移动互联网时代,社会网络数据成了重要的数据资源。SNA的本质是利用各样本间的关系来分析整体样本的群落现象,并分析样本点在群落形成中的作用以及群落间的关系。

近几年手机端网游越来越重视游戏用户社交性设计。这款游戏的玩法设计特别强调强社交性:用户可以在游戏内组建家族,家族成员有不同的职务等级,用户也可以在游戏内给好友赠送道具。我们从数据库中收集抽取了部分用户的家族数据(Nodes)和好友沟通数据(Links)。其中Nodes数据集包括Id(用户ID)、Label(用户名称)、Group(所属家族)、Level(等级)的信息;Links数据集包括Source(发起方)、Target(接收方)和Weight(斗气数量)信息。

最后,复杂高维数据无法用单一的静态图表进行直观地展示,因此需要借助可视化手段让数据动起来,更好地发现数据价值。比如说有不同组别的数据,我们想查看各组别间的数据和总计时,此时就可以通过交互式探索的形式进行展示。

还可以结合自己掌握的数据分析和可视化技术,搭建数据可视化平台,从而实现智能BI的可视化功能。比如说,我们不需要具备开发能力,利用R工具的shiny包可以快速搭建数据可视化原型。下面这个例子就是一个通过shiny包结合可视化技术实现的一个可视化平台。

上一篇
人工智能会替代人类工作吗?
下一篇
艾科思移动BI零售业数据预测分析指南
 回到主页
strikingly icon上线了提供技术支持
Cookie的使用
我们使用cookie来改善浏览体验、保证安全性和数据收集。一旦点击接受,就表示你接受这些用于广告和分析的cookie。你可以随时更改你的cookie设置。 了解更多
全部接受
设置
全部拒绝
Cookie设置
必要的Cookies
这些cookies支持诸如安全性、网络管理和可访问性等核心功能。这些cookies无法关闭。
分析性Cookies
这些cookies帮助我们更好地了解访问者与我们网站的互动情况,并帮助我们发现错误。
首选项Cookies
这些cookies允许网站记住你的选择,以提供更好的功能和个性化支持。
保存