浅谈 | 大数据时代的视界

2016-01-05 13:01 来源:数邦客
浏览量: 收藏:0 分享

  数据可视化起源于1960s计算机图形学,人们使用计算机创建图形图表,可视化提取出来的数据,将数据的各种属性和变量呈现出来。

  随着计算机硬件的发展,人们创建更复杂规模更大的数字模型,发展了数据采集设备和数据保存设备。同理也需要更高级的计算机图形学技术及方法来创建这些规模庞大的数据集。随着数据可视化平台的拓展,应用领域的增加,表现形式的不断变化,以及增加了诸如实时动态效果、用户交互使用等,数据可视化像所有新兴概念一样边界不断扩大。

  整体而言:可视化就是数据、信息以及科学等等多个领域图示化技术的统称。其中,数据可视化Data Visualization和信息可视化Info-graphics是两个相近的专业领域名词。

  狭义上的数字可视化指的是将数据用统计图表方式呈现。比如:电商数据可视化,实现了成熟的科学可视化领域与较年轻的信息可视化领域的统一。通过视觉化方式,快速抓住要点信息。

  另外,电商数据通过视觉化呈现数据,也揭示了令人惊奇的模式和观察结果,是不可能通过简单统计就能显而易见看到的模式和结论。

  而信息图形(信息可视化)则是将非数字的信息进行可视化。前者用于传递信息,后者用于表现抽象或复杂的概念、技术和信息。

  广义上数据可视化是信息可视化其中一类,因为信息是包含了:数字和非数字的。从原词的解释来讲:数据可视化重点突出的是"可视化",而信息可视化则重点是"图示化"。简单理解就是:把人类看不见的事物、现象等用人类能看见的方式把它表现出来。

  大数据可视化技术包含以下几个基本概念:



  ①数据空间:是由n维属性和m个元素组成的数据集所构成的多维信息空间;

  ②数据开发:是指利用一定的算法和工具对数据进行定量的推演和计算;

  ③数据分析:指对多维数据进行切片、块、旋转等动作剖析数据,从而能多角度多侧面观察数据;

  ④数据可视化:是指将大型数据集中的数据以图形图像形式表示,并利用数据分析和开发工具发现其中未知信息的处理过程。而数据可视化技术的基本思想,是将数据库中每一个数据项作为单个图元元素表示,大量的数据集构成数据图像,同时将数据的各个属性值以多维数据的形式表示,可以从不同的维度观察数据,从而对数据进行更深入的观察和分析。

  当然,关于数据可视化的适用范围,存在着不同的划分方法。一个常见的关注焦点就是信息的呈现。迈克尔·弗兰德利(2008),提出了数据可视化的两个主要的组成部分:统计图形和主题图。《Data Visualization: Modern Approaches》(意为"数据可视化:现代方法")(2007),概括阐述了数据可视化的下列主题

  1思维导图


  又叫心智图,一种将放射性思考具体化的方法,也是表达发射性思维的有效的图形思维工具 。

  2新闻展示


  基于treemap树状图的算法,适合表现大量信息聚合的News Map。

  3数据展示


  heatmap:热力型地图,做用户体验分析的同学会比较熟悉,是一种使用冷暖色来映射二维变量,以便于做出聚类分析的图像,擅长用于体现频率、密度等。下面这张信息图形使用的是气泡型地图。反映的是wiki百科中争议性词条的修订次数。圆圈越大,修订次数越多。排名前几位的是:耶稣、阿道夫希特勒、2003年10月、任天堂革命、卡特里娜飓风……)

  4显示关联


  我们尝试创造一个能够按照某些定义好的规则来自动生成的系统。

  5文章的显示


  那些通过网页的小缩略图像挖矿一样查找信息的时代一去不返了

  所有这些主题全都与图形设计和信息表达密切相关,也浓缩了大数据时代带给人们的视觉冲击。


标签:

责任编辑:admin
在线客服