数据可视化 到 可视化信息 浅述

~直觉式的阐述个人当前数据可视化世界观

datav2vinfo.png(PNG 图像,776x814 像素) -  Graphviz 生成

数据可视化(Data Visualization)突然热了,但是为什么?!

我们的湿件

对应电脑的硬件(hard ware)以及软件(soft ware), 我们的大脑就是种湿件(Wet ware) 具有更加深沉的内置规范/机制/原则... 而且无法随便升级的,只能经过大自然上亿年的进化,才能改进一丝丝 ;-(

推荐读物,刘未鹏 的思维改变生活 系列文章,其中 ""逃出你的肖申克(三):遇见20万年前的自己"",非常精要的指出了,面对信息大潮的我们可怜的湿件各种不适应;-(

虽然,湿件本身具有这个宇宙可能最高的可动态扩展性, 但是其扩展只能通过湿件自身的努力,暂时还没有什么标准件可以即插即用式的扩展每一个湿件的能力 ; 所以,对于我们绝大多数人,只能先迁就湿件的品性,不论是否愿意.

7±2 原则

是认知科学中最基础的定理之一. 大意就是,由于人类大脑处理信息的能力有限,它会将复杂信息划分成块和小的单元. 根据乔治A米勒(George A. Miller)的研究,人类短期记忆一般一次只能记住5-9个事物.这一事实经常被用来作为限制导航菜单选项到7个的论据; 然而关于神奇的"7,加2或者减2"还是引起了激烈的讨论.

参考:[1] ; [2]

所以,在信息爆炸时代,怎么在同类的海量信息中,让受众,更加容易认同自个儿的, 就得尽量不违反 "7±2 原则"

万事无绝对!-)

首先,得明确,这儿的"信息"究竟是什么?! 其实: 消息/数据/信息/资料 等等概念,一般都是混的...

俺也不是专家,只能掉个书袋先: 信息论创始人,香农(Shannon)的信息定义:

越品越有意味的...

基本上,所有对于此类概念的描述所指,只是两种事物

参考:[3]

在信息学中指出信息构成是:

可见,信息不是可以简单物化的,是包含过程和受众的一种社会化行动的整体.

而其中,信息的传输至关重要,如果处理不当,再重要的信息,也可能被忽视/误解/曲解... 因为人类,天生是视觉生物! 同一信息通过声音/文字/图片/影像 的传递效率是完全不同的,可以相差上百倍!

一个经典案例:

图片来自: Charles Joseph Minard – Wikipedia, the free encyclopedia

是由Minard 绘制的地图,展现了 1812 年拿破仑的大军团进军俄国的路线(上半 部分)和撤退时的气温变化(下半部分). 这一历史事件中,法军数量的急剧减少 以及恶劣的气候条件一览无遗,法国科学家 Étienne-Jules Marey 称"该图所展现出 的雄辩对历史学家的笔是一种极大的挑战".

在单独一张图片中:

包含的信息远超过7±2个点,但是,所有看到图的一瞬间,就基本把握住了所有信息!

这就是信息图(infographics)的威力!

而信息图探索出来的各种可视化手法,被设计成各种工具/规范后,就被快速复用在各种场景中, 对大量数据进行高度浓缩式的展现!

可以简单,武断的认为,数据可视化:

数据可视化的宏观过程

个人体会,至少包含以下环节:

收集
 ^  `->整理
 |    ^   `->设计
 |    +-----/|^|
 +-----------/||
              | `->输出
              |     `->传达
              |         |
              +---------/

数据收集

要解决的问题有:

好在之于 web 应用领域,基本都早已有标准方案,老实用就好!

数据整理

每次可视化都是为了解决特定问题的,所以,面对海量以标准形式收集的数据, 怎么针对领域问题合理抽取对应的数据?要解决的问题有:

同样,在 web 应用领域,配合丰富的 Unix 小工具,以是分分钟的事儿; 不过,正则表达式一定要理解, Python/Perl/Ruby 脚本語言,怎么着都得掌握一个...

可视化设计

这个环节,个人以为是最吃功夫,也最考驗天赋的了,要解决的问题有:

最要命的是,所有问题,都要归结为一个单一形式来回应!而且有对应的工具可以进行生成!

个人以为,可视化设计,决定了数据可视化后的信息传达效果, 所以,这不应该是一錘子买卖,也是需要根据传达效果,以及对问题的不断理解, 掌握问题背后的真正领域需求,不料调整所有环节,改进,增强可视化效果的一个长期过程. 可视化输出

动用工具,合理的输出成合理的形式,要解决的问题有::

好吧,这步问题比较单纯,但是,面对日益丰富的可视化工具/服务,怎么选择,才能"长治久安"? 而且,现成的工具能力肯定是有限的,怎么合理组合,或是自行后期处理,增补, 得以更好的输出成吻合设计的形式!? 都是需要深入折腾的...

可视化传达

"酒香也怕巷子深",这道理之于数据可视化反而不存在, 为毛?!

只是,一但設計不良,没有在第一时宜打动受众,获得认同, 那就有一堆要解决的问题了:

同样,此阶段也会产生数据/信息,也需要立即反馈回設計阶段,加入改进的考虑因素.

谁应该学习/使用数据可视化?

好吧得承认,以上描述的都是理想状态中的数据可视化世界, 但是,多数情景中,数据从来不被人们真正认真对待的,,,

所以,即使身为数据分析师也在努吼:"数据是一种信仰"

我想,这恰恰是数据可视化的机会呢:

而且,现代城市生活,每个社会人每天每时每刻,都必须处理大量信息:

一个人尚且如此,一个团队?组织?企业?! 不过,对于企业,再好再漂亮的数据可视化输出,如果没有和具体的业务结合的话, 那是根本没有吸引力的哦.

随着信息技术的高速发展,我们对于社会生产活动的数据收集能力,越来越深入/神奇

是也乎


Author: Zoom.Quiet /mail / gittip / github