鲜活的数据[美] Nathan Yau作者简介、书籍目录、内容摘要、编辑推荐
在生活中,数据几乎无处不在,任我们取用。然而,同样的数据给人的感觉可能会千差万别:或冰冷枯燥,让人望而生畏、百思不解其意;或生动有趣,让人一目了然、豁然开朗。为了达到后一种效果,我们需要采用一种特别的方式来展示数据,来解释、分析和应用它。这就是数据可视化技术。
Nathan
Yau是这一创新领域的先锋。在《鲜活的数据:数据可视化指南》中,他根据数据可视化的工作流程,先后介绍了如何获取数据,将数据格式化,用可视化工具(如R)生成图表,以及在图形编辑软件(如Illustrator)中修改以使图表达到最佳效果。本书介绍了数十种方法(如柱形图、饼图、折线图和散点图等),以创造性的视觉方式生动讲述了有关数据的故事。翻开本书,思维之门会豁然大开,你会发现有那么多样的手段去赋予数据全新的意义!
《鲜活的数据:数据可视化指南》主要内容包括:
学习如何用视觉化表示方式来呈现数据,让读者看到不一样的信息;
发现数据背后的故事;
探索不同的数据来源,确定有效的展示格式;
试验并对比不同的可视化工具;
寻找数据中的趋势和模式,并以适当的图表来展现它们;
设定明确的目标,并用其指引你的可视化过程。
作者简介
Nathan
Yau,加州大学洛杉矶分校统计学专业在读博士、超级数据迷,专注于数据可视化与个人数据收集。他曾在《纽约时报》、CNN、Mozilla和SyFy工作过,认为数据和信息图不仅适用于分析,用来讲述与数据有关的故事也非常合适。Yau的目标是让非专业人士读懂并用好数据。你可以从中欣赏到他最新的数据可视化实验作品。
向怡宁,交互和视觉设计师、摇滚乐手,同时还热衷于翻译和写作。著有《Flash组件、游戏、SWF加解密》及《就这么简单:Web开发中的可用性和用户体验》,译有《奇思妙想:15位计算机天才及其重大发现》、《瞬间之美:Web界面设计如何让用户心动》、《网站设计解构:有效的交互设计框架和模式》、《网站搜索设计:兼顾SEO及可用性的网站设计心得》等书。他认为“一个不会弹吉他的设计师不是个好译者”。
书籍目录
第1章 用数据讲故事
1.1 不只是数字
1.1.1 新闻报道
1.1.2 艺术
1.1.3 娱乐
1.1.4 引人注目
1.2 我们要寻求什么
1.2.1 模式
1.2.2 相互关系
1.2.3 有问题的数据
1.3 设计
1.3.1 解释编码
1.3.2 标注坐标轴
1.3.3 确保几何上的正确性
1.3.4 提供数据来源
1.3.5 考虑你的受众
1.4 小结
第2章 处理数据
2.1 收集数据
2.1.1 由他人提供
2.1.2 寻找数据源
2.1.3 自动搜集数据
2.2 设置数据的格式
2.2.1 数据格式
2.2.2 格式化工具
2.2.3 用代码来格式化
2.3 小结
第3章 选择可视化工具
3.1 开箱即用的可视化工具
3.1.1 可选项
3.1.2 取舍
3.2 编程工具
3.2.1 可选项
3.2.2 取舍
3.3 绘图软件
3.3.1 可选项
3.3.2 取舍
3.4 地图绘制工具
3.4.1 可选项
3.4.2 取舍
3.5 衡量各种可选项
3.6 小结
第4章 有关时间趋势的可视化
4.1 在时间中寻求什么
4.2 时间中的离散点
4.2.1 柱形
4.2.2 柱形的堆叠
4.2.3 圆点
4.3 延续性数据
4.3.1 点与点相连
4.3.2 一步一个台阶
4.3.3 平滑和估算
4.4 小结
第5章 有关比例的可视化
5.1 在比例中寻求什么
5.2 整体中的各个部分
5.2.1 饼图
5.2.2 面包圈图
5.2.3 比例中的堆叠
5.2.4 层级和矩形
5.3 带时间属性的比例
5.3.1 堆叠的延续
5.3.2 逐点详述
5.4 小结
第6章 有关关系的可视化
6.1 在关系中寻求什么
6.2 关联性
6.2.1 更多的圆点
6.2.2 探索更多的变量
6.2.3 气泡
6.3 分布
6.3.1 老式的分布图表
6.3.2 有关分布的柱形
6.3.3 延续性的密度
6.4 对照和比较
6.5 小结
第7章 发现差异
7.1 在差异中寻求什么
7.2 在多个变量间比较
7.2.1 热身
7.2.2 相面术
7.2.3 星光灿烂
7.2.4 平行前进
7.3 减少维度
7.4 寻找异常值
7.5 小结
第8章 有关空间关系的可视化
8.1 在空间中寻求什么
8.2 具体位置
8.2.1 找到纬度和经度
8.2.2 单纯的点
8.2.3 有大有小的点
8.3 地区
8.4 跨越空间和时间
8.4.1 系列组图
8.4.2 抓住差额
8.4.3 动画
8.5 小结
第9章 有目的地设计
9.1 让自己作好准备
9.2 让读者作好准备
9.3 视觉提示
9.4 好的可视化
9.5 小结
章节摘录
版权页: 插图: 1.带分隔符的文本 很多人都很熟悉带分隔符的文本。我们在前面一节的例子中就创建过以逗号分隔的文本文件。如果把数据集看成是按行和列来分布,那么分隔符文本就是用分隔符来分开每一列。分隔符一般用的是英文逗号(半角字符),也可以是制表符tab,或者是空格、英文分号、冒号、斜杠等任何你喜欢的字符。不过逗号和tab是最常见的。 分隔符文本应用广泛,可以被大多数电子表格程序阅读,例如Excel或者Google Documents。我们也可以把电子表格输出成分隔符文本。如果你要使用多个工作表格,通常就会有多个分隔符文件,除非特殊指定。 这种格式也便于与其他人共享,因为它无需依赖于任何特定程序。 2.JavaScript对象表示法(JSON) 很多网页API都适用于这种格式。它既能够让计算机理解,又便于人类阅读。不过如果你眼前的数据过多,盯太久可能会头晕目眩。该格式基于JavaScript表示法,但并不依赖于这种语言。JSON中有许多规格说明,但只用掌握一些基础就能满足大部分需要。 JSON利用关键字和值,并且把数据条目作为对象来处理。如果我们把JSON数据转化成逗号分隔数据(Comma-Separated Value,CSV),那么每个对象都会占一行。 大家将会在后文中看到,有很多应用、语言和函数库都支持JSON输入。如果你打算设计便于互联网传播的数据图形,就得了解一下这种格式。 访问http:∕∕json.org阅读JSON的完整说明。你不必了解这一格式的所有细节,但当你需要使用某个JSON数据源时,它还是很管用的。 3.XML XML(可扩展标记语言)是另一种互联网上的流行格式,常被用于在API间传递数据。XML分为很多类型,规格说明也不少,但从最基本的层面来看,它就是一个文本文件,其中的值都封闭在各种标签之内。
媒体关注与评论
本书就像是一封写给Python、R、地图和数据的情书。——FlowingData读者评论我是Nathan Yau的博客FlowingDate的忠实粉丝,本书还没出来我就预定了。果然,它完全符合我的预期:各种各样的分析、数据资源和绝对精美的图表。——亚马逊读者评论本书写的很好,思路清晰,实例丰富,如果你经常与数据打交道,选择本书错不了。——亚马逊读者评论
编辑推荐
数据可视化经典著作 讲解清晰、示例丰富、实用性强 创作信息图的最佳参考指南
名人推荐
“本书就像是一封写给Python、R、地图和数据的情书。” --FlowingData读者评论 “我是Nathan Yan的博客FlowingData的忠实粉丝,本书还没出来我就预订了。果然,它完全符合我的预期:各种各样的分析、数据资源和绝对精美的图表。” --亚马逊读者评论 “本书写得很好,思路清晰,实例丰富,如果你经常与数据打交道,选择本书错不了。” --亚马逊读者评论