本文标题是赵鹏加的。

这本书始于2007年,大概2010年左右就很流行了,但直到最近才写完。作者基于CC许可证发布,这就意味着14年内可以以任何非商业的方式自由传播,14年后甚至可以用于商业目的。老粉丝会熟悉这本书中很多过去的细节,结合新的内容,有一种时空错位的迷幻感。读完此书,第一感觉像是在读作者的自传,他的青涩少年、老成中年、淡薄老年时期全部跃然纸上。这本书除了不讲现代、不讲统计、不讲图形以外,基本上啥都讲。从拿破仑远征到福尔摩斯探案、从提灯女士到绝望主妇、从詹姆士到丘处机,让人深深地感受到了统计学家常见的恶趣味。书的结尾还引用了几句诗,作为湖北老乡我也常引用这个,也是大大特别喜欢的诗句:“人事有代谢,往来成古今。江山留胜迹,我辈复登临”。

为啥说这个书不讲现代呢?因为有些内容已经成了历史,作者也提到了现在流行的很多 ggplot2 的东西也没包含,他自己也调侃是“古代统计图形”,而且该书的历史部分太精彩,我写的一本书里就引用了很多。为啥说这个书不讲统计呢?因为作者常说“一图胜千言”,经常把复杂的统计道理蕴含在直观的图形中,比如介绍 LOWESS 时就没有任何数学推导但是用图展现了所有可能关系。为啥说这个书不讲图形呢?因为图形在作者的眼里只是一种把统计中的抽象概念具象化的手段,在这本书里面绘图是次要的,理解统计思想和灵活地应用数据才是重要的。不过里面的很多配图都非常精美,各种细节完全可以让强迫症汗颜。只是我接受不了其中一些单独成页的图,也反对作者无视现存排版规则的思想(虽然很多规则确实毫无必要)。

听说作者在写这本书的时候感觉没有好工具,导致进度太慢,于是自行开发了 knitr、bookdown,这两个工具现在已经成了主流,正在颠覆出版界的过程中,有了好工具在手,作者终于在十多年后写完了。从这本书里面,除了统计图形的应用与思想之外,我们还可以感受到文学化编程的魅力。文学化编程不是瞎扯淡的文字,也不是一块一块的代码,而是可以把程序颗粒如文字般自由组合,功力高的时候就看不出是写给人看的还是写给机器看的了,实现了人机合一、大自在、大圆满。在这本书里面,代码看上去不像例子而像普通的文字,文字也不像代码的注释而像真正的功能组成部分,已经超越了普通的人类语言。别的可视化书籍都是用文字来介绍图形,而这本书是用文字和图形共同介绍统计,是本难得的好书。

——李舰,统计之都成员、《统计之美》作者、九峰医疗首席数据科学家

重复使用

本文文字和图表使用知识共享许可协议 CC BY 4.0源文件采用 MIT 协议。

欢迎修订

如果您发现本文里含有任何错误(包括错别字和标点符号),欢迎在本站的 GitHub 项目里提交修订意见。

引用本文

如果您使用了本文的内容,请按照以下方式引用:

李舰 (2021). 时空迷幻. 现代统计图形. https://msg2020.pzhao.org/preface-li/

BibTeX citation

@misc{
  title = "时空迷幻",
  author = "李舰",
  year = "2021",
  journal = "现代统计图形",
  note = "https://msg2020.pzhao.org/preface-li/"
}

欢迎留言