本书为没有专门学过计算机软件编程但又要经常做数据分析的读者所编写. 目的是让人们学会用 Python 编程处理各种数据课题, 而不是成为编写完美程序的编程专家. 本书的 对象群体包括涉及统计或其延伸领域 (比如计量经济等) 的师生及做数据分析的任何领域的实际工作者。
编程语言是数据科学最重要的工具, 难以想象一个数据科学工作者不懂编程语言. 我们 在学习数据科学各方面内容的同时, 通过处理数据来学习编程语言, 而不是在专门的编程课上学习. 学习编程的方式主要是自学. 我们需要的是泛型编程能力, 而不是学习一两种 语言本身. 编程不是目的, 编程是为数据科学服务的. 最好在完成一项又一项目标中学习编程, 而不是按照手册一个功能一个功能地死记硬背. 本书是以目标导向的编程训练方式, 引导读者在使用软件完成任务过程中学会编程. 当然, 我们的目标是数据分析而不是诸如漫游、动画、生成网页等其他实践, 因此, 这里的训练内容也是基于数据处理及相关画图的需要. 我们的训练是从简单的数字及逻辑运算、线性 代数运算到机器学习模型拟合的由简入繁、循序渐进的过程。
展开