本书首先介绍数据科学,然后指导读者安装和搭建数据分析编程环境所需的软件包。在机器学习中,主要学习3 项技术:监督学习、无监督学习和强化学习,以及基本的分类与回归技术,如支持向量机、决策树以及逻辑回归等。
在前面章节的中,将学习Python语言中用于处理大型数据集的基本函数、数据结构,用于矩阵计算的NumPy包和Pandas包,如何使用Matplotlib绘制自定义图表,以及应用Boosting算法XGBoost(极端梯度提升)进行预测分析等。
在后面的章节中,将学习用于图像识别的卷积神经网络(CNN)、深度学习算法。读者将掌握如何向神经网络馈入人类语言、让模型处理复杂的文本信息以及构建人类语言处理系统进行结
果预测等。
本书通过实践操作的方式让初学者和经验丰富的数据科学家掌握数据科学与机器学习技术所需的基本工具。书中包含了59个实操训练项目+22个作业项目,这些实操性练习都是现实生活中的各种业务场景,可以让读者在高度相关联的环境中练习和应用新的技能。
学习完本书,读者可以掌握和使用很多新的数据科学算法,并且有信心使用本课程以外的工具或库进行操作。
本书首先介绍数据科学,然后指导读者安装和搭建数据分析编程环境所需的软件包。在机器 学习中,主要学习3项技术:监督学习、无监督学习和强化学习。我们也会用到基本的分类与回 归技术,如支持向量机、决策树以及逻辑回归等。 在前面章节的学习中,读者将学习到Python语言中用于处理大型数据集的基本函数、数据 结构,用于矩阵计算的NumPy包和Pandas包,如何使用Matplotlib绘制自定义图表,以及应用 Boosting算法XGBoost(极端梯度提升)进行预测分析等。 在后面的章节中,将会学习用于图像识别的卷积神经网络(CNN)、深度学习算法。读者将掌 握如何向神经网络馈入人类语言、让模型处理复杂的文本信息以及构建人类语言处理系统进行结 果预测等。 学习完本书,读者可以掌握和使用很多新的数据科学算法,并且有信心使用本课程以外的工 具或库进行操作。
温馨提示:请使用泸西县图书馆的读者帐号和密码进行登录