1)交付型解决方案。在有限的成本、资源、技术条件下,完成能够交付于实际生产的解决方案,而不再追求人工智能项目的完美方案。通常,同类图书总是在介绍如何搭建完美系统,而忽略了项目的效率和可实施性。
2)理念先进。引入了云服务器的概念,讲解如何利用Amazon、Google和Microsoft公司现有的强大云服务产品,构建各种实用的云端人工智能与机器学习系统。
3)案例丰富可操作。配备覆盖面极广的云端Python机器学习应用程序示例,使读者学会使用机器学习、人工智能和云计算工具。
4)实用性强。书中介绍的工作流程和案例涉及从部署到生产各个环节,清晰展现如何使用云提供商提供的现成解决方案进行业务开发。
5)易学、解释清晰。即使你没有坚实的数学、数据科学及人工智能背景知识,本书也能很好地引导你深入浅出地理解相关概念和各种工具。
本书讲解Amazon、Google和Microsoft公司的强大云服务产品,以及Python数据科学生态系统的成熟技术,所介绍的工作流程和案例涉及从部署到生产各个环节,通过使用当代机器学习、人工智能和云计算工具逐步构建多种云端机器学习应用程序(覆盖体育、项目管理、产品定价、房地产等领域中的实际问题),帮助你构建可扩展并能交付于生产的解决方案。
通过本书,你将能够:
快速查看构建机器学习应用程序所需的Python代码。
掌握人工智能和机器学习工具链以及项目生命周期。
使用Python数据科学工具,包括IPython、Pandas、NumPy、Juypter Notebook和scikit-learn。
结合实用高效的反馈回路不断提高工作流程和系统的效率。
使用Google云平台产品,包括TPU处理器、Colaboratory合作实验工具及Datalab服务。
定义AWS云AI工作流程,包括Spot实例、CodePipeline、Boto、无服务器、SageMaker等。
使用Microsoft Azure云AI API。
构建6个完整的交付型AI应用程序。
赞誉
译者序
前言
致谢
作者简介
第一部分 实用人工智能基础
第1章 实用人工智能简介
1.1 Python功能介绍
1.1.1 程序语句
1.1.2 字符串和字符串格式化
1.1.3 数字与算术运算
1.1.4 数据结构
1.1.5 函数
1.2 在Python中使用控制结构
1.2.1 for循环
1.2.2 while循环
1.2.3 if-else语句
1.2.4 生成器表达式
1.2.5 列表推导式
1.2.6 中级主题
1.3 进一步思考
第2章 人工智能与机器学习的工具链
2.1 Python数据科学生态系统:IPython、Pandas、NumPy、Jupyter tebook、scikit-learn
2.2 R语言、RStudio、Shiny和ggplot
2.3 电子表格:Ecel和Google表格
2.4 使用Amazon网络服务开发云端AI
2.5 AWS上的DevOps
2.5.1 持续交付
2.5.2 为AWS创建软件开发环境
2.5.3 集成Jupyter tebook
2.5.4 集成命令行工具
2.5.5 集成AWS CodePipeline
2.6 数据科学中的基本Docker容器设置
2.7 其他构建服务器:Jenkins、CircleCI、Codeship和Travis
2.8 小结
第3章 斯巴达式AI生命周期
3.1 实用生产反馈回路
3.2 AWS SageMaker
3.3 AWS Glue反馈回路
3.4 AWS批处理
3.5 基于Docker容器的反馈回路
3.6 小结
第二部分 云端人工智能
第4章 使用Google云平台开发云端AI
4.1 Google云平台概述
4.2 Colaboratory合作实验工具
4.3 Datalab数据处理工具
4.3.1 使用Docker和Google容器注册表扩展Datalab
4.3.2 使用Datalab启动强大的机器
4.4 BigQuery云数据仓库
4.5 Google云端AI服务
4.6 云端TPU和TensorFlow
4.7 小结
第5章 使用Amazon Web服务开发云端AI
5.1 在AWS上构建增强现实和虚拟现实解决方案
5.1.1 计算机视觉:带有EFS和Flask的AR/VR管道
5.1.2 带EFS、Flask和Pandas的数据工程管道
5.2 小结
第三部分 创建实际AI应用程序
第6章 预测社交媒体在NBA中的影响力
6.1 提出问题
6.2 收集具有挑战性的数据源
6.2.1 收集运动员的Wikipedia页面访问量
6.2.2 收集运动员的Twitter参与度
6.2.3 探索NBA运动员数据
6.3 NBA球员的无监督机器学习
6.3.1 使用R语言对NBA球员执行分面聚类绘图
6.3.2 汇总:球队、球员、影响力和广告代言
6.4 更多的实际进阶与学习
6.5 小结
第7章 使用AWS创建智能的Slack机器人
7.1 创建机器人
7.2 将库转换为命令行工具
7.3 使用AWS工作流服务将机器人提升到新水平
7.4 获取IAM证书设置
7.5 建立工作流
7.6 小结
第8章 从GitHub组织中寻找项目管理的思考
8.1 软件项目管理问题综述
8.2 开始创建数据科学项目框架
8.3 收集和转换数据
8.4 与GitHub组织交流
8.5 创建特定领域的统计信息
8.6 将数据科学项目连接到CLI客户端
8.7 使用Jupyter tebook探索GitHub组织
8.8 查看CPython项目中的文件元数据
8.9 查看CPython项目中的已删除文件
8.1 0 将项目部署到Python包索引库
8.1 1 小结
第9章 动态优化基于AWS的弹性计算云(EC2)实例
9.1 在AWS上运行作业
9.1.1 EC2 Spot实例
9.1.2 Spot实例理论和定价历史
9.1.3 编写Spot实例启动程序
9.1.4 编写更复杂的Spot实例启动程序
9.2 小结
第10章 房地产数据研究
10.1 美国房地产价值探索
10.2 Python中的交互式数据可视化
10.3 规模等级和价格聚类
10.4 小结
第11章 用户生成内容的生产环境AI
11.1 Netfli奖未在生产中实施
11.2 推荐系统的基本概念
11.3 在Python中使用Surprise框架
11.4 推荐系统的云解决方案
11.5 推荐系统的实际生产问题
11.6 云端自然语言处理和情绪分析
11.6.1 Azure上的NLP
11.6.2 GCP上的NLP
11.6.3 AWS上的生产型无服务器NLP AI管道
11.7 小结
附录A AI加速器
附录B 聚类大小的选择
温馨提示:请使用泸西县图书馆的读者帐号和密码进行登录
“本书是一部全面的指南,弥补了人工智能要做的事情和部署实际项目要解决的棘手问题之间的差距。它清晰、实用,远远不止介绍Python和AI算法。”
——Christopher Brousseau,企业人工智能平台Surface Owl创始人和CEO
“我对本书的喜爱、赞美之情难以形容,本书对于任何技术发烧友都是极好的补充资料!Noah Gift真正让本书成为一部实用指南,它适用于任何机器学习行业的人士。本书不仅解释了如何将机器学习应用于大型数据集,还对技术反馈回路提供了有价值的观点。本书将使许多数据科学与开发团队受益,让他们从一开始就能高效地创建和维护应用程序。”
——Nivas Durairaj,AWS技术客户经理(AWS注册专业架构师)
“如果你希望深入研究产品级品质的机器学习管道和工具,从而真正帮助你的数据工程、数据科学或数据开发运维团队,那么本书就是一本很好的读物。即使是经验丰富的开发人员,也常常会发现自己在低生产率的任务上浪费时间。通常,软件书籍和大学课堂并没有讲述投入生产所需的步骤。Noah在寻求软件部署的实用方法方面很有天赋,这些实用方法可以真正加快开发和交付过程。他专注并致力于实现非常独特的快速软件解决方案。
“建立产品级品质的机器学习管道的关键是自动化。工程师在研究阶段或原型阶段可以人工完成的任务及步骤必须自动化和规模化,以便创建生产系统。本书充满了实用且有趣的实践实例,它们将帮助Python开发人员实现自动化并将管道扩展到云端。
“我目前在一家在线房地产公司的Roofstock.com房地产平台上工作,主要工作涉及大数据、机器学习管道、Python、AWS、Google云和Azure,该平台分析数据库接近5亿条记录!我在本书中找到了很多实用技巧和实践实例,它们立即提升了我的工作效率。特此推荐本书!”
——Michael Vierling,房地产平台Roofstock.com首席工程师