泸西县图书馆“U书快借”平台

编辑推荐

数据是有价值的，尤其在如今的大数据时代。拥有数据就是拥有不菲的资产，就像有了一座矿山一样。你或许有疑问，亦或变得更加好奇：从哪里获得数据？如何获得数据？

其实如果你仔细关注的话，每天从起床拿起手机开始到晚上睡觉前放下手机，你的各种点击记录就已经被记录在互联网上了。这些个人的点击记录汇聚在一起，就会成为海量的消费数据。

那么，我们如何获取数据并将其化为己用呢？

1.对于特定网站的已有数据，我们可用Excel简单爬取，对，就是我们常用的那个Excel。

2.不满足于简单爬取？没关系，我们有升级后的大爬虫——Python。

想迅速、合法地获取到想要的数据，做出完美的数据表？请阅读《网络爬虫进化论——从Excel爬虫到Python爬虫》

展开

内容介绍

本书主要通过对 Excel 爬虫和 Python 爬虫的对比，介绍使用 Excel 和Python 实现网络数据爬取的相关内容和方法。书中按照学习的递进层次分为基础篇、Excel 爬虫篇和 Python 爬虫篇三部分内容，基础篇包括网络爬虫基础、网页和网站基础、网页开发者工具和 Python 编程基础等内容，Excel 爬虫篇包括使用 Excel的 PowerQuery 模块实现网络表格数据采集和相关案例实践等内容，Python 爬虫篇包括网络爬虫初体验、各种第三方库的使用详解、Python 爬虫案例、Scrapy 框架和对比爬取福布斯榜单案例等内容。

本书结构紧凑、内容翔实、图文并茂、案例丰富，适合对网络数据爬取感兴趣的读者，对从事数据科学、大数据相关工程的技术人员也具有一定的参考价值。

展开