数据是有价值的,尤其在如今的大数据时代。拥有数据就是拥有不菲的资产,就像有了一座矿山一样。你或许有疑问,亦或变得更加好奇:从哪里获得数据?如何获得数据?
其实如果你仔细关注的话,每天从起床拿起手机开始到晚上睡觉前放下手机,你的各种点击记录就已经被记录在互联网上了。这些个人的点击记录汇聚在一起,就会成为海量的消费数据。
那么,我们如何获取数据并将其化为己用呢?
1.对于特定网站的已有数据,我们可用Excel简单爬取,对,就是我们常用的那个Excel。
2.不满足于简单爬取?没关系,我们有升级后的大爬虫——Python。
想迅速、合法地获取到想要的数据,做出完美的数据表?请阅读《网络爬虫进化论——从Excel爬虫到Python爬虫》
本书主要通过对 Excel 爬虫和 Python 爬虫的对比,介绍使用 Excel 和Python 实现网络数据爬取的相关内容和方法。书中按照学习的递进层次分为基础篇、Excel 爬虫篇和 Python 爬虫篇三部分内容,基础篇包括网络爬虫基础、网页和网站基础、网页开发者工具和 Python 编程基础等内容,Excel 爬虫篇包括使用 Excel的 PowerQuery 模块实现网络表格数据采集和相关案例实践等内容,Python 爬虫篇包括网络爬虫初体验、各种第三方库的使用详解、Python 爬虫案例、Scrapy 框架和对比爬取福布斯榜单案例等内容。
本书结构紧凑、内容翔实、图文并茂、案例丰富,适合对网络数据爬取感兴趣的读者,对从事数据科学、大数据相关工程的技术人员也具有一定的参考价值。
温馨提示:请使用泸西县图书馆的读者帐号和密码进行登录