自序:在麻瓜和魔法师之间做出选择
Part 1 大数据时代,用数据说话
01 从万物皆数到万事皆数
主动或被动,我们都是数据贡献者
一切都被记录,一切都被分析
四大方面,让数据指数级增长
02 从十数九表到数态万千
结构化数据
非结构化数据
03 从隔水相望到阡陌交通
地点数据
个人数据
数据与数据,1+1远大于
大数据创新实践
用购买记录给用户画像
04 大数据和云计算驱动新工业革命
计算:第三次工业革命中的新能源
数据:第三次工业革命中的新材料
证析:第三次工业革命中的先进工艺技术
个性化:大数据时代最显著的商业特征
大数据创新实践
一张失败的公交卡
个性化医疗,安吉丽娜·朱莉和史蒂夫·乔布斯
Part 2 大数据1.0:分析
05 统计呈现洞见
抓出非法的MCC套用
打击“电老鼠”
“抓获”过度医疗和骗保行为
识别社交网络中的垃圾用户
新浪微博面临的三大问题
快递员的通话记录蕴藏哪些商机
付费节目点播最多的是什么
06 关联蕴含价值
关联规则挖掘
协同过滤
关联分析是寻找因果关系的利器
大数据创新实践
谁最关注超声波洁面产品
发现“一月三电号”僵尸用户
07 预测指导决策
点击购买类预测
基于移动轨迹的位置预测
链路预测
大数据预测的主流方法是什么
大数据创新实践
一张信用卡逾期不还款的概率有多大
签到记录预测用户的土著化指数
Part 3 大数据2.0:外化
08 寻求外部数据的帮助
从行为数据预测学生考试成绩
从食堂打卡记录中“定位”孤独人群
从社会计量标牌洞察人力资源管理
预测离职率和升职率
行为数据让非法集资无所遁行
09 自身数据的外部价值
45个关键词实时预测流感趋势
阿里巴巴的“淘CPI”指数
10 机器学习,数据外化最神奇的利器
机器学习三板斧1:特征
机器学习三板斧2:模型
机器学习三板斧3:融合
Part 4 大数据3.0:集成
11 交易市场:数据资源的汇聚地
科研数据共享
政府数据开放
全国可流通数据的目录体系
12 数据城堡:数据人才的竞技场
Kaggle,数据科学之家
数据城堡,Kaggle模式的中国尝试者
13 创新工厂:数据技术的嘉年华
大数据创业公司困境
大型传统企业信息化的难题
构建大数据挖掘平台
建设大数据创新工厂
结束语 成为大数据企业
致谢
展开