1.技术型科普书,属于情感分析方向零基础入门读物;
2.全书语言文字简洁易懂,对初学者友好;
3.本书作者是清华大学人工智能方向老师,有非常强的专业能力;
4.本书理论与实践结合,但尽量避免了烦琐公式。
第1章 语挚情长路漫漫 001
1.1 文中自有真情在 002
1.1.1 问世间情为何物 002
1.1.2 触景文下留真情 004
1.2 NLP来相助 008
1.2.1 什么是NLP 008
1.2.2 NLP主要应用领域 012
1.3 情感即分类 015
1.3.1 情感分析的对象与方法 015
1.3.2 情感分析的主要应用 017
第2章 情感词典查情断意 019
2.1 分词与词典 020
2.1.1 分词,情感分析第一步 020
2.1.2 词典,让AI长知识 026
2.2 只有“情感”行不行 028
2.2.1 情感词典的建立 028
2.2.2 词典的扩充 031
2.3 基于情感词典的案例 034
第3章 玩转文本大数据 039
3.1 数据的获取 040
3.1.1 网络爬虫 040
3.1.2 简单爬虫案例 040
3.2 数据的清洗与整理 045
3.2.1 去除停用词 046
3.2.2 词性标注 054
3.3 词频与词云 055
3.3.1 词频统计 055
3.3.2 关键词统计 057
3.3.3 词云 059
3.4 词袋模型 063
3.4.1 词袋模型概念 063
3.4.2 简单词袋模型案例 065
3.4.3 改进词汇表 067
3.4.4 词袋模型显示频率 071
3.4.5 词袋模型的局限性 072
第4章 机器学习洞察句情 073
4.1 机器学习概述 074
4.1.1 什么是机器学习 074
4.1.2 机器学习与情感分析 077
4.1.3 词袋模型数据生成 081
4.2 朴素贝叶斯与情感分析 086
4.2.1 贝叶斯vs频率 086
4.2.2 朴素贝叶斯原理实践 087
4.3 二项逻辑回归与情感分析 097
4.3.1 逻辑回归原理 097
4.3.2 逻辑回归算法 100
第5章 神经网络触景悉情 102
5.1 神经网络工作原理 103
5.1.1 神经网络概述 103
5.1.2 前向与反向传播 104
5.1.3 其他参数 107
5.2 激活函数与损失函数 109
5.2.1 非线性的激活函数 109
5.2.2 衡量优劣的损失函数 115
5.3 神经网络的分类与情感分析 117
第6章 向量构筑语义空间 121
6.1 另辟蹊径分布表示 122
6.1.1 语料库 122
6.1.2 分布式假说 123
6.2 从NPLM到Word2Vec 126
6.2.1 NPLM模型 126
6.2.2 Word2Vec 128
6.3 Word2Vec实践 134
6.3.1 “女人-男人=王后-国王”的三国解读 134
6.3.2 词汇的星空 140
第7章 深情厚意咬文嚼字 145
7.1 循环神经网络 146
7.1.1 循环神经网络原理 146
7.1.2 循环神经网络实践 148
7.2 LSTM 151
7.2.1 LSTM基本原理 151
7.2.2 非礼勿记、非礼勿听、非礼勿言 153
7.3 循环神经网络与情感分析 157
附录 160
附录一 PyTorch入门 161
附录二 概率基础 168
附录三 腾讯扣叮Python实验室:Jupyter Lab使用说明 181
温馨提示:请使用泸西县图书馆的读者帐号和密码进行登录