第1章统计调查的数据质量及控制 1
1.1统计调查2
1.2统计数据质量的含义3
1.3统计调查数据质量的控制4
1.4科学研究和技术服务业非企业单位科技统计调查及质量控制6
1.4.1统计体系及制度7
1.4.2标准、规范及方法与技术8
1.4.3统计调查过程的数据质量控制8
第2章统计调查的误差10
2.1统计调查误差的计量11
2.2个体数据计量误差模型13
2.3统计调查误差的分解15
2.3.1按误差变异性的分解15
2.3.2按变量统计分布的分解19
2.4统计调查误差的来源及控制21
2.4.1误差的来源21
2.4.2误差的控制24
第3章统计调查数据的审核与评估28
3.1数据审核与评估的重要性及范围29
3.1.1审核与评估的重要性29
3.1.2审核与评估的范围29
3.2数据审核与评估的常用方法30
3.2.1审核与评估常用方法简述30
3.2.2审核与评估的操作方法33
3.2.3按使用信息的方法分类34
3.3数据审核与评估的总体方案34
3.3.1审核与评估的任务与内容34
3.3.2识别错误数据的思路36
3.3.3审核与评估的方法体系39
3.4样本个体数据的审核42
3.4.1审核的具体内容42
3.4.2数据缺失的识别42
3.4.3属性标志数据误差的识别43
3.4.4数量标志数据系统误差的识别44
3.4.5数量标志数据随机误差的识别45
3.4.6审核规则46
3.5统计调查数据的评估46
3.5.1评估的内容46
3.5.2代表性误差及抽样误差评估47
3.5.3随机性差异评估48
3.5.4系统性差异评估48
3.6质量评估与监控分析49
3.6.1统计数据生产的质量监控49
3.6.2质量评估49
3.6.3监控分析50
3.7数据审核与评估的流程51
3.8数据误差的处理53
3.8.1交互式处理54
3.8.2统计估计插补54
第4章逻辑平衡错误的审核57
4.1变量的逻辑平衡关系58
4.1.1逻辑平衡关系58
4.1.2数量变量的逻辑平衡关系58
4.1.3属性变量的逻辑平衡关系60
4.1.4属性变量与数量变量交叉逻辑平衡关系61
4.2逻辑平衡审核规则设计61
4.2.1设计原则62
4.2.2审核规则的设置63
4.3逻辑平衡审核规则的测试与数据审核65
4.3.1逻辑平衡审核规则的测试65
4.3.2基于逻辑平衡审核规则的数据审核66
第5章基于专家系统的属性标志数据审核67
5.1概述68
5.2审核属性标志的基本思路69
5.3语句中词的识别73
5.3.1分词的基本方法73
5.3.2常用分词的工具74
5.4关键词的识别76
5.4.1关键词抽取的方法76
5.4.2基于属性标志检查的关键词抽取方法77
5.5基于关键词的属性标志数据审核方法78
5.6编码解释表的制作方法82
第6章统计调查数据随机性差异的评估86
6.1社会经济现象的统计分布规律87
6.1.1正态分布87
6.1.2幂律分布、帕累托分布、Zipf分布89
6.1.3对数正态分布92
6.1.4指数分布与威布尔分布95
6.2统计分布的检验96
6.2.1图形观察法96
6.2.2χ2检验98
6.2.3KS及LF检验99
6.2.4CVM检验及AD检验方法100
6.3统计调查数据随机性差异评估方法的应用实践101
6.3.1评估对象101
6.3.2设置检验假设102
6.3.3统计分布检验107
6.3.4检验结果的分析107
第7章基于统计分布检验的异常数据识别112
7.1基本概念与思路113
7.1.1异常数据、极值点和污染点113
7.1.2异常数据的特征和起源115
7.1.3异常数据的识别116
7.2单变量异常数据识别117
7.2.13σ检验法117
7.2.2格拉布斯检验法118
7.2.3数学期望和均方差的鲁棒估计方法119
7.2.4箱形图方法121
7.2.5指数分布的异常数据识别122
7.2.6威布尔分布的异常数据识别123
7.3多变量异常数据识别126
7.3.1多变量数据中的异常点126
7.3.2多变量异常数据马氏距离检测法127
7.3.3多变量异常数据识别的鲁棒方法128
7.4统计分布检验和数据变换129
7.4.1统计分布检验129
7.4.2数据变换130
第8章样本数据的异常点审核133
8.1样本数据审核的对象与方法134
8.1.1审核对象与调查表数量标志的结构134
8.1.2审核的依据与方法135
8.2异常数据审核的指标分析法136
8.2.1时间变化的稳定性136
8.2.2相关数量标志比值的稳定性137
8.2.3结构间的相似性137
8.3异常数据审核的统计分布检验方法138
8.3.1一维数据审核138
8.3.2基于比值检验的数据审核139
8.3.3二维数据审核144
8.4异常数据审核规则的设计及异常数据审核145
8.4.1设计原则145
8.4.2审核规则的设置146
8.4.3异常数据审核149
8.5异常数据识别的功效分析150
8.5.1异常数据识别的功效150
8.5.2比值检验识别异常数据的功效分析150
8.5.3二维变量异常数据识别的功效分析151
8.6统计调查样本数据异常点审核方法的应用实践152
8.6.1审核的对象与思路152
8.6.2审核指标设置及审核规则153
8.6.3异常数据审核155
第9章基于图形审核的异常数据识别156
9.1图形审核157
9.2单变量异常数据的图形审核158
9.2.1单变量统计分布的图形观测与分析158
9.2.2单变量异常数据的显示与识别162
9.3二维变量异常数据的图形审核165
9.3.1二维变量统计分布的图形观测与分析165
9.3.2二维变量异常数据的图形显示与识别169
第10章统计调查数据系统性差异的评估172
10.1评估的对象、内容与工作流程173
10.1.1评估的对象173
10.1.2评估的内容173
10.1.3评估的工作流程174
10.2数据异常性审核的指标评估法176
10.2.1增长趋势评估176
10.2.2指标关联评估177
10.2.3结构评估178
10.3评估规则的设计及评估操作179
10.3.1评估规则设计原则180
10.3.2评估规则的设置180
10.3.3评估审核的操作181
10.4异常总量数据的追踪检查182
10.4.1追踪检查的方法182
10.4.2评估函数182
10.5统计调查数据系统性差异评估方法的应用实践184
10.5.1评估的主要思路184
10.5.2评估的对象、内容及方法185
10.5.3评估表187
第11章基于审核与评估信息的质量监控189
11.1数据审核与评估及统计数据生产的质量监控190
11.2来源数据审核与评估的信息191
11.2.1样本数据的审核信息191
11.2.2统计数据的评估信息193
11.2.3审核信息的获取194
11.3基于数据审核与评估信息的质量指标194
11.3.1来自样本数据的质量指标195
11.3.2来自总量数据的质量指标198
11.4质量指标的比较分析200
11.4.1总体分析201
11.4.2同一调查不同年度间质量指标对比分析202
11.4.3不同统计标志质量指标对比分析203
11.4.4不同类型个体的质量指标对比分析204
第12章统计数据审核与评估方法的应用实践206
12.1统计数据审核与评估的工作流程207
12.2填报阶段的数据审核208
12.2.1数据平衡检查208
12.2.2课题某些属性标志辅助人工审核214
12.3验收阶段的数据审核与评估218
12.3.1调查表回收情况核实218
12.3.2未通过数据平衡检查的原因审核219
12.3.3数据奇异点审核220
12.3.4总量数据评估224
第13章概率论与数理统计基本知识236
13.1概率、随机变量与概率分布237
13.1.1随机事件、频率和概率237
13.1.2概率的基本运算238
13.1.3随机变量与概率分布240
13.1.4随机变量的数字特征243
13.2数理统计的基本概念245
13.2.1统计总体、个体、统计调查与样本245
13.2.2统计标志、统计指标和变量246
13.2.3样本统计量247
13.2.4样本累积分布函数、频数(率)分布图和累积频数(率)分布图250
13.3几种重要的随机变量分布252
13.3.1正态分布252
13.3.2对数正态分布254
13.3.3帕累托(Pareto)分布255
13.3.4负指数分布256
13.3.5威布尔分布257
13.3.6χ2分布258
13.3.7t分布259
13.3.8F分布260
13.4假设检验261
13.4.1假设检验的基本依据261
13.4.2基本方法263
参考文献265
展开