第1章 绪论
1.1 背景
1.2 应用
第2章 预处理
2.1 非线性滤波器
2.1.1 中值滤波器和排序滤波器
2.1.2 形态滤波器
2.1.3 多项式滤波器
2.2 幅值变换
2.2.1 振幅映射特性
2.2.2 概率分布修正与均衡
2.3 插值
2.3.1 零阶和一阶插值基函数
2.3.2 LTI系统插值
2.3.3 样条插值、拉格朗日插值和多项式插值
2.3.4 二维网格上的插值
2.4 多分辨率表示
2.5 局部自适应滤波器
2.5.1 可控平滑滤波器
2.5.2 迭代平滑(扩散滤波器)
2.6 习题
第3章 信号和参数估计
3.1 期望值和概率描述
3.2 观测和退化模型
3.3 基于线性滤波器的估计
3.3.1 逆滤波器
3.3.2 维纳滤波器
3.4 最小二乘估计
3.5 奇异值分解
3.6 ML和MAP估计
3.7 参数估计与拟合
3.8 异常值的剔除
3.9 对应分析
3.10 状态建模与估计
3.10.1 马尔可夫过程和随机场
3.10.2 隐马尔可夫模型
3.10.3 卡尔曼滤波器
3.10.4 粒子滤波器
3.11 习题
第4章 多媒体信号特征
4.1 颜色
4.1.1 颜色空间变换
4.1.2 颜色特征表示
4.2 纹理
4.2.1 基于出现次数的纹理分析
4.2.2 基于统计模型的纹理分析
4.2.3 纹理的谱特征
4.2.4 非均匀纹理分析
4.3 边缘分析
4.3.1 基于梯度算子的边缘检测
4.3.2 基于二阶导数的边缘描述
4.3.3 边缘查找与一致性分析
4.3.4 边缘模型拟合
4.3.5 边缘属性描述与分析
4.4 显著特征检测
4.5 轮廓与形状分析
4.5.1 轮廓拟合
4.5.2 基于方向和曲率的轮廓描述
4.5.3 几何特征与二值形状特征
4.5.4 投影与几何映射
4.5.5 区域形状的矩分析
4.5.6 基于基函数的区域形状分析
4.6 运动分析
4.6.1 将3D运动在成像平面上进行投影
4.6.2 基于光流原理的运动估计
4.6.3 基于匹配的运动估计
4.6.4 非平移运动参数估计
4.6.5 物体边界运动向量场估计
4.7 视差与深度分析
4.7.1 共面立体视觉
4.7.2 对极几何
4.7.3 相机标定
4.8 音频信号特征
4.8.1 基于时间线的音频特征提取
4.8.2 时域特征
4.8.3 谱域特征
4.8.4 倒谱域特征
4.8.5 谐波特征
4.8.6 多通道特征
4.8.7 感知特征
4.8.8 语义特征
4.9 习题
第5章 特征变换与分类
5.1 特征值归一化与变换
5.1.1 特征值归一化
5.1.2 特征值集的特征向量分析
5.1.3 独立成分分析
5.1.4 非负矩阵分解
5.1.5 广义Hough变换
5.1.6 统计表示的推导
5.2 距离度量
5.2.1 向量距离度量
5.2.2 与集合比较相关的距离度量
5.2.3 概率分布的相似性
5.2.4 基于类先验知识的距离度量
5.3 特征数据的压缩表示
5.4 基于特征的比较
5.5 可靠性
5.5.1 可靠性准则
5.5.2 分类质量
5.6 分类方法
5.6.1 两类线性分类
5.6.2 线性分类的推广
5.6.3 最近邻分类
5.6.4 无先验知识的分类
5.6.5 最大后验(朴素贝叶斯)分类
5.6.6 人工神经网络
5.7 信念、似然和证据
5.8 习题
第6章 信号的分解
6.1 图像的空间域分割
6.1.1 基于样本分类的分割
6.1.2 基于区域的分割方法
6.1.3 基于轮廓的分割方法
6.1.4 基于“能量最小化”的分割
6.2 视频信号的分割
6.2.1 关键帧和镜头切换检测
6.2.2 背景差分分割
6.2.3 目标跟踪与时空分割
6.2.4 组合分割和运动估计
6.3 三维表面和体数据重建
6.3.1 三维点云生成
6.3.2 三维曲面重建
6.3.3 三维体数据重建
6.3.4 基于投影的三维形状描述
6.4 音频信号分解
6.4.1 音频时域分割
6.4.2 音频源分离
6.5 习题
第7章 信号合成、渲染与呈现
7.1 多媒体信号的合成与混合
7.2 马赛克和缝合
7.3 图像内容合成
7.4 扭曲与变形
7.5 虚拟视图合成
7.6 帧率变换
7.7 图像和视频信号的视图自适应体绘制
7.8 音频信号的合成与渲染
7.8.1 声音效果
7.8.2 空间(房间)特征
附录A 基本原理和定义
附录B 符号和变量
附录C 缩略语表
原著参考文献
展开