第1章 绪论
1.1 数字音视频基础
1.2 数字音视频技术的发展趋势
1.3 数字音视频系统的组成
1.4 本章小结
第2章 听视觉处理的脑机制
2.1 听觉的生理基础
2.1.1 听觉感知模型的国内外研究现状
2.1.2 人类听觉系统简介
2.1.3 听觉特性
2.1.4 听觉掩蔽
2.1.5 听觉加工理论
2.2 视觉的生理基础
2.2.1 研究现状
2.2.2 视觉感知
2.2.3 人类视觉系统概述
2.2.4 视觉注意机制
2.3 本章小结
第3章 数字音频技术基础
3.1 数字信号处理基础
3.1.1 线性和时不变
3.1.2 冲激响应和卷积
3.1.3 傅里叶变换、拉普拉斯变换和Z变换
3.1.4 离散时间傅里叶变换(DTFT)与离散傅里叶变换(DFT)
3.2 语音信号产生模型
3.2.1 语音信号产生机理
3.2.2 语音信号产生的数字模型
3.3 语音信号的时域模型
3.3.1 语音信号的预处理
3.3.2 短时平均能量
3.3.3 短时平均过零率
3.3.4 短时自相关函数
3.4 语音信号的频谱分析
3.4.1 短时傅里叶变换(STFT)的定义和物理意义
3.4.2 短时傅里叶变换的取样率
3.4.3 语音信号的重构
3.4.4 窗长及形状对STFT的影响
3.4.5 语音的语谱图分析
3.4.6 语音的倒谱
3.5 本章小结
第4章 音视频获取软件和方法
4.1 音频信号采集软件和方法
4.1.1 常见的音频采集设备的特点
4.1.2 音频采集软件Windows录音机
4.1.3 音频处理工具Sony Sound Forge
4.2 图像/视频信号采集工具和方法
4.2.1 图像信息采集技术
4.2.2 视频信息采集技术
4.3 音频/视频格式的转换
4.3.1 音频格式转换
展开