第1章概述
数字信号处理器(DSP)是对数字信号进行高速实时处理的专用处理器,伴随着微电子技术的发展,数字信号处理芯片的运算能力和可靠性得到持续大幅度的提升。与模拟信号处理系统相比,以DSP为控制核心的全数字化控制系统具有精度高、抗扰能力强、尺寸小、重量轻、速度快、性能稳定和易于升级等优点,已基本取代了传统的模拟器件控制系统。尤其是进入21世纪以后,DSP技术得到了快速发展,主流DSP厂商都推出了多系列专用DSP芯片,也有的资料将其称为微控制器(microcontrolunit,MCU),实际上这两个概念的界限已经没那么明确了,都是用于数字控制的处理器,在当今数字化程度越来越高、数字化产品应用越来越广泛的时代,它们几乎无处不在。
1.1TI公司DSP系列产品的发展及应用
1.1.1TI公司简介
TI公司是全球领先的半导体公司,成立于1930年,其总部位于美国得克萨斯州的达拉斯,全球约有3万名员工,在亚洲、欧洲和美洲超过25个国家设有设计、制造或销售机构,在我国北京、上海、苏州、南通、成都、珠海等16个城市设立了分公司或办事处。TI公司1958年发明了首块集成电路(integratedcircuit,IC);1982年推出了单芯片商用DSP;1996年推出了0.18μm工艺的Timeline技术,可在单芯片上集成1.25亿个晶体管;2000年推出了每秒执行近90亿个指令的TMS320C64xDSP芯片,刷新DSP性能记录;推出了世界上功耗*低的芯片TMS320C55xDSP;近年来,推出了业界速度*快的720MHzDSP;向市场提供的0.13μm产品超过1亿件,同时开始采用0.09μm工艺开发新型的开放式多媒体应用平台(openmultimediaapplicationplatform,OMAP)处理器。TI公司是DSP市场的公认领导者,在DSP市场排名第一,在混合信号/模拟产品市场也排名第一。
TI公司的产品主要包括半导体、教育产品和数字光源处理解决方案(digitallightprocessor,DLP)三大部分。其中,半导体是其主导产业,分为处理器、电源管理、放大器、接口器件、模拟开关和多路复用器、逻辑器件、数据转换器件、数字音频、时钟和计时器、温度传感器、射频识别等。
1.1.2TI公司的DSP产品
针对TI公司的处理器部分,重点介绍一下其DSP产品。TI公司于1982年推出了TMS系列第1代DSP产品,可使调制解调器在1s内处理500万条指令,标志着实时信号处理技术的重大突破;随后在1988年又推出了应用于三维绘图和视频会议系统的DSP产品;1991年TI公司的DSP芯片的价格达到了5美元以下,具有很强的价格优势,为其广泛应用铺平了道路;1994年TI公司在DSP技术上取得了重大突破,实现了1s内2亿次运算,这是第五代DSP产品,与第四代相比,速度提高了10倍,此后,又将闪存内置到DSP内部,在提高芯片速度的同时,进一步降低了用户的开发成本,这使得其应用范围不断扩大。目前,TI公司的DSP产品已广泛应用于通信、控制、仪器、仪表、医学电子、军事、航空航天、计算机和消费类电子产品等领域。
目前,TI公司的DSP产品主要包括以下几个系列。
1.C6000高性能系列
TMS320C6000系列DSP具有行业领先的性能[高达24000万乘法运算每秒周期数(millionmultiplyaccumulatecyclespersecond,MMACS)],功耗也不高,该平台非常适合于影像/视频等图像处理、通信和宽带基础设施、高端计算、雷达信号处理和高性能音频等应用。其中,TMS320C64xDSP的运算速度已经超过1GHz,性能比第1代TMS320C62xDSP提高了近10倍。而以TMS320C66x为代表的C6000高性能多核DSP,融合了定点和浮点功能,在伯克莱设计技术公司(BerkleyDesignTechnologyInc.,BDTI)进行的基准测试中,其定点与浮点性能均获得业内*高评分,定点获得了16690分,浮点获得了10720。该DSP*多集成8个C66x内核,主频*高1.25GHz,可提供320000MMACS的性能。该平台性能相当强劲,非常适合测试与测量、医疗成像、工业自动化、军事和高端成像等市场的应用。
2.C5000低功耗系列
TMS320C5000低功耗系列DSP是TI公司专门针对消费类数字产品市场而设计的,其第2代产品TMS320C55x是业界功耗*低的16位DSP,主频*高300MHz,待机功耗低至0.15mW/MHz,性能高达600百万指令/s(millioninstructionspersecond,MIPS)。该系列产品*大特点就是低功耗,主要应用于移动电话、GPS接收器、指纹识别、调制解调器和数码相机等领域。
3.C2000数字化控制系列
TI公司在嵌入式数字控制方面提供了完善的解决方案,即高性能应用的32位实时C2000DSP。TMS320C2000DSP芯片上集成了各种数字控制功能,其强大的数据处理和控制能力可大幅提高应用效率和降低功耗。TI公司的TMS320C28x系列DSP是目前控制领域*高性能的处理器,具有精度高、速度快、集成度高等特点,广泛应用于高精度伺服控制、电源、通信、医疗和航空航天的数字控制技术等领域,是各类型工业控制方案的优选产品。
1.2DSP相关知识简介
1.2.1DSP基础知识
为了更好地理解本书后续的相关内容,这里介绍几个硬件设计中的常用名词和相关基础知识。
1.改进的哈佛结构
传统的冯 诺伊曼(vonNeumann)结构是将指令、数据、地址存储在同一存储器中,统一编址,根据指令计数器提供的地址来区分,取指和数据都访问同一存储器,无法同时进行,数据吞吐率低,常用于通用计算机的处理器中。哈佛结构是将程序和数据存储在不同的空间,即程序和数据存储器相互独立,每个存储器独立编址、独立访问。哈佛结构针对这两个存储器相应设置了4条总线:程序的数据总线与地址总线,数据的数据总线与地址总线。这种分离的程序和数据总线允许在一个机器周期内同时获得指令字和操作数,从而提高了执行速度,使数据的吞吐率提高了1倍。又由于程序和数据存储器在两个分开的物理空间中,使得取指和执行能完全重叠。哈佛结构常用于DSP、ARM等嵌入式专用处理器中。而改进的哈佛结构是在基本哈佛结构的基础上做了如下改进:一是增加了多条数据总线,如读、写指令总线分开,读、写数据总线分开等,这样使取指和执行可进一步重叠,提高了运行速度和灵活性;二是允许数据存放在程序存储器中,并被算术运算指令直接使用,增强了芯片的灵活性;三是指令存储在高速缓冲器中,当执行此指令时,不需要再从存储器中读取指令,减小了指令执行周期。
2.流水线(pipeline)技术
流水线技术是指在程序执行时多条指令重叠进行操作的一种准并行处理技术。流水线技术是Intel公司在486芯片中首次使用的,顾名思义,它就像是工业生产上的装配流水线,在中央处理单元(centralprocessingunit,CPU)中由5~6个不同功能的电路单元组成一条指令处理流水线,然后将一条指令分成5~6步后再由这些电路单元分别执行。很明显,当只有一条指令运行时,是无法提高运算速度的,当大量指令运行时,指令就会填满这5~6个功能单元,实现准并行操作,这样就能实现在一个CPU时钟周期完成多条指令,提高CPU的运算速度。TMS320C2000系列DSP采用了八级流水线技术,分别是取指1(F1)、取指2(F2)、译码1(D1)、译码2(D2)、读操作数1(R1)、读操作数2(R2)、执行(E)和写结果(W)。
3.定点处理器和浮点处理器
从通用CPU到专用DSP处理器,一直存在着定点和浮点之争。定点与浮点的差异在于它们对数据的数字表示法不同,定点处理器硬件严格运行整数运算,而浮点处理器既支持整数运算又支持实数运算,并以科学计数法进行了标准化。字长为16位的定点处理器,带符号整数值范围为215~2151,与此不同,浮点处理器将数据分为两部分:一是尾数部分,二是指数部分。在支持标准单精确运算的32位浮点处理器中,尾数为24位,指数为8位,其数值动态范围为10128~10127,这样的动态范围大大高于定点处理器格式可提供的精确度,而实施标准双精度(64位,包括53位的尾数与11位的指数)的器件还可实现更高的精确度。
在DSP领域,定点处理器取得了极大的成功,主要有以下几个方面原因:首先,早期定点处理器成本非常低,使定点处理器得到了广泛的应用;其次,定点处理器先问世,对应定点处理器开发很多算法,在以后的开发中为了保持算法上的优势,会延续选用定点处理器;另外,定点处理器功耗相对较小。这些优势使定点处理器发展迅速,而且目前仍然以定点处理器为主。但是,随着对DSP处理速度与精度、存储器容量、编程的灵活性和方便性要求的不断提高,浮点处理器也得到了越来越广泛的应用。相对定点处理器,浮点处理器的动态范围更大,可以实现更高的精度,很多算法的浮点代码比定点占用更少的周期,浮点运算用硬件来实现,其处理速度大大高于定点处理器。然而,由于电路复杂性和制造工艺上的原因,浮点处理器与定点处理器相比在成本和功耗上通常具有明显的劣势,从而导致浮点处理器一直主要局限于雷达、专业音频、医疗设备等领域的应用。近年来,浮点处理器在提供高性能的同时,进一步降低了功耗和成本,各大厂商都提供了5~10美元的浮点DSP,功耗也显著降低,浮点处理器开启了更广泛应用的大门。
4.5V和3.3V电路混接
当前,集成电路的供电电压越来越低,例如,主流DSP很多都采用3.3V的输入/输出(input/output,I/O)电压、1.8V甚至1.2V的核心电压,但目前在伺服控制和通信领域,还有许多外围电路是5V的,因此在DSP系统中,经常有5V外围电路和3.3V的DSP电路混接的问题,主要包括TTL电路和CMOS电路。
TTL电路的全名是晶体管-晶体管逻辑(transistor-transistorlogic)电路,大部分采用5V电源,只允许在+5V(110%)范围内波动,扇出系数一般为10个以下。TTL电路是电流控制器件,主要有54和74系列的标准TTL、高速TTL(high-speedTTL,H-TTL)、低功耗TTL(low-powerTTL,L-TTL)、肖特基TTL(SchottkyTTL,S-TTL)以及低功耗肖特基TTL(low-powerSchottkyTTL,LS-TTL)五个系列。TTL电路的特点在于速度快,传输延迟时间短(5~10ns),不过功耗较大。标准TTL电路输入高电平为不小于2V,低电平为0.8V及以下,输出高电平为不小于2.4V,低电平为0.4V及以下。
CMOS电路的全名是互补对称金属氧化物半导体(complementarysymmetrymetaloxidesemiconductor)电路,CMOS电路的供电电压范围较大,在3~15V均能正常工作,电压波动允许10%,扇出系数一般为10~20个。CMOS电路是电压控制器件,输入电阻极大,对干扰信号十分敏感,因此不用的输入端不应开路,需上拉或下拉。CMOS电路的优点是噪声容限较宽,静态功耗很小,但其速度慢,传输延迟时间长(25~50ns)。CMOS电路本身的功耗与输入信号频率有关,频率越高,芯片越热,属正常现象。CMOS电路的输入高电平为不小于0.8VCC(VCC为电源电压),输入低电平为0.2VCC及以下,而输出高电平为VCC,输出低电平为GND(GND为地)。
当在硬件电路的设计中遇到上述5V和3.3V电路混接问题时,笔者不推荐将其直接相连(虽然有时直接相连的电路也能正常
展开