- TMS320DM642 DSP原理与应用实践
- 许永辉 杨京礼 林连雷编著
- 3307字
- 2020-08-28 19:35:25
1.2 TI公司DSP芯片
TI公司于1982年推出TMS320系列DSP芯片的第一代处理器TMS320C10。经过十几年的发展,TI公司又相继发展了TMS320C2000、TMS320C5000和TMS320C6000三个系列的DSP产品。现今,TI公司的TMS320系列已成为DSP市场中的主流产品,约占市场份额的48%,是世界最大的DSP芯片供应商。
1.2.1 TMS320C2000系列
TMS320C2000系列DSP一般应用于控制领域,可以替代老的C1x和C2x型号的DSP。现在TMS320C2000系列DSP的应用主要集中在以下方面。
(1)C20x。C20x是16位定点DSP芯片,速度为20~40MIPS(Million Instructions Per Second,每秒执行百万次指令),片内RAM比较少,如C204片内只有512字节的DARAM。有些型号的C20x DSP芯片中带有闪速存储器(Flash Memory),如F206就带有32K×16位的闪速存储器。C20x的主要应用范围为数字电话、数码相机,自动售货机等。
(2)C24x。C24x是16位定点DSP,速度为20MIPS,一般用于数字马达控制、工业自动化、电力交换系统、变频设备、空调等。为了在有限的空间里提高数字控制设备的性能, T1公司最近推出了TMS320LF2401A、TMS320LF2403A、TMS320LC2402A三款新型C24xx DSP。这三款新型C24xx DSP降低了消费类和业界的原始设备生产商(OEM)的系统成本,进一步实现了系统的小型化、智能化,使产品设计更趋完善。
TI公司的TMS320LF2401A DSP是将速度为40MIPS的DSP内核、闪速存储器以及外设集成到器件中,其封装尺寸不超过一个隐形眼镜片的大小,主要用于对实时性有严格要求的场合,而TMS320LF2401A DSP高度的系统集成和较小的封装体积,有助于OEM快速地将产品推向市场。
TI公司的TMS320LF2403A、TMS320LC2402A主要针对有更大RAM需求的应用。TMS320LF2403A DSP控制器内部集成了16K×l6位闪速存储器、1K×l6位RAM、8通道的10位ADC、事件管理器。具有CAN2.0B协议的CAN总线控制器、SPI总线接口及21个GPI/O被全部封装到一只有64个引脚的10mm×10mm芯片中。TMS320LC2402A DSP是与TMS320LF2403A DSP处理器引脚兼容的处理器,其内部集成了能替代闪速存储器的6K×l6位ROM存储器,生产成本较低。
最近TI将新一代C28x DSP内核引进TMS320C2000家族。C28x内核是目前数字控制应用领域性能最好的DSP内核。C28x内核提供高达400MIPS的计算带宽以处理大量而繁杂的实时控制算法,如随机RAM和功率因数的校正。新型的C28x也是业界编码效率最高的DSP内核,并与目前使用的C2000家族具有完全兼容的代码。
C2000系列DSP的发展如图1-1所示。
图1-1 C2000 DSP产品系列
1.2.2 TMS320C5000系列
TMS320C5000系列是16位定点、速度为40~200MIPS、可编程、低功耗和高性能的DSP。主要用于有线或无线通信、IP(Internet Protocol,互联网协议)电话、便携式信息系统、手机、助听器等。
目前,TMS320C5000系列中有3种有代表性的常用芯片。第一种是TMS320C5402,速度为100MIPS,片内存储空间较小,RAM为16K×l6位、ROM为4K×16位。主要用于无线Modem(调制解调器)、新一代PDA(Personal Digital Assistant,个人数字助理)、网络电话和数字电话系统以及消费类电子产品。TMS320C5402每片的目标价格在5美元以下,属廉价型的DSP。第二种常用芯片是TMS320C5420,它拥有两个DSP内核,速度可达到200MIPS,200K×l6位片内RAM,功耗为0.32mA/MIPS,200MIPS全速工作时不超过120mW,为业内功耗较低的DSP。TMS320C5420是当今集成度较高的定点DSP,适合于多通道基站、服务器、Modem和电话系统等要求高性能、低功耗、小尺寸的场合。第三种是TMS320C5416,它是TI公司0.15μm器件中的第一款DSP芯片,有128K×l6位片内RAM,速度为160MIPS,有3个多通道缓冲串行口(MCBSP),能够直接与T1或E1线路连接,不需要外部逻辑电路,主要用于VoIP(Voice over IP)、通信服务器、PBX(专用小型变换机)和计算机电话系统等。
为满足对性能、尺寸、价格和功耗有严格要求的设备,TI公司设计了一种属于TMS320CC5000系列的DSP产品,即TMS320C5500TMDSP(以下简称TMS320C55xx)。TMS320C55xx与TMSC320C54xx代码兼容,且MIPS功耗只有0.05mW,是目前市场上TMS320C54xx产品功耗的0.4倍。TMS320C55xx有强大的电源管理功能,能进一步增强省电功能,可使网络音频播放器用两节AA电池工作200个小时以上(相当于目前播放器工作时间的10倍)。
TMS320C55xx系列的代表产品有TMS320C5509和TMS320C5502。TMS320C5509 DSP芯片主要用于网络媒体娱乐终端、个人医疗、图像识别、保密技术、数码相机、个人摄像机等设备。TMS320C5509 DSP芯片是目前集成度较高的通用型DSP,能提供完备的系统解决方案,具有96K×l6位的单口SRAM、32K×16位的双口SRAM、32K×l6位的ROM和6通道的DMA(直接存储器存储)。此外,TMS320C5509 DSP芯片还含有USB 1.0接口、用于全双工通信的3个多通道缓冲串行接口(MCBSP)、Watchdog定时器、32kHz晶振输入和单电源的实时时钟、片上10位ADC、连接微控制器的I2C总线接口,以及用于芯片内的编解码器、增强型16位主机接口、两个16位定时器等。TMS320C5509 DSP支持流行的存储方式,包括对记忆棒、多媒体卡和SD(Secure Digital)卡的支持。因此, TMS320C5509 DSP可以广泛地支持DSP系统板上的外围器件,包括用于直接连接PC或其他USB主机设备的USB 1.0端口,并能遵循大多数流行的可移动存储标准及多媒体文件格式。
TMS320C5502 DSP芯片作为TI公司的TMS320C5000 DSP系列平台上新型的性价比较佳的产品,每秒执行的指令高达4亿条,可满足当今个人设备对价格和性能的要求。TMS320C5502 DSP芯片有32K×16位的片上双口RAM、一个主机接口、通用外围设备(如3个多通道缓冲串行接口)、一个硬件UART、I2C总线接口和76个专用GPI/O口,提供传输速率为400兆字节/秒的32位外部存储接口,并支持低价SDRAM外设。
C5000系列DSP的发展如图1-2所示。
图1-2 C5000 DSP产品系列
1.2.3 TMS320C6000系列
TMS320C6000系列DSP是TI公司于1997年2月推向市场的高性能DSP,具有性价比高、功耗低等优点。TMS320C6000系列中又分为定点DSP和浮点DSP两类。
(1)TMS320C62xx。该系列是TMS320C6000系列中的32位定点DSP,内部集成了多个功能单元,可同时执行8条指令,运算速度为1200~2400MIPS。其主要特点如下。
① 运行速度快。指令周期为5ns,运算能力为1600MIPS。
② 内部结构不同于一般DSP芯片。内部同时集成了2个乘法器和6个算术运算单元,且它们之间是高度正交的,使得在一个指令周期内最大能支持8条32bit的指令。
③ 指令集不同。为充分发挥其内部集成的各执行单元的独立运行能力,TI公司使用了Veloci Tl超长指令字(VLIW)结构。它在一条指令中组合了几个执行单元,结合其独特的内部结构,可在一个时钟周期内并行执行几个指令。
④ 大容量的片内存储器和大范围的寻址能力。片内集成了512K字程序存储器和512K字数据存储器,并拥有32bit的外部存储器界面。
⑤ 智能外设。内部集成了4个DMA接口,2个多通道缓存串口,2个32位计时器。
⑥ 低廉的使用成本。在个无线基站的应用中,每片TMS320C62x能同时完成30路的语音编解码,每路成本为3美元,而以前的DSP系列最大只能完成5路,每路的成本为7美元。
这种芯片适合于无线基站、无线PDA、组合Modem、GPS导航等需要大运算能力的应用场合。
(2)TMS320C67xx。该系列是TMS320C6000系列中的32位浮点DSP,内部同样集成了多个功能单元,可同时执行8条指令,其运算速度为1GFLOPS(Floating Point namber Operations Per Second,每秒所执行的浮点运算次数)。该系列除了具有TMS320C62xx系列的特点外,其主要特点还有以下几点。
① 运行速度快。指令周期为6ns,峰值运算能力为1336MIPS,对于单精度运算可达1GFLOPS,对于双精度运算可达250MFLOPS。
② 硬件支持IEEE格式的32位单精度与64位双精度浮点操作。
③ 集成了32×32位的乘法器,其结果可为32位或64位。
④ TMS320C67xx的指令集在TMS320C62xx的指令集基础上增加了浮点执行能力,可以看作是TMS320C62xx指令集的超集。TMS320C62xx指令能在TMS320C67xx上运行,而无需任何改变。
与TMS320C62xx系列芯片一样,由于其出色的运算能力、高效的指令集、智能外设、大容量的片内存储器和大范围的寻址能力,这个系列的芯片适合用于基站数字波束形成、图像处理、语音识别、3D图形等对运算能力和存储量有高要求的应用场合。
目前,TMS320C6000系列主要向两个方向发展:一是追求更高的性能;二是在保持高性能的同时向廉价型发展。例如,TI公司最近推出的TMS320C6414、TMS320C6415和TMS320C6416三款新产品的工作频率高达800MHz,计算速度接近每秒64亿次指令,而功耗仅为现有器件的1/3。它们既可通过一条单独接入家庭的宽带线路传输大量的个性化数据、视频和语音,也可通过3G无线基站向无线手机发送多媒体信息。
TMS320C6000系列中的C64x系列在DSP芯片中处于领先水平。C64x系列DSP不但提高了时钟频率,而且在内部结构上也采用了新的优化,主要表现在以下几个方面:
① 寄存器个数比C62x增大了一倍,从原来的32个变成了64个。
② 乘法器、累加器、桶式移位器和加法器等特殊硬件运算器的数量比原来增加了l~3倍。
③ CPU通过L1 Program Cache和L1Data Cache执行指令并处理数据,通过L2 Cache与增强型DMA控制器(Enhanced DMA Controller, EDMAC)相连,且能控制外围设备,从而使Cache空间增大。
④ 外部的总线变成了64位,是C62x的一倍。
⑤ 数据结构支持8位的运算操作,尤其适用于8位图像信号的处理。
⑥ 在C62x系列DSP指令基础上增加了一些新的指令。例如增加了GF域的乘法,一次可以实现4个GF域的乘法,为无线通信的RS编译码提供快速实现。
⑦ 内部嵌入各种应用软件,包括Viterbi译码、RS译码、回音抵消、图像压缩等。
C6000系列DSP的发展如图1-3所示。
图1-3 C6000 DSP产品系列