电子科技大学-彭启琮-dsp视频配套ppt-2.ppt

  1. 1、本文档共65页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
电子科技大学-彭启琮-dsp视频配套ppt-2

第二章 DSP的硬件结构 DSP的硬件结构 DSP的硬件结构,大体上与通用的微处理器相类似,由CPU、存储器、总线、外设、接口、时钟等部分组成,但又有其鲜明的特点。 Von Neuman结构与Harvard结构 Harvard结构 程序与数据存储空间分开,各有独立的地址总线和数据总线,取指和读数可以同时进行,从而提高速度,目前的水平已达到90亿次浮点运算/秒(9000MFLOPS) MIPS--Million Instruction Per Second MFLOPS--Million Floating Operation Per Second 流水操作(pipeline) 独立的硬件乘法器 在卷积、数字滤波、FFT、相关、矩阵运算等算法中,都有 ?A(k)B(n—k)一类的运算,大量重复乘法和累加 通用计算机的乘法用软件实现,用若干个机器周期。 DSP有硬件乘法器,用MAC指令(取数、乘法、累加)在单周期内完成。 独立的DMA总线和控制器 有一组或多组独立的DMA总线,与CPU的程序、数据总线并行工作,在不影响CPU工作的条件下,DMA速度目前已达800Mbyte/s CPU 通用微处理器的CPU由ALU和CU组成,其算术运算和逻辑运算通过软件来实现,如加法需要10个机器周期,乘法是一系列的移位和加法,需要数十个机器周期。 DSP的CPU设置硬件乘法器,可以在单周期内完成乘法和累加 TMS320C2xx的CPU(部分) 硬件乘法器 CALU(中心算术逻辑单元) 移位 通用微处理器的移位,每调用一次移位指令移动1-bit DSP可以在一个机器周期内左移或右移多个bit,可以用来对数字定标,使之放大或缩小,以保证精度和防止溢出;还可以用来作定点数和浮点数之间的转换 溢出 通用CPU中,溢出发生后,设置溢出标志,不带符号位时回绕,带符号位时反相,带来很大的误差 DSP把移位输出的最高位(MSB)存放在一个位检测状态寄存器中,检测到MSB=1时,就通知下一次会发生溢出,可以采取措施防止 数据地址发生器(DAG) 在通用CPU中,数据地址的产生和数据的处理都由ALU来完成 在DSP中,设置了专门的数据地址发生器(实际上是专门的ALU),来产生所需要的数据地址,节省公共ALU的时间 外设(peripherals) 时钟发生器(振荡器与PLL) 定时器(Timer) 软件可编程等待状态发生器 通用I/O 同步串口(SSP)与异步串口(ASP) JTAG扫描逻辑电路(IEEE 1149.1标准) 便于对DSP作片上的在线仿真和多DSP条件下的调试 ALU Arithmetic Logic Unit (ALU) 16-bit immediate value 16-bit word from data memory 16-bit value in the temporary register, T Two 16-bit words from data memory 32-bit word from data memory 40-bit word from either accumulator Multiplier/Adder Compare, Select, and Store Unit (CSSU) ADSP2100 MOTOROLA DSP56002 Lucent DSP1628 Lucent DSP1600 core 特点 在数字蜂房电话等应用中,其位操作单元支持很高的编码效率,纠错协处理器支持信道均衡与编码。 片内可编程锁相环( PLL)时钟合成器。 2.7 V 电压工作,19.2 ns 及 12.5 ns 指令周期。 片内6 KW双口 RAM,48 KWROM 定点DSP与浮点DSP 浮点格式用指数形式表示,其动态范围比用小数形式表示的定点格式要大得多,定点DSP中经常要考虑的溢出问题,在浮点DSP中基本上可以不考虑 为了保证底数的精度,浮点DSP基本上作成32-bit的,其总线、寄存器、存储器等的宽度也相应是32-bit的 浮点DSP的速度更快,尤其是作浮点运算 浮点DSP的价格高,开发难度也更大 多处理器接口 TMS320C40有6个8-bit的接口,使多个处理器可以很方便的并行或串行工作,ADI公司的ADSP21160也有类似的接口 TMS320C30 60ns单周期指令执行时间 33.3MFLOPS 16.7MIPS 片内4Kx32bit 单周期内可访问两次的ROM 两个1Kx32bit 单周期内可访问两次的RAM 64x32bit指令Cache TMS320C30 指令及数据字长32bit,地址宽度24bit (16M寻址空间) 40/32bi

文档评论(0)

maxmin + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档