电子科技大学-彭启琮-dsp视频配套ppt-2.ppt

下载文档 降价啦

4
0
约2.79千字
约 65页
2016-11-03 发布于山西
举报
版权申诉
保障服务

电子科技大学-彭启琮-dsp视频配套ppt-2.ppt

1、本文档共65页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

电子科技大学-彭启琮-dsp视频配套ppt-2

第二章DSP的硬件结构 DSP的硬件结构 DSP的硬件结构，大体上与通用的微处理器相类似，由CPU、存储器、总线、外设、接口、时钟等部分组成，但又有其鲜明的特点。 Von Neuman结构与Harvard结构 Harvard结构程序与数据存储空间分开，各有独立的地址总线和数据总线，取指和读数可以同时进行，从而提高速度，目前的水平已达到90亿次浮点运算/秒（9000MFLOPS） MIPS--Million Instruction Per Second MFLOPS--Million Floating Operation Per Second 流水操作（pipeline）独立的硬件乘法器在卷积、数字滤波、FFT、相关、矩阵运算等算法中，都有 ?A（k）B（n—k）一类的运算，大量重复乘法和累加通用计算机的乘法用软件实现，用若干个机器周期。 DSP有硬件乘法器，用MAC指令（取数、乘法、累加）在单周期内完成。独立的DMA总线和控制器有一组或多组独立的DMA总线，与CPU的程序、数据总线并行工作，在不影响CPU工作的条件下，DMA速度目前已达800Mbyte/s CPU 通用微处理器的CPU由ALU和CU组成，其算术运算和逻辑运算通过软件来实现，如加法需要10个机器周期，乘法是一系列的移位和加法，需要数十个机器周期。 DSP的CPU设置硬件乘法器，可以在单周期内完成乘法和累加 TMS320C2xx的CPU（部分）硬件乘法器 CALU（中心算术逻辑单元）移位通用微处理器的移位，每调用一次移位指令移动1-bit DSP可以在一个机器周期内左移或右移多个bit，可以用来对数字定标，使之放大或缩小，以保证精度和防止溢出；还可以用来作定点数和浮点数之间的转换溢出通用CPU中，溢出发生后，设置溢出标志，不带符号位时回绕，带符号位时反相，带来很大的误差 DSP把移位输出的最高位（MSB）存放在一个位检测状态寄存器中，检测到MSB=1时，就通知下一次会发生溢出，可以采取措施防止数据地址发生器（DAG）在通用CPU中，数据地址的产生和数据的处理都由ALU来完成在DSP中，设置了专门的数据地址发生器（实际上是专门的ALU），来产生所需要的数据地址，节省公共ALU的时间外设（peripherals）时钟发生器（振荡器与PLL）定时器（Timer）软件可编程等待状态发生器通用I/O 同步串口（SSP）与异步串口（ASP） JTAG扫描逻辑电路（IEEE 1149.1标准) 便于对DSP作片上的在线仿真和多DSP条件下的调试 ALU Arithmetic Logic Unit (ALU) 16-bit immediate value 16-bit word from data memory 16-bit value in the temporary register, T Two 16-bit words from data memory 32-bit word from data memory 40-bit word from either accumulator Multiplier/Adder Compare, Select, and Store Unit (CSSU) ADSP2100 MOTOROLA DSP56002 Lucent DSP1628 Lucent DSP1600 core 特点在数字蜂房电话等应用中，其位操作单元支持很高的编码效率，纠错协处理器支持信道均衡与编码。片内可编程锁相环（ PLL）时钟合成器。 2.7 V 电压工作，19.2 ns 及 12.5 ns 指令周期。片内6 KW双口 RAM，48 KWROM 定点DSP与浮点DSP 浮点格式用指数形式表示，其动态范围比用小数形式表示的定点格式要大得多，定点DSP中经常要考虑的溢出问题，在浮点DSP中基本上可以不考虑为了保证底数的精度，浮点DSP基本上作成32-bit的，其总线、寄存器、存储器等的宽度也相应是32-bit的浮点DSP的速度更快，尤其是作浮点运算浮点DSP的价格高，开发难度也更大多处理器接口 TMS320C40有6个8-bit的接口，使多个处理器可以很方便的并行或串行工作，ADI公司的ADSP21160也有类似的接口 TMS320C30 60ns单周期指令执行时间 33.3MFLOPS 16.7MIPS 片内4Kx32bit 单周期内可访问两次的ROM 两个1Kx32bit 单周期内可访问两次的RAM 64x32bit指令Cache TMS320C30 指令及数据字长32bit,地址宽度24bit (16M寻址空间) 40/32bi