毕业论文
DSP 最小系统的设计与开发
姓 名:
( )
院(系)别: 信息与通信工程学院
专 业: 班 级: 指导教师: 职 称:
电信 032
讲师
毕业设计(论文)任务书
题目 学生姓名 课题类型 DSP最小系统的设计与开发 学院名称 信息学院 自选课题 专业班级 电信032 DSP 在人们生活当中,可谓无处不在,例如手机,电视机,数码相 机,MP3 等等都有DSP 的存在。DSP 已经成为通信、计算机和消费类电 课题意义 子产品等领域的基础器件,并且发挥着越来越大的作用。 通过对本课题的学习,了解 DSP 系统的设计及应用,锻炼设计 电路的能力和动手能力。 任务:理解DSP 系统的原理,选择合适的芯片完成 DSP 最小系统的 设计。 进度要求:1月10日-3月05日 熟悉DSP 系统理论,查找有关资料 任务与进 度要求 3月06日-4月10日 各部分电路原理图设计 4月11日-5月10日 选购所需的芯片和硬件并设计PCB 5月11日-6月05日 焊接并调试印刷电路板 6月06日-5月30日 软件测试,分析结果 5月31日-6月25日 书写论文,准备答辩 [1] 汪安民.TMS320C54xxDSP 实用技术.北京:清华大学出版社,2002 主要参考 文献 [2] 张雄伟.DSP 芯片的原理与开发应用.北京:电子工业出版社,2003 [3] 张雄伟.DSP 集成开发与应用实例. 北京:电子工业出版社,2002 [4] 朱铭锆.DSP应用系统设计.北京:电子工业出版社,2002 [5] 李利.DSP原理及应用.北京:中国水利水电出版社,2004 起止日期 2007.1.10---2007.6.25 备注 院长 教研室主任 指导教师
毕业设计(论文)开题报告表
2007 年
1 月 10日
姓名 题目
学院 信息学院 专业 电信 班级 指导教师
电信032
DSP 最小系统的设计与开发 刘丽杰
一、 与本课题有关的国内外研究情况、课题研究的主要内容、目的和意义:
1.国内外研究情况:自20 世纪 80年代初 DSP 芯片诞生以来,DSP 芯片在 20
多年时间里得到了飞速的发展,DSP 芯片已经在通信和电子系统、信号与信息处理、自 动控制、雷达、军事、航空航天、医疗、家用电器等许多领域得到广泛的应用。
2.课题研究的主要内容:DSP 最小系统的硬件设计,软硬件调试。
3.目的和意义:DSP由于运算速度快,具有可编程性和接口灵活性,使得它在电子 产品的研制中,发挥越来越大的作用;采用DSP器件来实现数字信号处理系统更是成了当 前的发展趋势。作为一个电信本科生,掌握DSP系统的设计技术是非常重要的,通过对本 课题的学习,了解DSP系统的设计及应用,锻炼设计电路的能力和动手能力。
二、进度及预期结果: 起止日期
主要内容
熟悉DSP 系统的相关理论,查找各种有关资料
预期结果 熟悉课题理论知识 完成原理图设计
1.10-3.05 3.06-4.10 4.11-5.10 5.11-6.05 6.06-5.30 5.31-6.25
各部分电路原理图设计 选购所需的芯片和硬件并设计PCB
焊接并调试印刷电路板 软件测试,分析结果 书写论文,准备答辩
完成最小系统硬件设计 成功制作出电路板 软件测试成功 完成论文
完成课题的 现有条件
PC 机、Protel99SE 电路板开发工具、电源、万用表、仿真器。
审查意见
指导教师: 年 月 日
学院意见
主管领导: 年 月 日
毕业设计(论文)进度检查记录
题目 学生姓名 指导教师姓名
DSP最小系统的设计与开发
学院名称 信息学院 专业班级
指导教师职称
指
导
记
录
电信032
讲师
日 期 07.1.10 07.3.05 07.3.13 07.3.16 07.3.20 07.4.10 07.4.15 07.4.25 07.5.10 07.5.25 07.6.05 07.6.12 07.6.18 07.6.20 07.6.22 07.6.25
明确课题任务并简单介绍相关知识 提供与课题相关的部分资料 确定开发板的主要结构及功能 辅助确定主芯片型号
指导如何进行各种外接电路的选型 指导如何绘制原理图 帮助购买所需器件 指导如何绘制PCB
指导焊接器件注意事项 指导焊接芯片 指导如何进行电路调试 指导如何写毕业论文 检查英文翻译的情况 确定整体格式,基本定稿 修改论文 毕业论文预答辩
本科毕业设计(论文)评阅表
(论文类)
题目 学生姓名 DSP 最小系统的设计与开发 学生班级 电信032 指导教师姓名 评审项目 指标 能体现本专业培养目标,使学生得到较全面训练。题目 大小、难度适中,学生工作量饱满,经努力能完成。 题目与生产、科研等实际问题结合紧密。 能查阅文献以及从事其他形式的调研,能较好地理 满分 评分 10 10 选题 课题调研、 解课题任务并提出实施方案;有分析整理各类信息,从 文献检索 中获取新知识的能力。 15 10 10 5 15 15 10 100 结构严谨,理论、观点、概念表达准确、清晰。 论文撰写 文字通顺,用语正确,基本无错别字和病句,图表清楚, 书写格式符合规范。 外文应用 能正确引用外文文献,翻译准确,文字流畅。 论文论点正确,论点与论据协调一致,论据充分支持论 点,论证过程有说服力。 论文水平 有必要的数据、资料支持,数据、资料翔实可靠,得出 的结论有可验性。 论文有独到见解或有一定实用价值。 合计 意见及建议: 评阅人签名: 年 月 日
毕业设计(论文)成绩考核表
学生姓名 叶枫 题目
学院名称
信息学院
专业班级
电信032
DSP 最小系统的设计与开发
1
1.毕业设计(论文)指导教师评语及成绩:
成绩:
指导教师签字: 年 月 日
2.毕业设计(论文)答辩委员会评语及成绩:
成绩:
答辩(或组长)签字:
3
3.毕业设计(论文)总成绩: a.指导教师 b.评阅教师 给定成绩 给定成绩
c.毕业答辩成绩
总成绩
(a×0.5+b×0.2+c×0.3)
年 月 日
摘 要
DSP 由于运算速度快,具有可编程特性及接口灵活的特点,使得它在电子 产品的研制中,发挥着越来越大的作用。采用DSP器件来实现数字信号处理系统 更是成了当前的发展趋势。如何以最短的开发周期,开发出适于自己应用的高性 能低成本的DSP板,己经成为广大DSP工程技术人员共同关心的问题。
DSP最小系统板硬件设计是本次论文的主要任务。在介绍TMS320VC5402基 本特点的基础上,运用DSP技术和硬件电路设计知识进行了DSP最小系统设计, 包括DSP芯片选型、电源设计、复位电路设计、时钟电路设计、存储器设计、JTAG 接口等。
在软件方面,本文使用Protel99SE设计电路板。首先绘制电路原理图,完
成原理图后生成网络表。然后对最小系统的高速PCB板进行了设计,并完成板
卡的检测、制作、安装和硬件调试。
最后,以自行设计的高速 DSP 板为硬件平台,使用CCS2软件,编写测试
程序。经过多次软硬件调试和测试,验证了 DSP 最小系统板卡能正常运行,能 满足基本信号处理的要求。
关键词:DSP;TMS320VC5402 ;最小系统;PCB;Protel99SE
ABSTRACT
DSP has become more and more important in electronic product design because of its fast operation rate, programmability, and flexible interface. It will be a developing trend to design digital signal system with DSP devices. But there is a common issue
for most DSP engineers to develop DSP boards with high quality and low cost inthe shortest time.
The main goal is to design a DSP minimum system board for this paper. After
introducing the basic characteristics of tms320vc5402 chip, this paper uses DSP
technology and hardware designing knowledge to design the minimum DSP system, which includes DSP chip selection, power design, clock circuit design, reset circuit design, memorydesign, JTAG interface and etc.
This paper uses Protel99 SEto design the circuit boardin software. It firstly draws
circuit schematic, and generates the network table according to the schematic. Then the high-speed PCB board of the minimum system is designed, and the detecting, manufacturing, installting and hardware debuggingareaccomplished.
Finally, the test programs are writedusing the CCS software on the paltform of the
high-speed DSP board designed by myself. After the debugging and testing of many times, the DSP minimum system board can run commonly, and cansatisty the basic requirements of the signalprocessing.
Keywordss:DSP; TMS320VC5402;MinimumSystem; PCB; Protel99SE
目 录
前 言.......................................................................................................................... 1
第一章 绪 论................................................................................................................2
1.1DSP 的应用领域........................................................................................ 2
1.2DSP 特点及国内外发展现状.................................................................... 2
1.2.1DSP 的特点......................................................................................2
1.2.2 国内外DSP 的发展........................................................................3
1.3 各章安排...................................................................................................4
第二章 总体设计.......................................................................................................... 5
2.1 系统要实现的功能...................................................................................5
2.2 系统的设计流程.......................................................................................5
2.3 原理框图................................................................................................... 7 2.4 最小系统主芯片介绍............................................................................... 7
2.4.1TMS320VC5402 的软件资源.........................................................7
2.4.2TMS320VC5402 的硬件资源.........................................................8
第三章 DSP 最小系统硬件设计............................................................................... 14
3.1PROTEL 工具简介................................................................................. 14
3.2 使用Protel99SE进行电路设计的流程...............................................14
3.3 电路原理图设计.....................................................................................15
3.4TMS320VC5402 最小系统设计 15
..............................................................
3.4.1 电源模块 15
....................................................................................... 3.4.2 复位、拨码开关和时钟电路....................................................... 16 3.5 扩展电路设计......................................................................................... 19
3.5.1CPLD 电路 19
.....................................................................................
3.5.2FLASH 的扩展..............................................................................19
3.5.3SRAM 的扩展................................................................................21
3.6 印刷电路板的设计流程.........................................................................24
3.7 印刷电路板简介..................................................................................... 27
3.7.1 印刷电路板的结构....................................................................... 27 3.7.2 零件封装.......................................................................................27 3.7.3 铜膜导线.......................................................................................28 3.7.4 焊点和导孔...................................................................................28 3.8 设计印刷电路板的注意事项................................................................. 28 3.9 最小系统PCB图和系统板....................................................................29
3.10 印刷电路板硬件调试的问题和体会...................................................31
第四章 系统性能测试................................................................................................ 33
3.1 仿真实现的软件工具.............................................................................33
3.2 系统的工作原理和测试步骤................................................................. 34 3.3DSP 存储空间的配置.............................................................................. 34
3.4 测试程序................................................................................................. 35 3.5 测试的注意事项..................................................................................... 36
结 论 37
.......................................................................................................................... 参考文献......................................................................................................................38 附 录........................................................................................................................39 谢 辞......................................................................................................................50
大学本科毕业论文 前言
前
言
DSP 有两种涵义,一种是 DigitalSignalProcessing,指的是数字信号处理技
术;一种是 DigitalSignalProcessor,指的是数字信号处理器。两者是不可分割
的,前者是理论上的技术,要通过后者变成实际产品,两者结合起来才成为解决
[1]
某一实际问题和实现某一方案的手段 。
数字信号处理器是目前 IT 领域中发展极为迅速的一类微处理器,其功能强 大,应用范围相当广泛,能够完成实时的数字信号处理任务。DSP的性能几乎决
定了电子产品的性能。在人们生活当中,DSP 可谓无处不在,例如手机,电视机 , 数码相机,MP3 等等都有DSP 的存在。DSP 已经成为通信、计算机和消费类电
子产品等领域的基础器件。
因此,只有理论的学习是不够的,设计一个 DSP 最小系统,掌握这门重要 技术,才能更深刻地理解和掌握DSP,为今后进行高精度、高性能的电子设计打
下基础。
本论文研究如何以 DSP(数字信号处理器)和CPLD(复杂可编程逻辑器件)为
核心构建硬件系统,完成基于 DSP和CPLD 的最小系统设计。这些核心组件包
括DSP、CPLD、存储器( SRAM、FLASH)等,研究的主要内容为实现上述核心
组件的接口设计。本文的研究主要集中在以下几个方面:
(1)进行初期调研,掌握系统的基本结构。对主芯片选型,确定开发板的各部 分电路及所需要器件。其次进行电路原理图的绘制,并通过Protel自带工具进行
电器特性,网络表检查,以达到正确无误。原理图绘制完成之后,进行PCB的
设计,包括制作零件封装,布局,布线,在检查没有错误之后,确定最终的PCB。
最后投板,焊接,完成最小系统板。
(2) 在ALTERA公司的MAX十p1usII环境下利用原理图和VHDL语言两种
方式完成CPLD 程序,使CPLD 能够控制SRAM、FLASH 和其它外围芯片进行
正常工作。
(3)调试电路,并在开发板上运行测试程序,保证系统能够正常运行。另外, 对电路调试过程中出现的问题和解决方法做必要的分析和探讨。
1
大学本科毕业论文 第一章 绪论
第一章
绪 论
数字信号处理(DSP)是一门涉及许多学科而又广泛应用于许多领域的新兴 学科。在通常的实时信号处理中,它具有可程控、可预见性、精度高、稳定性好 、 可靠性和可重复性好、易于实现自适应算法、大规模集成等优点,这都是模拟系 统所不及的。
1.1DSP 的应用领域
在近20多年时间里,DSP 芯片的应用已经从军事、航空航天领域扩大到信
号处理、通信、雷达、消费等许多领域 。主要应用有信号处理、通信、语音、 图形、图像、军事、仪器仪表、自动控制、医疗、家用电器等。
DSP主要应用市场为3C领域,占整个市场需求的90%。数字蜂窝电话是DSP
最为重要的应用领域之一。由于DSP 具有强大的计算能力,使得移动通信的蜂
窝电话重新崛起,并创造了一批诸如 GSM、CDMA 等全数字蜂窝电话网。 在 Modem器件中,DSP 更是成效卓著,不仅大幅度提高了传输速率,且具有接收
动态图像能力。另外,可编程多媒体 DSP是PC领域的主流产品。以XDSL Modem
为代表的高速通信技术与 MPEG 图像技术相结合,使得高品位的音频和视频形 式的计算机数据有可能实现实时交换。目前的硬盘空间相当大,这主要得益于 CDSP(可定制DSP)的巨大作用。预计在今后的PC 机中,一个DSP即可完成
全部所需的多媒体处理功能。DSP 也是消费类电子产品中的关键器件。由于DSP
的广泛应用,数字音响设备的更新换代周期变得非常短暂。用于图像处理的DSP,
一种用于JPEG 标准的静态图像数据处理;另一种用于动态图像数据处理。
1.2 DSP 特点及国内外发展现状
1.2.1DSP 的特点
DSP 芯片是模拟信号变换成数字信号以后进行高速实时处理的专用微处理 器,其处理速度比最快的 CPU还快10-50倍,具有处理速度高、功能强、性能
价格比好以及速度功耗比高等特点,被广泛应用于具有实时处理要求的场合。
2
大学本科毕业论文 第一章 绪论
DSP 系统以DSP 芯片为基础,具有以下优点。
1.高速性
DSP 系统的运行速度较高,最新的 DSP 运行速度高达1000MIPS 以上。
2.编程方便
可编程DSP可使设计人员在开发过程中灵活方便的对软件进行修改和升级。
3.稳定性好
DSP 系统以数字处理为基础,受环境温度及噪声的影响比较小,可靠性高。 4.可重复性好
数字系统的性能基本上不受元器件参数性能的影响,便于测试、调试和大规 模生产。
5.集成方便
DSP 系统中的数字部件有高度的规范性,便于大规模集成。 6.性价比高
常用的 DSP 价格在 5美元以下。
1.2.2国内外DSP 的发展
DSP 技术的应用以每年超过 30%的速度迅猛发展,所以DSP 已成为通信、
计算机、消费类领域的基础器件,被誉为信息社会的旗手。业内人士预言, DSP 将是未来集成电路中发展最快的电子产品并成为电子产品更新换代的决定 因素,它将逐渐成为信息领城的主角,彻底变革人们的工作、学习和生活方式。
目前,我国DSP 产品主要来自海外。TI公司通过提供DSP 培训课程,不断
扩大市场份额,现约占国内DSP 市场的90%。全球有数百家直接依靠TI而成立
的公司,称为Tl的第三方(ThirdParty)。它们有做DSP 开发工具的,有从事 DSP
硬件平台开发的,有从事 DSP 应用软件开发的。这些公司基本上是 20世纪 80
年代末、90年代初才建立,开始时往往只有几个人,经过5年到10年,现在均
发展到相当规模[2]。相对国外DSP 应用开发的情况,国内起步比较晚,差距比较
大。近年来,在一些专业 DSP 用户的推动下,我国DSP 的应用日渐普及。清华
大学、北京大学、西安交通大学、华中科技大学等几十所院校已经建立了专业DSP
实验室,这必将促进 DSP 在我国的应用与发展,加快信息产业与国际接轨的进 程。
互联网是后PC时代全球新的增长点,也是DSP 潜在的应用领域。而手机、
PDA、MP3 播放机以及笔记本电脑则是设备个性化的典型代表。这些设备的发 展水平取决于DSP 的发展。新的形势下,DSP 面临的要求是处理速度更高,性
能更多更全,功耗更低,存储用量更少。
3
大学本科毕业论文 第一章 绪论
1.3各章安排
本文分为四章,各个章节内容安排如下。
第一章为绪论。概括了课题的研究背景,DSP应用领域和国内外的发展现状 。
第二章为最小系统的总体设计部分。首先明确系统要实现的功能,然后确定 系统设计的流程,最后,规划了系统的组成,并对DSP 主芯片进行了介绍。
第三章为方案的硬件实现。系统全面的介绍各模块的组成、芯片的功能、具 体电路的实现。并对电路板设计的流程及制作时应遵守的原则做了详细介绍,对 电路调试过程中出现的问题给予分析。
第四章概括了软件调试的方法,并对程序存储空间配置文件和测试程序进行 了详细阐述。最后,介绍了软件测试的注意事项。
4
大学本科毕业论文 第二章 总体设计
第二章
总体设计
1.1系统要实现的功能
DSP 最小系统板设计是本次毕设的主要任务,课题以TMS320VC5402 为核
心器件,并利用CPLD 电路对最小系统电路进行扩展。在介绍 TMS320VC5402
基本特点的基础上,借鉴国内外现有技术成果的,研究 DSP 相关技术,开发出 DSP 最小系统板。
系统要实现以下功能。 1.最小系统部分的设计
能够用于基本的数字信号处理,运行一些简单的程序。此部分主要包括电源 模块、复位电路、拨码开关、时钟电路、JTAG 接口的设计。
2.扩展电路的设计
对于DSP 最小系统,DSP芯片等在芯片出厂时不可能让片内存储器的大小
满足所有功能的要求 ,如果将片内存储器做太大,必然造成芯片成本的提高, 而太大的片内存储器对很多用户来说是浪费。但对于特定的用途,如用于图像处 理,由于一幅图像需占用很大的存储空间,这样片内存储器就显得太小,所以如 果想通过CPLD 进行功能扩展,只有进行存储器扩展。此部分主要包括CPLD 电
路、FLASH 电路、SRAM 电路。
2.2系统的设计流程
一般来说,在DSP 系统设计和开发之前,设计者需对所设计系统的应用有
清楚的了解,首先应该定义所有应用要求,包括信号处理和非信号处理需求(可
靠性、应用环境、可维护性、功耗、重量、体积、成本等)。然后,分析要处理
的输入信号特性和所要求的处理结果。接着根据处理的要求选择 DSP 芯片,并 对DSP 所需的资源进行分析,得到最后的系统配置,之后就可以进行具体的应
用设计了。
一个DSP 应用系统的设计过程大致分为以下几个部分,各部分的相互关系
如图2-1所示。
5
大学本科毕业论文
系 统要 求的 描述
第二章 总体设计
确定DSP芯片及外围设备
总体设计 确定软硬 件分工
软 件设 计与 调试
硬件 设计 与 调试
系 统 测 试
图 2-1 DSP应用系统的设计过程
1.系统要求的描述
这一部分主要根据毕设的要求,提出一组技术要求和相关说明。对于本文所 设计的DSP 最小系统来说,其实质就是一个DSP 应用系统,由DSP芯片及其外
围电路组成,能够完成信号的实时处理,给出处理结果,并具有一定扩展性。最 终要求系统能够运行。
2.DSP 芯片及其外围芯片的选型
DSP 是整个处理系统的核心,所以选取何种型号的DSP 芯片对DSP系统的
整体功能实现是至关重要的。一般来说,DSP芯片型号的选取主要考虑所处理信
号的频率、RAM 的大小、系统对实时程度的要求及系统所要求的精度等技术指 标。充分考虑上述技术指标,可以大致确定应选用的 DSP 芯片的型号。根据系 统整体实现功能以及所选用的DSP 芯片,就可以初步确定电源、时钟、存储器
等其他外围芯片的型号。当然在芯片的选型时还需考虑成本、体积、功耗、供货 能力等因素。基于上述芯片选型的思路,本文对于系统的 DSP 外围芯片和扩展 电路的选型将在第三章介绍。
3.系统总体设计确定软硬件分工
在选定合适的DSP 芯片之后,应当先进行系统总体设计。
4.系统的硬件电路设计与调试
DSP 系统的硬件电路设计涉及到较多的电路设计技术,一般包括存储器接口 电路、电源电路、仿真器接口电路设计及其他相关的硬件电路设计。系统硬件电 路的设计将在第三章重点介绍。在系统硬件组成方案及芯片选型之后,就可以进
6
大学本科毕业论文
第二章 总体设计
行电路原理图及电路板的设计,电路板完成之后对系统硬件电路进行调试。
5.系统的软件程序设计与调试
本部分的任务是完成系统的软件设计与调试。目前,大多数 DSP 器件都提 供完善的开发工具和开发环境,基于DSP 器件的信号处理程序的调试只有在相
应的开发工具支持下才能完成。本文的软件调试部分将在第四章详细说明。
6.系统测试
当所有硬件和软件设计完成后,最后将系统的各个部分集成为一个整体,进 行实际的运行测试。只有通过实际的调试才能发现系统板的不足。如果不能满足 本次毕设的要求,则需要对硬件或软件进行相应的修改
2.3原理框图
开发板采用了以TMS320VC5402 为主芯片DSP 系统,可以用于教师指导下
的本科入门级开发平台和辅助培训工具,板上有可编程逻辑资源和外设接口,如 接上各种扩展芯片,可满足各种数字信号处理的要求。
根据各项要求以及要实现的功能,其硬件原理框图如图2-2。
复位 电 路 和 拨
码 开 关
程 序 存 储 器
A( 0-18)D( 0-15 )
数 据 存 储 器
电 源 模 块
1.8V、3.2V
TMS320VC5402
C P LD 模 块
J T A G
20MHz
晶
振
图2-2 最小系统原理框图
2.4 最小系统主芯片介绍
2.2.1TMS320VC5402的软件资源
1.丰富的指令系统
TMS320 的汇编语言指令集特别适合于数字信号处理,所有指令占一个机器
7
大学本科毕业论文 第二章 总体设计
字长,大部分指令是单周期的。指令集共有113 条指令,可以分为六类。数据传
送类、二操作数算术/逻辑类、二操作数算术/逻辑类、程序控制类、互锁操作类
及并行操作类。12条数据传送指令可从存储器中读一个字装入寄存器,将一个
字从寄存器中存入存储器中及进行堆栈操作。二操作数指令有35条,提供整数、
浮点、逻辑运算及多精度算术操作。17条三操作数指令可以在一个指令周期内
完成具有三个操作数的运算,其中两个是源操作数,另一个是目的操作数。程序 控制指令共16条,它们影响程序的流向,其中有块重复指令 RPTB和单指令重
复指令 RPTS 除了有标准跳转指令外,还有延迟跳转指令,有些指令具有条件
运算功能。5条互锁操作指令主要用来进行多处理器之间的通信。剩下的 2
指令都是并行操作指令,每条并行指令由两条指令用符号“‖”连接,并行操作指 令可使“‖”前后的两条指令并行完成。
2.灵活的程序控制
TMS320 提供相当灵活的程序流控制。软件的程序控制包括重复、跳转、调 用、陷阱及返回等。TMS320 重复方式可以实现无开销循环。块重复指令RPTB
可以使一块代码重复执行指定的次数,而单指令重复指令 RPTS 使一条指令重 复执行指定的次数,由于RPTS 取址次数只有一次,因此减少了总线冲突的机会 。
两者有个区别是,RPTS 指令禁止中断,而RPTB无此禁忌。因此在需要中断的
场合,采用RPTB指令代替RPTS 指令。
TMS320 提供两种类型的跳转,即标准跳转和延迟跳转。标准跳转首先将流 水栈清空然后执行跳转,这可保证程序计数器的正确管理,但却使跳转指令需 4 个周期才能执行完毕。延迟跳转则相反,它并不将流水线清空,而是保证在程序 跳转之前执行它下面的3条指令,这样使得跳转指令本身仅需1个指令周期。当
然有些指令(如CALL,RPTB等)不能出现在延迟跳转指令下面的 3条指令。延
迟跳转指令在它下面3条指令完成前禁止中断。
3.流水线操作
流水线操作是TMS320 所具有高性能特性之一。流水线操作是一个基本指令
的预取值、取值、译码、寻址、读操作数和执行的并行操作。每条流水线之间彼 此,在任何一个机器周期内可以有1至6条不同的指令在同时工作,每条指
令工作在不同的流水线上,使指令的执行时间减小到最小和增大处理器的吞吐 量。
4.寻址方式多样
TMS320VC54X 支持7种数据寻址方式,即立即寻址、绝对寻址、累加器寻
[3]
址、直接寻址、间接寻址、存储器映射寄存器寻址、堆栈寻址 。
8
大学本科毕业论文 第二章 总体设计
2.2.2TMS320VC5402的硬件资源
不同的DSP 芯片所提供的硬件资源是不相同的,如TMS320VC5402 CPU的
结构,片内 RAM、ROM数量外部可扩展的存储空间、总线接口、I/O 接口等。
即使是同一系列的DSP 芯片,如TI 的TMS32054X 系列,也具有不同的内部硬
件资源。本系统使用的TMS320VC5402 是TI 的第七代DSP 产品之一,它具有
优化的CPU结构,内部有1个40位的算术逻辑单元(包括一个40位的桶式移位
寄存器和2个的 40位累加器),一个 17×17的乘法器和一个40位专用加法
器,16K 字RAM 空间和4K×16bit ROM空间。共 20根地址线,可寻址 K 字
数据区和1M字程序区,具有K I/O 空间。处理速度为l00MIPS,速度高、功
耗低。
TMS320VC5402 采用修正的哈佛结构和 8总线结构(4 条程序/数据总线和4
条地址总线),以提高运算速度和灵活性。在严格的哈佛结构中,程序存储器和 数据存储器分别设在两个存储空间,这样,就允许取址和执行操作完全重叠。修 正的哈佛结构中,允许在程序和数据空间之间传送数据,从而使处理器具有在单 个周期内同时执行算术运算、逻辑运算、位操作、乘法累加运算以及访问程序和 数据存储器的强大功能。与修正的哈佛结构相配合,TMS320VC5402 还采用了
一个 6 级深度的指令流水线,每条流水线之间彼此,在任何一个机器周期 内可以有1至6条不同的指令在同时工作,每条指令工作在不同的流水线上,使
指令的执行时间减小到最小和增大处理器的吞吐量。
TMS320VC5402 的硬件结构具有硬件乘法器、8总线结构、功能强大的片内
存储器配置和低功耗设计的特点。因此,可以进行高速并行处理,同时,集成度 高可节省硬件开销,提高系统抗干扰性。它除了完成数字信号处理任务外,还可 以兼顾通用单片机的操作任务,因此,它是集数字信号处理与通用控制电路于一 体的多功能低功耗微处理器[4]。
下面对TMS320VC5402 CPU结构、存储器、片上外设等主要资源说明如下。
1.CPU结构
TMS320VC5402 的CPU基本组成如下。40位算术逻辑运算单元(ALU),大
多数算术逻辑运算指令都是单周期指令。ALU 的输入端的数据来自移位寄存器 的输出或数据总线DB的数据存储器操作数。除存储操作指令(ADD、ANDM、
ORM 和XORM)外,ALU 的运算结果通常都被传送到目的累加器(累加器 A
或B)。ALU 还可通过状态寄存器ST1的OVM位的设置,可进行溢出处理;通
过C16状态位的置位,进行双16位算术运算。
2个40位累加器(A 和B)。累加器A 和B都可以配置成乘法器/加法器或
ALU 的目的寄存器。此外在执行MIN(MAX)指令或并行指令LD‖MAC时都
9
大学本科毕业论文 第二章 总体设计
[5]
要用到ALU,这时,一个累加器加载数据,另一个完成运算 。
乘法器/加法器单元。乘法器能够执行无符号数乘法、有符号数乘法以及有 符号数与有符号数相乘运算。乘法器/加法器单元中的加法,还包含一个零检测 器、舍入器(2的补码)以及溢出/饱和逻辑电路。乘法器的一个输入端来XM的数
据来自T寄存器、累加器A 的32-16以及由DB总线和传过来的数据存储器操作
数;另一个输入端YM的数据来自累加器A 的32-16以及由DB 总线和CB总线
传过来的数据存储器操作数以及由PB总线传过来的程序存储器操作数。乘法器
的输出加到加法器的输入端 XA,累加器A 或B则是加法器的另一个输入。最后
结果送往目的累加器A 或B。
比较、选择和存储单元(CSSU)。比较、选择和存储单元是专门为 Viterbi
算法设计的进行加法比较/选择运算的硬件单元。
指数编码器。指数编码器是用来在单个周期内执行 EXP指令的专用硬件。
CPU状态和控制寄存器。TMS320VC5402 有三个状态和控制寄存器,分别
是状态寄存器 0 (ST0)、状态寄存器 1(ST1)和处理器工作方式状态寄存器
(PMST)。ST0和 ST1包含各种工作条件和各种工作方式的状态。PMST 中包含
存储器的设置状态及其他控制信息。由于这些寄存器都是存储器映像寄存器,所 以都可以快速的存放到数据存储器,或者由数据存储器对它们加载,或者用子程 序或中断服务程序保存和恢复处理器的状态。
ST0、ST1和PMST的结构分别如图2-3、2-4、和2-5所示 [6] 。
15- 13
1
2
1
1 C 1
0
9
O V B 8 - 0
A R P TCO V A DP
图 2-3 状态寄存器0(ST0)
1 5
1
4
1 3
1 2
1
1
1 0
9
O V M 8
S X M 7
C 1 6 6
F RCT 5
CM PT 4 - 0
BRA F C P L XF H M INT M O A S M
图2-4 状态寄存器1(ST1)
图2-5 处理器工作方式状态寄存器 (PMST)
1 5 - 7 I P T R 6
MP/# MC 5
O V LY 4
A VI S 3
DR O M 2
CLKOFF 1
SMUL* 0
S S T*
10
大学本科毕业论文 第二章 总体设计
综上所述VC5402的CPU 结构特征如下。
(1)具有高性能的改进的哈佛总线结构,即具有三条的16bit数据存储器
总线和一条16bit 的程序存储器总线。
(2)具有一个 40bit 的算术逻辑单元,包括一个 40bit 的筒形移位器和两个独 立的加法器。
(3)17×17bit 的并行乘法器与专用的40bit加法器相结合。
(4)具有专用于 Viterbi 蝶形算法的比较、选择、和存储单元(CSSU)。
(5)指数译码器可以在一个指令周期内求一个 40bit 累加数的指数值,这里的 指数定义为累加器中没有数据占用的位数的个数减去8。
(6)两个地址发生器、八个辅助寄存器和两个辅助寄存器算术单元(ARAU)。 2.存储器
H E X
程序 存储器
0000
程 序存储 器
00 00
数 据存储 器
00 00
(OVLY=1)
保
留
保
(OVLY=1)
留
存储
器
外
008O
OO 7F
(OVLY=0)
部
外
0080
007F
(OVLY=0)
部
0060
00 5F
映 射存储 器
0080
00 7F
暂存
器
片
内
(OVLY=1)
DARAM
片
内
(OVLY=1)
DARAM
片内DARAM
(16K字)
(OVLY=0)
外
部
(OVLY=0)
外
部
3F FF
3FFF
外
3F FF
外
40 00
4000
40 00
部
EF FF
部
EFFF
片内ROM
或外部(DROM=1) ROM(DROM=1)
外
部
1000
F0 00
FF80
FF 7F
中 断 向 量
FF00 FF7F FF80
FEFF
(4K字)
保
留
FF00
FE FF
保留(DROM=1)
或外部(DROM=1)
中 断 向 量
FF FF
FF FF
MP/#MC=1
FFFF
MP/#MC=0
图2-6 VC5402DSP的存储器空间分配
11
大学本科毕业论文 第二章 总体设计
VC5402的扩展后的总存储空间能达到1152K 字,分成3个可选择的存储空
间 。1024K 字的扩展程序存储空间、K 字的数据存储空间和 K 字的 I/O 空间 。
程序存储器空间存放要执行的指令和执行中所用的系数表。数据存储器存放执行 指令所要用的数据。I/O 存储空间与存储器映像外围设备相接,也可作为数据存 储空间使用。
TMS320VC5402 的片内存储器为 4K 字ROM 和两个 16K 字的DARAM(双
寻址RAM)。通过工作方式寄存器PMST寄存器中的状态位MP/ MC位、OVLY
位、DROM 位来决定“使能”和“禁止”程序和数据空间中的这些片内存储器。这三
个状态位的具体情况如下。
(1)CPU 工作方式控制位 MP/ MC 决定4000H-FFFFH程序存储空间的片内、
片外空间分配。 MP/ MC=1,4000H-FFFFH程序存储空间全部定义为片外存储
器;MP/ MC=0,4000H-FEFFH 程序存储空间定义为片外存储器,FF00H-FFFFH
程序存储空间定义为片上存储器。
(2)OVLY 位决定 0000H-3FFFH 程序存储空间的片内、片外分配控制。
OVLY=1,0000H-007FH 保留,程序无法占用。0080H-3FFFH定义为片内DRAM;
OVLY=O,0000H-3FFFH 全部定义为片外程序空间。
(3)DROM 位决定片内ROM 能否安排到数据空间。若DROM=1,则部分片
内ROM 安排到数据空间;若DROM=0,则部分片内ROM 不安排到数据空间。
上述3个状态位包含在处理器工作方式PMST中。下图给出了VC5402的数
[7]
据和程序存储区图,并说明了MP/ MC,OVLY以及DROM 3个状态位的关系 。
TMS320C54x 系列DSP 内部均带有一定数量的高速物理存储空间,在实时
性要求很严格的应用系统中,应尽量将程序和数据存放在内部物理存储区中,而 且尽可能地将数据区定义在内部双访问 RAM(DARAM)中.程序区可定义在内部
单访问RAM (SRAM),DARAM 或是ROM 中,一些查找表或是初始化数据也可
以放在程序区中。因为对于程序区常常只有读操作,而对于数据区往往可以同时 存在有读操作和写操作,所以数据区尽可能定义在 DARAM 中。对片内物理存
储器的访问是通过访问映射寄存器来实现的,也就是说,片内物理存储器必须被 映射到映射存储器上才能被访问。
DSP 系统的映射存储器分为三块区域,分别称为程序区、数据区和 I/O 区。
一般来说,I/O 区是片外资源,访问空间大小为K 字,而且这两个区域常常是
不能被扩展访问。程序区分为基本程序区和扩展程序区,显然是可以被扩展的。 基本程序区的访问空间也是K 字,对于不同的DSP 芯片,扩展能力不同。对
于TMS320VC5402 来说,最大扩展访问空间为 1024K 字。可见 DSP 系统的映
射存储器代表了 DSP芯片的一种寻址能力和可访问空间的大小,在没有对映射
存储器配置前,这些映射存储器空间也是虚拟的,是不能用来存储程序和数据的 。
12
大学本科毕业论文 第二章 总体设计
所以在DSP 程序的编译和汇编之后,连接成目标文件之前,必须加入存储器配
置文件(.cmd),将实际的物理存储区空映射到映射存储器空间上。
TMS320VC5402 仅提供了4K 字的片上 ROM 和16K 字的片上 DARAM,
DARAM 由两块 8K字的区块组成,每一个区块均可在一个指令周期内完成两次
读操作或一次读和一次写操作。映射存储器的配置受到TMS320VC5402 外部管
脚 MP/ MC 以及处理器模式状态寄存器 PMST 的控制。常采用的方案是
MP/ MC =0且 OVLY=1的情况,其中OVLY 为16bit 寄存器 PMST 的第 5位。
当TMS320VC5402 上电硬复位且MP/ MC=0时,片上物理ROM 会映射到程序
映射存储器的FF00h至FFFFh地址范围内,芯片会自动调用片上ROM中固化的
Boot Loader 程序。VC5402 具有 20 条地址线,映射程序空间最大为 16 页
(K×16bit/页),即1024K×l6bit的空间大小。当OVLY=1时,第1页至第15页
的低端16K 字是映射到第0页上的相应地址处;当 OVLY=0时,这些页是
[8] 存在的 。
3.片上外设
(1)具有软件可编程的等待状态发生器、可编程的块切换等待状态寄存器。 (2)具有并行I/O 口。
(3)具有一个增强的8bit 主机接口(HPI)。
(4)具有两个多通道缓冲串行口(MCBSP)。 (5)具有两个硬件计时器。
(6)具有一个带有锁相环((PLL)的时钟发生器。
13
大学本科毕业论文 第三章 DSP最小系统硬件设计
第三章
DSP 最小系统硬件设计
1.1PROTEL 工具简介
随着科学技术的发展,现代电子工业也取得了长足的进步。大规模,超大规 模集成电路的应用使印刷电路板日趋精密和复杂。为了解决这个问题,各类电路 CAD 软件应运而生,PROTEL就是这类软件的杰出代表。
[9]
Protel99SE 由两大部分组成:电路原理图设计(AdvancedSchematic)和多
层印刷电路板设计(AdvancedPCB)。
原理图设计主要用于电路原理图的设计,为印制电路板的设计打好基础。 印刷电路板的设计主要用于印制电路板的设计,产生最终的PCB文件,直
接联系到印制电路板的产生。
3.2 使用Prottel99 SE 进行电路设计的流程
电路设计是指实现一个电子产品从设计构思、电学设计到物理结构设计的全 过程。电路设计中,我们使用的 PDA 软件是 Protel99SE 。在Protel 99SE中 ,
设计电路板的完整过程有以下几个步骤。其中,有些步骤可以跳过,视设计需要 而定。本文中的电路板设计主要包括以下的三个步骤。
1.电路原理图设计
电路原理图设计主要是利用Protel99SE的原理图设计系统绘制一张电路原
理图。在这一步中,可以充分利用其提供的各种原理图绘图工具、丰富的在线库 以及便利的电器规则检查,来达到设计目的。
2.产生网络表及其他报表
网络表是电路板设计自动布线的灵魂,也是原理图设计与印制电路板设计的 主要接口。网络表可以从电路原理图中生成,也可以从印制电路板中提取。其他 报表则存放了原理图的各种信息。
3.印制电路板(PCB)设计
印制电路板设计是电路设计的最终目的。利用 Protel99SE实现电路板的版
面设计,完成布线以及输出各报表等工作。
概括的说,整个电路板的设计过程线是编辑电路原理图,接着用电路信号仿
14
大学本科毕业论文
第三章 DSP最小系统硬件设计
真进行验证调整,然后进行布板,再人工布线或根据网络表进行自动布线,完成 PCB的设计。
3.3 电路原理图设计
电路原理图设计分以下几步进行。 1.设置图纸大小
根据实际电路的复杂程度来设置图纸大小,设置图纸大小实际是一个建立工 作平面的过程。
2.放置元件
用户根据实际电路的需要,从元件库里取出所需要的元件放置到工作平面 上。可以根据元件之间的走线等联系对元件的位置进行调整、修改、对元件的编 号、封装进行定义和设定。
3.原理图布线
利用Protel 99SE提供的工作工具、指令进行布线,将工作平面上的器件用
具有电气意义的导线、符号连接起来,构成一个完整的电路图。
4.编辑与调整
对所绘制的原理图进行进一步的调整和修改,使原理图正确和美观,包括加 入文字说明,对元件位置的调整、导线的移动和删除、更改图形尺寸与属性等等 。
5.原理图的输出
将设计完成后原理图保存或输出打印,以供存档。原理图编辑完成后即可以 利用Protel99SE中的相关工具生成网络表以及其他报表。利用网络表即可进行
下一步PCB的设计。进行PCB设计时,利用网络表进行自动布线。若采用手动
布线,网络表也可以用来方便的进行错误检查。
3.4TMS320VC5402最小系统设计
3.2.1电源模块
包括 TMS320VC5402 在内的 TMS320C54X 系列DSP 大部分采用低电压供
电方式,可以大大降低DSP 芯片的功耗。TMS320C5402 的电源分两种,即内核
电源(CVDD)和I/O 电源(DVDD)。其中 I/O 电源一般采用3.3V电压而内核电源分为
2.5V 或更低,降低内核电压的主要目的是降低功耗。TMS320VC5402 的内核电 压为1.8V。下面介绍TMS320VC5402 的电源设计。
1.电源电压结构及要求
15
大学本科毕业论文 第三章 DSP最小系统硬件设计
TMS320VC5402 采用了双电源供电机制,以获得更好的电源性能,其工作 电压为3.3V 和1.8V。其中,1.8V 主要为该器件的内部逻辑提供电压,包括CPU
和其他所有的外设逻辑。与3.3V供电相比,1.8V供电大大降低功耗。外部接口
引脚仍然采用3.3V 电压,便于直接与外部低压器件接口,而无需额外的电平变
换电路。
TMS320VC5402 的电流消耗主要取决于器件的激活度,CVDD消耗的电流主
要决定于CPU的激活度。外设消耗的电流决定于正在工作的外设及其速度。与
CPU 相比,外设消耗的电流是比较小的。时钟电路也需要消耗一小部分电流, 且这部分电流是恒定的,与CPU 和外设的激活程度无关。CVDD为器件的所有内
部逻辑提供电流,包括CPU、时钟电路和所有外设。DVDD只为外部接口引脚提
供电压,消耗电流取决于外部输出的速度和数量,及在这些输出口上的负载电容 。
[10]
如图3-1所示,电源芯片选用TPS767D318 ,该电源芯片可以由5V 产生
3.3V 和1.8V的电压输出,最大输出电流为1000mA,可以满足TMS320VC5402
最小系统的需要。
图3-1 电源控制电路
3.2.2 复位、拨码开关和时钟电路
复位输入引脚 RS 为TMS320VC5402 提供了硬件初始化的方法。这个引脚
上电平的变化可以使程序从制定的存储地址 FF80H开始运行。当时钟电路工作
后,只要在RS 引脚上出现两个外部时钟周期以上的低电平,则芯片始终处于复
位状态。对于一个 DSP 系统而言,上电复位电路虽然只占很小的一部分,但它 的好坏将直接影响系统的稳定性。
16
大学本科毕业论文
第三章 DSP最小系统硬件设计
DSP 要求在复位信号从低到高之前,时钟必须已经稳定工作了若干时间(毫
秒级),同时对复位信号低电平的宽度也有要求,而且复位信号上不应有毛刺出 现,因此采用图3-2所示的电路。
此拨码开关的作用主要有两方面。
1.设置MP/ MC,以决定4000H-FFFFH程序存储空间的片内、片外空间分
配。
2.设置CLKMD1、CLKMD2、CLKMD3三个引脚,以控制PLL电路。
图3-2 复位模块、拨码开关与 DSP 的连接图
TMS320VC5402 提供了两个时钟管脚X2 和Xl。X2 又称CLKIN,是一个输
入管脚,而X1 是一个输出管脚,其时钟发生器允许设计者选择时钟源。一是在
X1 和X2/CLKIN之间接一晶振来启动DSP 内部晶振,如图3-3所示,二是将外
部时钟直接接到时钟管脚X2, X1悬空,如图3-4所示。本系统采用图3-3所示
的时钟电路,选用的晶振M1为20MHz。
图3-3 典型时钟电路
17
大学本科毕业论文 第三章 DSP最小系统硬件设计
图3-4 典型时钟电路
DSP 内部设计的时钟和分频电路,可以直接将内部和外部的时钟分频,作为 DSP 的系统时钟,这种模式称为DIV 模式。另外,DSP 内部设计有锁相环(CPLL)
电路,使用外部连接的时钟时,外部时钟频率可以选择得比较低,以降低噪声, 而外部时钟输入后,再通过内部PLL信频到所需的工作频率。
PLL 电路的启动有两种方式。 1.硬件控制
可以通过 DSP 的CLKMD1、CLKMD2、CLKMD3 三个引脚来设置,DSP
上电复位时,根据此三条引脚的电平,设定PLL 的工作状态,并启动PLL工作。
2.软件编程控制
通过读写 DSP内部的时钟模式寄存器(CLKMD)可以完成 PLL电路的设定。
要改变PLL的倍率,必须先把时钟模式从 PLL模式切换到DIV 模式,然后再切
换到新的倍率的PLL模式。不允许从一种PLL倍率直接切换到另一种PLL倍率 。
表3-1为VC5402 时钟模式设定。
表3-1 时钟模式设定
CLKMD1 CLKMD2 CLKMD3 0 0 0 CLKMD RESET VALUE 0000H 9007H 4007H 1007H F007H 0000H F000H —— 18
CLOCK MODE 1/2(PLLdisable) 0 0 1 PLL×10 PLL×5 PLL×2 PLL×1 1/2(PLLdisable) 0 1 0 1 0 0 1 1 0 1 1 1 1 0 1 1/2(PLLdisable) 0 1 1 Reserved(Bypassmode)
大学本科毕业论文 第三章 DSP最小系统硬件设计
3.5扩展电路设计
3.5.1CPLD 电路
在进行DSP 系统设计时采用CPLD 来实现DSP和其他外围芯片的接口电路
的优点主要是硬件设计简单,因为CPLD 的管脚具有重定义的功能,这使得 PCB
板的设计要简化很多。同时因为MAX7000 系列CPLD 的功能比较强大,可以很
容易实现地址译码、等待时序的插入等,一般用一块CPLD 就可以实现系统所有
的接口电路。在此设计中,采用 MAX7000系列的 EMP7128LC84 CPLD 芯片主
要完成地址译码。图3-5为EMP7128LC84 与DSP 连接图。
图3-5 EMP7128LC84 与DSP 连接图
19
3.5.2FLASH 的扩展
大部分的DSP程序存储器空间都采用了分页扩展存储器的方式,这样允许
大学本科毕业论文 第三章 DSP最小系统硬件设计
访问多达1M的程序存储器空间。
XPC是存储器映射寄存器,映射到数据空间的001E地址,它的值决定页号 。
在硬件复位时,XPC被初始设置为0。TMS320VC5402的程序存储器被设置为128
页,每一页为K 字。
当片内RAM 映射到程序空间时(OVLY=1),程序存储器的每一页由两部分
组成,为最多32K 字的公共块和32K 字的私有块。公共块被所有的页共享,私
有块只能通过它所在的页来访问。
本设计采用 FLASH 存储芯片是 AMD公司生产的 256K字的Am29LV800,
该芯片支持单电源工作,可分为满负荷电压供电(2.7-3.6V)和电压范围可调节供
电(3.0V -3.6V)两种方式。可以直接与3.3V 的DSP 器件连接,简化了系统的接
口电路。芯片读取周期短,最快读取时间为 55ns。功耗低,有200nA 自动睡眠
和待命方式电流,而且具有块保护等特点。其电路原理图如图3-6所示。
图3-6 FLASH Am29LV800与DSP的连接
Am29LV800 运用相当普遍,在众多的DSP 板上都可以看到。它支持在线电
20
大学本科毕业论文 第三章 DSP最小系统硬件设计
擦写,FLASH 中程序可以在线编程,无须离线用专门的编程器来编程。
DSP 的A0~A18 和FLASH 的地址线A0~A17 相连接,16位数据总线也互相
连接,采用分页存储的方式实现存储。控制端口通过CPLD 产生逻辑来实现。在
该设计当中,DSP的地址总线的 A15 位并没有连接,这样做的目的就是为了更
好的实现分页存储。
在设计初期,就决定采用 DSP 的微处理机模式,即 MP/ MC=0。这样,片
内ROM 被使能,只能放在第零页上,32K 的公共块就被所有页共享。只有私有
块才可以用来存储程序。DSP 的A15 不起作用,即的把存储器分为大小K 字
的存储块,由于公共块被映射到片内ROM,所以就实现了公共块共有,私有块
分页的存储方式。分页通过A16、A17、A18这三个引脚来实现。正好可以分为
八页。其示意图如图3-7所示。
A18 A17 A16 A15 A14 ………………………………A0
0 0 0 0 0 ………………………………0
0 0 0 0 1 ………………………………1 0 0 0 1 0 ………………………………0
0 0 0 1 1 ………………………………1
0 0 1 0 0 ………………………………0 0 0 1 0 1 ………………………………1
0 0 1 1 0 ………………………………0
0 0 1 1 1 ………………………………1
图3-7 程序存储器接法示意
A15 无效,只有A14~A0可以辨别地址,A18、A17、A16控制页面。
在进行连接的时候,最好把空脚根据一定的规则连接上,因为4种不同容量
的 FLASH 引脚兼容,这样可以方便根据不同的要求选择使用不同容量的
FLASH。
3.5.3SRAM 的扩展
TMS320VC54 系列的 数据 存储器最 多包 含
字。除 了双 存取
RAM(DARAM)和单存取RAM(SARAM)以外,TMS320VC54 系列器件片
内ROM 可以用软件映射成数据ROM(DROM)。
当访问地址属于片内存储器时,就可以进行 RAM或数据ROM(在其有效
的情况下)的访问。当数据地址产生器产生一个超出片内存储器范围的地址时,
21
大学本科毕业论文 第三章 DSP最小系统硬件设计
器件自动产生一个外部访问。
所有TMS320VC54 系列DSP 中的第一个DARAM的第一个1K字存储器中
包含了存储器映射CPU和外设寄存器、32K字的便笺式DARAM 和6个字的
DARAM。在设计当中,为了保证数据存储器绝对够用,必须外扩一个数据存储 器。本设计选用IS61LVTH25616 这一款芯片。它是可以在字节和字之间进行切
换存储的一种高速数据存储器,通过它自身的BHE和BLE 两个引脚来控制,当
BHE和BLE两个引脚同时为低点平的时候,采用以字为单位的存储方式,当BHE
或者BLE任意一个为低电平时则选通其中的高八位或者低八位。由于这里扩展
了256字的SRAM,分配块也是要解决的问题。其硬件连接如图3-8所示。
图3-8 SRAMIS61LV25616与DSP 连接图
该SRAM 为256K 字,一部分用于程序的缓存,一部分用于存储采集的数据 。
由于在数据存储空间,总共只有 32K 字的空间用于外部数据存储器的扩展,通 过使用分页的方式,可以实现大容量的数据存储器的扩展。在该设计当中,
22
大学本科毕业论文 第三章 DSP最小系统硬件设计
A0~A14 和DSP 的地址总线的A0~A14 相连接,通过对A15、A16、A17进行逻
辑控制实现分页,以及程序和数据存储部分的区分。其详细方式如下。
根据要求,如果要把这么大的SRAM 分配好,最简单的方法就是通过程序
存储器空间分配SRAM。这里简单介绍一种分配方式,例如要求把 256K字的
SRAM 分成128K 用于数据存储,另外128K字用于程序存储。相应的,根据分
页原理,每一页32K字,第一页地址为8000H~FFFFH,第二页为18000H~1FFFFH,
第三页为28000H~2FFFFH,依次类推。相应的,地址总线上出现的对应电平如
图3-9所示。
图3-9 数据存储器接法示意
在图 3-9中,A18、A17、A16、A15 分别代表 DSP 地址总线上的地址线,
相对应的P3、P2、P1则分别代表IS61LV25616上的高位:A17、A16、A15。可
以假设,把256K 分成八页,一到四页分给数据存储器,五到八页分给程序存储
器。在进行逻辑控制的时候,输入端要求地址总线A0~A18、PS、DS、MSTRB、
IOSTRB、IS、R/W 等等,图3-9可以通过编程方式实现,这里采用VHDL语言
实现。
libraryIEEE;
use IEEE.STD_LOGIC_11.ALL; use IEEE.STD_LOGIC_ARITH.ALL;
use IEEE.STD_LOGIC_UNSIGNED.ALL;
entityMEMORY is
Port( ABus : in STD_LOGIC_VECTOR (3downto 0);
PS: in STD_LOGIC;
DS : in STD_LOGIC;
BBus : out STD_LOGIC_VECTOR(2downto 0));
endMEMORY;
23
大学本科毕业论文
第三章 DSP最小系统硬件设计
architecture MEMORY of MEMORY is
begin
process(ABus,ps,ds) begin
if(ps='0')and(ds='1') then
caseABus IS
when\"0001\"=>BBus<=\"000\"; when\"0011\"=>BBus<=\"001\"; when\"0100\"=>BBus<=\"010\";
when\"0111\"=>BBus<=\"011\"; whenothers=>null; endcase;
elsif(ps='1')and(ds='0') then
caseABus IS
when\"1001\"=>BBus<=\"100\"; when\"1011\"=>BBus<=\"101\"; when\"1101\"=>BBus<=\"110\";
when\"1111\"=>BBus<=\"111\"; whenothers=>null; endcase; endif;
endprocess; endMEMORY;
利用VHDL 语言实现了程序存储器和数据存储器在SRAM 里的区分,在另
外的诸如读写使能,以及片选可以通过 DSP 的读写以及MSTRB等引脚实现,
其相关原理图如图3-10所示:
图3-10 读写逻辑控制
24
大学本科毕业论文
第三章 DSP最小系统硬件设计
在图3-10中,通过R/W,MSTRB 实现高低电平的逻辑控制,片选信号可以
直接通过MSTRB给出,也可以通过PS,DS 进行与动作之后给出。个人觉得直
接采用MSTRB给出效果更好。
3.6 印刷电路板的设计流程
前面介绍了开发板电路原理,接下来主要介绍利用原理图设计工具绘制原理 图,并且生成对应的网络表,直接进入PCB设计系统,在PCB设计系统中,可
以直接去用零件封装,人工生成网络表,然后进入印制电路板的设计。
本文绘制印刷电路板采用的软件是Protel 99SE,选用一块两层电路板。
PCB的设计流程分为设计准备、网表输入(由原理图设计 Protel99SE 中得
到)、规则设置、元器件布局、布线、检查、复查、输出八个步骤。
1.PCB设计准备
(1) 标准元件的装载
标准元件可以直接从库中调出来使用。 (2) 特殊元件的建立
物理元件可看成是电子器件的封装尺寸在 PCB上的一个平面映象,设计前
要考虑布线及生产工艺的可行性。由于布线时需要在两引脚之间走线,这就要求 焊接元件引脚的焊盘有一个合适的尺寸。如果孔径过小,可能会造成焊接上的困 难。
对于特殊元件即非标准物理元件的尺寸,必须查阅相关资料或对电子器件进 行外形尺寸、焊盘大小、引脚序号排列等实际测量。在 Protel 99SE中,选择
File→Library,在此对话框中选择Decals,然后点击New,即可建立所需要的新
元件。然后将其保存到原有的或新建的Library中即可。
(3) 具体印刷板设计文件的建立
有了网络表、物理元件库和PCB板形的描述,就可以对某一块PCB板进行
具体设计了,主要包括以下事项。
①根据门电路选择芯片,同时也初步确定元件的数量与空间位置。 ②检查各种描述的数据。这一过程往往出错较多,在种种描述之中有互相矛 盾冲突发生。这些错误在输入网表的时候会自动生成,表现为网表输入不完全, 并生成一个错误信息的列表,可以根据这个列表进行修改,直至网表输入正常为 止。
2.网表输入
由Protel99SE生成网表VC5402.asc。
25
大学本科毕业论文 第三章 DSP最小系统硬件设计
在Protel99SE 中装载网表,选择 File→Import,就可将原理图生成的网表
VC5402.asc 输入到Protel99SE中。
3.规则设置
设计规则是指设计元器件之间的安全距离、布线的线宽和间距、元器件管脚 引线、延时、布线的最大长度等规则。
Protel99SE 可以让设计者根据自己的意图定义设计规则。设计规则允许将
原理图设计中的约束直接输入到Protel99SE中去。Protel99SE中包括了九大类
设计规则,如默认的设计规则、类规则、网络规则、组规则、管脚对规则、封装 设计规则、元器件规则、条件规则和差分对规则。
如果在原理图设计阶段就已经把 PCB的设计规则设置好的话,就不用再设
置这些规则了,因为当输入网表时,设计规则已经随网表输入了 Protel 99SE。
如果修改了这些设计规则,必须同步原理图,保证原理图和PCB的一致。除了
设计规则和层定义外,还有一些规则需要设置,比如焊盘,就需要修改标准过孔 的大小。
4.元器件布局
在确定元件的位置时要遵循以下原则。
(1) 尽可能缩短高频元器件之间的连线,设法减少它们的分布参数和相互间
的电磁干扰。而且易受干扰的元器件不能相互挨得太近,输入和输出元件应尽量 远离,以免相互干扰。
(2) 某些元器件或导线之间可能有较高的电位差,就应加大它们之间的距
离,以免放电引出意外短路。另外,高电压元器件应尽量放置在调试时手不易触 及的地方。
(3) 超过15g的元器件,应当用支架加以固定,然后焊接。热敏元件应远离
发热元件。
(4) 板定位孔及支架所占用的位置。
(5) 流程安排各个功能电路单元的位置,使布局便于信号流通,并使信号尽
可能保持一致的方向。
(6) 边缘的元器件,离电路板边缘一般不小于2mm。电路板的最佳形状为矩
形。长宽比为3:2或4:3。
5.布线
自动布线前先手工布一些重要的网络,比如高频时钟、主电源等,这些网络 往往对走线距离、线宽、线间距、屏蔽等有特殊的要求。另外一些封装,自动布 线布的很难有规则的时候,也需要用手工布线。如不能布通,则需要调整元器件 布局,然后再通过手工布线,直到全部布通为止。
6.检查
26
大学本科毕业论文 第三章 DSP最小系统硬件设计
根据设计的不同,可选择不同的检查项目。本设计中选用的检查规则包括间 距、连接性。
7.复查
根据“PCB检查表” 进行复查,内容包括设计规则、线宽、间距、焊盘、过
孔设置。还要重点复查器件布局的合理性、电源、地线网络的走线、高速时钟网 络的走线与屏蔽、电容的摆放和连接等。
8.设计输出
将PBC原文件交付制板厂家。
3.7印刷电路板简介
3.7.1印刷电路板的结构
一般来说,印制电路板的结构有单面板,双面板和多层板三种 。 1.单面板
单面板是一种一面有敷铜,另一面没有敷铜的电路板,用户只可在它敷铜的 一面布线并放置元件。单面板由于其成本低,不用打过孔而被广泛应用。由于单 面板走线只能在一面上进行,因此,它的设计往往比双面板或多层板困难得多。
2.双面板
双面板包括顶层(TopLayer)和底层(BottomLayer)两层,顶层一般为元
[11]
件面,底层—般为焊锡层面,双面板的双面都有敷铜,都可以布线。双面板的电 路—般比单面板的电路复杂,但布线比较容易,是制作电路板比较理想的选择。 本试验开发板用的就是双层板。
3.多层板
多层板就是包含了多个工作层面的电路板。除了上面讲到的顶层、底层以外 , 还包括中间层、内部电源或接地层等。随着电子技术的高速发展,电子产品越来 越精密,电路板也就越来越复杂,多层电路板的应用也越来越广泛。多层电路板 —般指三层以上的电路板。
3.7.2零件封装
零件封装是指实际零件焊接到电路板上时所指示的外观和焊点位置。用来保 证取用零件的引脚和印制电路板上的焊点一致。零件封装纯粹是空间概念,因此 , 不同的零件封装可以用同一个零件封装。在取用焊接零件时,不仅要知道零件名 称还要知道零件的封装,可以在设计电路时指定,也可以在引进网络表时指定。 零件的封装分为两大类。
27
大学本科毕业论文 第三章 DSP最小系统硬件设计
1.针脚式零件封装
针脚式零件封装焊接时要先将零件针脚插入焊点导通孔,然后再焊锡。由于 针脚式零件封装的焊点导孔贯穿整个电路板,所以其焊点的属性对话框中,Layer 板层属性必须为MultiLayer。
2.STM 零件封装
STM 零件封装的焊点只限于表面板层。其焊点的属性对话框中,Layer 板层 属性必须为单衣表面,如TopLayer 或者Bottom Layer。
3.7.3铜膜导线
铜膜导线也称铜膜走线,简称导线,用于连接各个焊点,是印制电路板最重 要的部分。印制电路板设计都是围绕如何布置导线来进行的。
与导线有关的另外一种线,我们常称之为飞线,即预拉线,飞线是在引入网 络表后,系统根据规则生成的,用来指引布线的一种连线。
飞线与导线有本质的区别,飞线只是一种形式上的连线。它只是形式上表示 出各个焊点间的连接关系,没有电气的连接意义。导线则是根据飞线指示的焊点 间的连接关系而布置的,是具有电气连接意义的连接线路。
3.7.4焊点和导孔
焊点的作用是放置焊锡、连接导线和元件引脚。导孔的作用是连接不同板层 间的导线,导孔有3种,即从顶层贯通到底层的穿透式导孔,从顶层通到内层或
从内层通到底层的盲导孔以及内层间的隐藏导孔。导孔从上面看上去,有两个尺 寸,即通孔直径和导孔直径。
3.8 设计印刷电路板的注意事项
DSP 系统不但要注意设计时的原理的合理性,而且在完成原理图设计之后, 进行制板时也是一个比较繁杂的工程。众所周知,DSP的高速是其他器件不可比
拟的,但是正是由于它的高速,也使得它对系统板的布线布局有很高的要求。任 何一点的疏忽,漏洞都有可能造成前功尽弃。
在进行PCB布局,布线时,有很多的需要注意的地方。在进行制板的时候 ,
不是说布通一块板子就算结束了,必须考虑信号完整性,在很多情况下,由于类 似于串扰之类的问题,往往导致系统板性能下降,甚至于完全失败。
为了能够布好一个系统板,同样也有一些规则必须遵守,这些规则都仅仅 是经验总结,并不是非常的准确。一个系统板的好坏,更多的取决于布局布线的
28
大学本科毕业论文 第三章 DSP最小系统硬件设计
人的经验和知识。
1.一般规则。
(1)数字模拟元器件及相应走线尽量分开并放置于各自的布线区域内。 (2)高速数字信号走线尽量短。 (3)合理分配电源和地。
(4)DGND,AGND、实地、DSP-CVDD,VCC3.3分开。
(5)电源及临界信号走线使用宽线。 2.电源、地线的具体处理。
尽量加宽电源、地线宽度,最好是地线比电源线宽,它们的关系是:地线> 电源线>信号线,通常信号线宽为 0.2-0.3mm,最细宽度可达0.05-0.07mm,电
源线为1.2-2.5mm。
3.所有连到晶振电路输入/输出端的走线尽量短,以减少噪声干扰及分布电 容对晶振的影响。
3.9最小系统PCB 图和系统板
本系统开发板的PCB如图3-11 所示,系统板制作完成焊接之后正面如图3-
12,反面如图3-13所示。
图3-11 开发板的PCB图
29
大学本科毕业论文 第三章 DSP最小系统硬件设计
图 3-12 系统开发板实物正面照片
图3-13 系统开发板实物反面照片
30
大学本科毕业论文 第三章 DSP最小系统硬件设计
3.10印刷电路板硬件调试的问题和体会
1.遇到的问题
(1)电源接口出错在封装时电源接口中的 5V 端和接地端装反(如图 3-14), 导致电源芯片不能运行、发烫,经过检查发现,以外接导线解决。
图3-14 电源接口
(2)JTAG 接口的过孔设置过小,如图3-15所示,导致在焊接JTAG 接口时针
脚不能通过过孔,只能直接将针脚焊在焊盘上,以至于有虚焊现象,经检查解决 。
图3-15 JTAG接口
2.制作印刷电路板的体会
制作印刷电路板首先要确保 PCB板设计的正确,其次对硬件目标板,要仔
31
大学本科毕业论文 第三章 DSP最小系统硬件设计
细检查电路板有没有断线或短路等现象,观察元件是否都正确地焊接在电路板 上,并且确认没有虚焊现象。然后,通电检测电源、时钟和复位部分是否正常工 作。而且在焊接时要确定焊接一部分,检查一部分,确定正确后继续焊接下一部 分。切不可一次全部焊完,这会导致难以查出出错部分。
32
天津工业大学本科毕业论文 结论
第四章
系统性能测试
1.1仿真实现的软件工具
目前,DSP 的发展趋势是随着处理器的速度越来越快,结构越来越复杂,DSP
的应用也越来越广泛,正向多处理、多通道的方向发展。由于DSP的诸多优点,
市场上对基于DSP 的产品需求也越来越大,因此DSP厂商之间、开发者之间的
竞争越来越激烈,对DSP 的开发效率的要求也在不断提高。而DSP芯片的开发
需要一整套完整的软件和硬件开发工具,对于开发者,要想充分利用 DSP 的性 能,缩短开发周期,提前抢占市场,有效的开发工具至关重要。
DSP 芯片的软件开发需要一套完整的软硬件开发工具,开发工具可以分为代 码生成工具和代码调试工具。
代码生成工具的作用是将C 语言、汇编语言或两者的汇合语言编写的 DSP
源代码编译并链接成可以执行的DSP 代码。而代码调试工具的作用是对 DSP程
序及目标系统进行调试,使之能达到设计目标。
TMS320 系列DSP 芯片的开发环境应包括硬件和软件两个方面,常用的软
[12]
件开发环境为 CCS 2 ,硬件环境包括 JTAG 仿真器和DSP 硬件平台。如没有
硬件开发环境时,也可以在CCS2软件环境中进行算法仿真。
CCS2代码调试器是一种针对标准TMS320 设计接口的集成开发环境 IDE,
它包含源代码编辑工具、代码调试工具、可执行代码生成工具和实时分析工具, 并支持设计和开发的整个流程,如图4-1所示。
设 计 方 案
译 、 链 接
编 辑 、 编调试、 语法检 查、断 点设置
析、统计和跟踪
实时观 察、分
图 4-1 CCS2的开发流程图
CCS2具有以下特性。
1.完全集成的开发环境和高度集成的源代码编辑器。 2.支持编辑和调试的后台编辑。
3.对C语言和DSP 汇编语言文件的目标管理。
33
天津工业大学本科毕业论文 结论
4.文件探针在算法中通过文件提取或加入信号和数据,使用户可以使用自 己的文件来仿真算法。
5.可以在后台执行程序。 6.强大的图形分析能力。 7.方便的代数分解窗口。 8.有图形窗口探针。
[13]
9.有状态观察窗口 。
总之,CCS 2有强大的源代码编辑器、方便的应用程序生成特性及方便的应
用程序调试特性,支持从编辑、编译、汇编、链接到调试 DSP 应用程序的整个 过程。
3.2系统的工作原理和测试步骤
DSP 通过JTAG 接口与仿真器相连,仿真器则通过 USB与电脑连接。电脑
上的编译软件 CCS 2是通过仿真器将程序下载到 DSP 内运行的。在使用 JTAG
协议调试程序时,CCS 2亦通过仿真器与 DSP 交流信息,如CCS 2将控制信号
通过JTAG 接口送到DSP 以控制程序的运行,而DSP亦通过该接口将采样信号、
[14]
运算结果或运行状态送到 CCS 2进行显示以便观察调试 。DSP 最小系统的测
试步骤如下。
1.系统连接。进行DSP实验之前,先必须连接好仿真器、DSP最小系统板
卡及计算机。
2.电复位。在硬件安装完成后,确认安装正确、各个实验部件及电源连接 正常后,接通仿真器电源并启动计算机,此时,仿真盒上的“红色小灯”应点亮,
否则DSP 开发系统与计算机连接有问题。
3.运行 CCS2 程序。实验板上电,启动 CCS2,CCS 2正常启动,表明系
统连接正常,否则仿真器的连接、JTAG 接口或者CCS 2相关设置存在问题,断
开电源,检查仿真器的连接、JTAG 接口连接,或检查CCS2相关设置是否正确 。
成功运行程序后,在CCS 2环境下程序编写、调试、编译、装载、使用观察窗口
等。
3.3DSP 存储空间的配置
设计软件时,需要对DSP 的RAM 空间进行配置。TMS320VC5402 片内有4K
字 ROM 和 16K 字的 DARAM(双寻址 RAM),可通过处理器模式状态寄存器
34
天津工业大学本科毕业论文 结论
(PMST)中OVLY位的设置,使片内 RAM 同时映射到程序区和数据区。该程序
[15]
配置文件EXP01.cmd 如下 。
MEMORY {
PAGE0: PROG: PAGE1: DATA:
origin = 1a00h, length=2580h origin = 0200h, length= 1800h
}
SECTIONS {
.text >PROG PAGE 0 .cinit >PROG PAGE 0 .switch >PROG vect > 3f80h
PAGE 0
PAGE 0
.data > DATA PAGE 1 .bss > DATA PAGE 1 .const >DATA PAGE 1 .sysmem > DATA PAGE 1 .stack >DATA PAGE 1
}
3.4测试程序
通过运行控制系统板上XF的引脚上的贴片式指示灯亮灭的程序来测试系统
板能否正常运行。
;File Name:exp01.asm
.mmregs .global_main
_main:
nop nop
stm #100h,sp
andm #0fffbh,pmst
stm #0b,clkmd;switch toDIV mode clkout= 1/2 clkin
35
天津工业大学本科毕业论文 结论
statu:
ldm clkmd,A
and #01b,A;poll STATUSbit
bc statu,ANEQ
stm #0f007h, clkmd ;switchtoPLLX 1mode nop nop
loop:
ssbx xf call delay rsbxxf
call delay b loop nop nop
delay:
stm loop1:
#170fh,ar3 #0f9h,ar4 loop2,*ar4- loop1,*ar3-
stm loop2:
banz banz ret nop nop .end
3.5测试的注意事项
1.软件在按照要求编写完后,通常在下载到系统前,用纯软件方法单步跟 踪程序的执行,以确保每一步的结果都是所预料的。这样不仅利于及早发现程序 的错误,也可以在这一步对程序进行优化。TI 公司的 DSP 编译软件功能强大,
提供了许多工具,可以更好地对软件进行调试。这也是在芯片选型中所要考虑的 因素之一。
2.为了测试整个系统的特性,特别为其编写了测试程序,整个测试过程都 是在JTAG 协议下通过仿真完成的。在加载程序前,要在系统板上设置好相应的
跳线和拨码开关。
36
天津工业大学本科毕业论文 结论
结 论
本文在引入DSP 发展现状与要求的情况下,对DSP最小系统的内部结构和
原理进行了描述。并对最小系统的设计和调试进行了相应的说明。
在测试硬件设计方面,根据系统要求,选用了 TI 的数字信号器
TMS320VC5402 作为分析处理的主CPU,TPS767D318 来完成电源模块,并配合
AMD 公司生产的256K×16位Am29LV800及其ISSI公司的IS61LV25616设计的
存储电路,运用Protel 99SE实现原理图的绘制和PCB板的制作,完成了基于DSP
的最小系统硬件设计,使其能实现对基本程序的处理与分析。
在最小系统的软件设计上,选用TI 公司的CCS 2开发环境。通过运行控制
系统板上的引脚上的贴片式指示灯亮灭的程序来测试系统板能否正常运行。
通过对DSP 最小系统的设计和调试,使我更加深入的了解 DSP内部结构和
运行原理。首先,体验到了分析问题、解决问题最终达到设计要求的全过程。其 次,通过对DSP 的设计,更深刻地了解DSP的工作原理和应用,提高思考
和解决问题的能力。
但是由于本人能力和时间有限,还有很多尚未完成的工作还需要进一步研 究。
1.整个系统的结构设计并非最优,还有一些待改进的地方,在软件设计上 讨论的并不深入。
2.关于最小系统的设计方法和扩展方案还需要在以后的实践中去摸索。本 系统的功能可进一步扩展,如增加TLC5541芯片,以实现对A/D、D/A的处理。
最小系统有着较好的通用性和开放性,可以直接作为实用系统的一个核心部 件;可以协助 DSP开发系统,节约系统成本,缩短研发周期;同时还可以用作
教学、实验等方面,具有广阔的前景。
37
天津工业大学本科毕业论文 参考文献
参考文献
[1] [2] [3] [4] [5] [6] [7] [8] [9]
汪安民.TMS320C54xxDSP 实用技术.北京:清华大学出版社,2002 张雄伟.DSP 芯片的原理与开发应用.北京:电子工业出版社,2003 张雄伟.DSP 集成开发与应用实例. 北京:电子工业出版社,2002 朱铭锆.DSP 应用系统设计.北京:电子工业出版社,2002 李利.DSP 原理及应用.北京:中国水利水电出版社,2004
汪春梅.TMS320C5000 系列DSP 系统设计与开发实例.北京:电子工业 出版社,2004
王天祥.数字信号处理(DSP)及其支持芯片的选择.DSP 开发与应用,1996 (1)
邹理和.数字滤波器.北京:清华大学出版社,1995
胡广书,崔子经.数字信号处理—一门正在蓬勃发展的新学科.电子科技 导报,1995(1)
[10] 张雄伟,陈亮,徐光辉.DSP 集成开发和应用实例.北京:电子工业出版
社,2004 [11] 张雄伟.TMS320C31系统的硬件设计方法.军事通信技术,1996(4)
[12] 程佩青.数字信号处理.北京:清华大学出版社,1995
[13] 张勇.TMS320C5000 系列DSP 汇编语言程序设计.西安:西安电子科技
大学出版社,2004
[14] 邹传云,敖发良.DSP 微处理器的基础特征.电子科技导报,1995(11)
[15] JohnG.Ackenhusen.Real-Time SignalProcessing:DesignandImplementat
ionof Signal ProcessingSystems.北京:电子工业出版社,2000
38
大学本科毕业论文 附录
附
录
附件一:英文资料
REALTIIMEDSPSYSTEM DESIIGN
4.1Inttroduction
The proposed algorithm should be portedto the sensor system togive a realtime analysis. There is severalmethodto achieve realtime system such as PCbasedsystem [6], micro-processor, DSP processor and so on. Anyof this real time system will have adata acquisition system, signalgenerator,andtrigger circuitso thatthe signals from a
WLI sensor system can be thoroughly analyzed. Once the signals are digitized, the algorithmcomes into playto calculatethe truefringe peakposition.
The primary goal of this research is todevelop cost-effective and robust system. Thus, a fast, cost-effective and robust real time system willbe investigated throughout
this chapter.
4.2Realttime sysstem
When the processing requires many computations, DSP processors show superior performance over micro -processors. The advanced DSP architecture makes
real time processing possible [17]. The advanced architecture not only gives high speed but also reduces overhead. These can be clearly seen from a simple example. 2002 data point auto correlation has been tested to verify the relationship between architecture andalgorithm time. Fig. 4.1shows the result of the test.
Fig. 4.1. Algorithmtimecomparison
For the same computation, 486 processor takes about 60% of the computation time to perform functions; such as looping, addressing and branching etc ,_ In a
39
大学本科毕业论文 附录
Pentium processor, 60% of the time is dedicated to compute a pure algorithm. It is evident that an advanced architecture reduces overhead burden and gives a processor more power toperformcomputation.
The DSP processor reduces overheadand builds in various functions which are widelyused in digitalsignalprocessing-block loop, bit-reverse, convenientaddressing mode. There are thousands of DSP chips onthe market today,and each processor has different advantages and functions, so the user has to be aware of which of these DSP
processors is fit for their project. Fig. 4.2 shows the benchmark of processor onthe current market surveyedby BDTL.
Fig. 4.2.Benchmarkofaprocessor'sexecutionspeedonDSP algorithmCourtesyofBerkeley
Design TechnologyInstitute(BDTI)
Intel processors show a fast performance on benchmark, so does TMS320C^x. However, the prices of these processors are over $150. Especially, a PC which has an
Intel processor inside , is one powerful toolfor DSP. But a complex operatingsystem
such as MS-window 98 which contains colorful Graphic User Interface(GUI)can occupyas much as 50% of a CPU's processing time [17]. The actualprocessingtime, therefore,is muchless thanthatclaimed inFig. 4.2
For cost-effectiveness, TMS320C3x and TMS320C5x are a goodchoice. The major difference ofthese two DSP processor is the C3xchip-afloating-point processor -such that one floatingpoint operation canbe done in one executioncycle. C5x,onthe other hand, is a fixed point processor. In general application, TMS320C5x might
performbetter than TMS320C3x. However, it has a possible quantization error during FFT due to a 16-bit limitation in data length. In this research, floating point cross correlation is necessary to maintaina highresolution of the sensor system. Therefore,
40
大学本科毕业论文
附录
the floating-point processor is fitforthis research. Thespeedthat TMS320C3xhas and the price which is about $26.40 for the 30 MIPS TMS320C32 in a 144-pin PQFP package, makeTMS320C31the choice for this project 4.3TMS320C3xDSP
The TMS320C3x family, which includes C30, C31 and C32, is Texas Instruments' first generation of 32-bit floating-point DSPs [18]. The first family member, the TMS320C30, was introduced in 1988. The TMS320C3x is
targeted at digital audio, data communications, and industrial automation and control, but it canbeapplied toany DSPapplications. The TMS320C3xdata pathconsists of a
multiplier, a barrel shifter and ALU, and a register file containing eight 40-bit \"extended-precision\" registers. The multiplier can multiply32-bit floating-point input
data to produce a 40-bit floating-point result, or 24-bit signed integer input data to produce a result from which the least- significant 32 bits are retained. The ALU operates on 32-bit signed integer and 40-bit floating-point data, providing arithmetic and logical operations as well as integer/ floating- point
conversions, but TMS320C3xdoesn't supportIEEE floating-point formats
TheTMS320C3x familyprovides aunified address spacethatmakes users use any portions of memory for program or data as needed. The address space is 32-bit word addressable. One drawback is that types of variables are always treatedas 32-bit
words even though it is defined as int, long, float, or double. Each member of the
TMS320C3xfamily has a somewhat different external memory interface. Some variants contain two external bus interfaces (a primary interface and an expansion
interface), while others contain only a primary interface. On all TMS320C3x
processors, external bus writes take two instruction cycles. Reads take one instruction cycle unless they follow a write, inwhich casetheyalso taketwo cycles. This yields a maximum sustainable memory bandwidth for each external bus of fifteen 32-bit Mwords/second for writes and thirty 32-bit Mwords/second for reads on a 30 MIPS
TMS320C30. The TMS320C3x includes a -word instruction cache that is used to speedaccesses toslower externalmemorybanks.
Insummary,mainfeatures of the TMS320C3xfamilyare
*60-MFLOPCPU
*Register-basedCPU
*32or40floating-point/integer multiplier *32or40floating-point/integer ALU *32-bitbarrelshifter
*Eight40-bit extended-precision registers *Twoaddress generators *Twoindex registers
*Eightindirect-address registers
4.4TMS320C31DSP realtime system
41
大学本科毕业论文 附录
A real time signal processing board with a TMS320C31 DSP processor has been designed to analyze the AFWLI temperature sensor signaFig. 4.3 is a
ls.
specification for the DSP board.It has a32bit-word KRAM andROM, 32bit-word
parallel high speedinput/output port, two-channel high-speedA/D converter, function generator, programmable trigger, 1 UART(LTniversal Asynchronous Receiver and Transmitter)- RS323C serial communication port, 3 D/A converters, and * 128graphic LCDdisplay.
Fig. 4.3.Systemblockdiagram ofTMS32C31DSPboard
Aprecision A/D converter is needed maintainhigh resolution ofthe sensor system. An AD9223, Complete 12-bit 3.0 MSPS Monolithic A/D converter, from Analogdevices is used. The sample rate can be adjusted by down sampling at the TMS320C31 DSP board[21]. Althoughthe AD9223 onlyhas one A/D input channel, the channel can be expanded byusing ananalog multiplexer. D/A converters are reserved for future use.
These would be channels to other measurement instruments for future analysis. A function generator and a programmable trigger are working in tandem so that the
function generator generates the modulation signal for a sensor system and the programmable trigger evokes the A/D converter tostart conversion.
42
大学本科毕业论文
附录
附件二:中文资料
实时DSP系统设计
4.1 介绍
提出的算法应该被导入一个传感系统并给出实时分析。可通过许多方法获得 实时系统,如计算机系统、微处理器、DSP 处理器等。每一个实时系统都有数据 采集系统、信号发生器、触发电路,这能完全处理从WLI传感系统输入的信号。
当信号被数字化,算法便开始作用进而计算出真实的边缘和顶峰位置。
本论文的首要目的是开发一个效能价格合算的强适应性系统。因此,在本章 将会介绍快速、效能价格合算、强适应性的实时系统的设计。 4.2实时系统
当一个进程需要很多计算时,DSP 处理器比微处理器表现出更好的性能。一 个先进的DSP 体系结构能实现实时处理。先进的 DSP体系结构不但能提供高速
处理,而且能减少内务操作。从一个简单的例子就能清楚的看出这些。2002个
数据点自相关试验证明了结构和计算时间之间的关系。图4-1显示了试验的结果 。
图 4-1 计算时间比较
对相同的计算,486处理器把60%的计算时间用于执行如下操作:循环、
寻址、分支。在奔腾计算机中,60%的时间被专用于计算纯粹的算法。很明显, 先进的结构能减少内务操作的负担并且给处理器更多的能源去执行计算。
DSP 处理器减少内务操作并且建立了多种广泛操作,如:数字信号块处理循 环、位反转、简便寻址方式。在现在市面上有数千种 DSP 芯片,而且每种芯片 都有各自的优点和缺点,所以使用者必须明白哪一种芯片最适合他的项目。图4.2 显示了伯克利技术设计局(BDTI)调查的市面上处理器的基准。
43
大学本科毕业论文 附录
图4-2 伯克利技术设计局(BDTI)的 DSP算法惯例执行速度基准
在基准中 TMS320CX 和Intel 处理器都显示了他们的高速执行能力。但是
Intel 处理器的价格超过了$150。而且对于DSP,有着Intel 处理器内核的计算机
是一个强大的工具。但是一个包含图形用户界面的复杂操作系统,如MS-window 98将会占用多达50%的处理器执行时间。因此,实际执行时间要远少于图4-2
中所显示的执行时间。
为了效能价格合算,TMS320C3X 和TMS320C5X 是很好的选择。这两种DSP
处理器的主要不同点是C3X 是浮点处理器-在一个执行周期内能进行一次浮点操
作。从整体的实用性来看,TMS320C5X 要比TMS320C3X 做的更好。但是,当
FFT 的字长为16bit时,可能会产生量化错误。 4.3TMS320C3xDSP
在TMS320C3x 系列芯片包括 C30, C31和C32,是德州电子的第一代 32
位浮点 DSP 芯片。此系列的第一个产品是 TMS320C30,于 1988 年发明。
TMS320C3x 的产生是以数字音频、数字通信和工业自动化控制为目的的,但是, 它同样适用于一些DSP 方面的应用。TMS320C3x数据通路是由乘法器、桶式移
位器、算术逻辑单元以及一个包含8个40bit扩展精度寄存器的寄存器文件组成。
此乘法器能够运行32bit 浮点输入信号的相乘,产生一个40bit的浮点结果。算术
逻辑单元能够操作32bit 带符号整数和40bit浮点数,能够提供和整数和浮点数转
换器相似的算术和逻辑操作。
TMS320C3x 系列芯片提供统一的地址空间,这使使用者能够提供程序和数 据所需的一部分空间。这些地址空间是32位字可寻址的。它的缺点是这些变量
虽然定义为浮点或双精度的,但它们总是被当作 32位字。每个 TMS320C3x 系
44
大学本科毕业论文 附录
列芯片都有这不同的外存储器接口。一些芯片包含两个外部总线接口(主接口和 展开接口),而一些其他的芯片只有主接口。对于所有的 TMS320C3x 处理器,
外部总线写需要两个指令周期。读需要一个指令周期,但读写同时进行时,需要 两个指令周期。对于30MIPS 的 TMS320C30,外部总线的最大可支持存储带宽
是写时15个32兆位字,读时30个32兆位字。TMS320C3x包括一个字指令
高速缓冲存储器,它被用做与较慢的外部存储体的之间的高速存取。 总体上,TMS320C3x 系列芯片的主要特点是:
60-MFLOPCPU
寄存器基的CPU
32或40浮点/整数乘法器
32或40浮点/整数的算术逻辑部件
32位桶形移位器
8个40位扩展精度寄存器
两个地址生成器 两个变址寄存器 八个间接地址存储器 4.4TMS320C31DSP实时系统
这个带有 TMS320C31 DSP 芯片的实时信号处理板被设计为分析AFWLI
温度传感器信号。这块DSP板的具体规格说明如图4.3所示。它有一个32位字K
RAM 和ROM,32位字并行高速输入输出端口,双通道高速A/D转换器,函数
发生器,可编程触发器,一个通用异步收发器-RS323C串形通信口,3个D/A 转
换器,和×128图形液晶显示器。
图 4.3TMS32C31DSP板系统方程图
45
大学本科毕业论文 附录
这个传感系统需要一个精密的 A/D转换器来维持高分辨率。AD9223 是一
个12位3.0MSPS 单片模数转换器,被用于模拟装置。虽然AD9223 只有一个A/D
输入通道,但是这个通道可以通过模拟多路转接器进行扩展。D/A转换器被保留
将来使用。这是未来分析的另一些测量手段。函数发生器和可编程触发器的串行 工作使得函数发生器能为传感系统调制信号而且可编程触发器能使A/D 转换器
开始工作。
46
大学本科毕业论文
附录
附件三:原理图
附图1 总原理图
47
大学本科毕业论文 附录
附图2 TMS320VC5402原理图
48
大学本科毕业论文 附录
附图3 54ACT573W原理图
附图4 54ACT573W原理图
49
大学本科毕业论文 谢辞
谢
辞
本论文的工作是在我的导师刘丽杰的悉心指导下完成的,刘丽杰老师严谨的 治学态度和科学的工作方法给了我极大的帮助和影响。在此衷心感谢刘丽杰老师 对我的关心和指导。
刘丽杰和耿磊老师悉心指导我们完成了实验室的科研工作,在学习上和生活 上都给予了我很大的关心和帮助,在此向刘丽杰老师表示衷心的谢意。
刘丽杰和耿磊老师对于我的科研工作和论文都提出了许多的宝贵意见,在此 表示衷心的感谢。
在实验室工作及撰写论文期间,陈伦建、陈韬等同学对我论文中的 DSP 最 小系统研究工作给予了热情帮助,在此向他们表达我的感激之情。
50
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- 91gzw.com 版权所有 湘ICP备2023023988号-2
违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务