- 1、本文档共10页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
7nm工艺竞赛升级eFPGA架构创新为人工智能加速
人工智能应用的新需求给FPGA带来了历史性的发展机遇,FPGA强大的并行计算能力、高能耗比、灵活的编程等优势,决定其将在人工智能舞台中将发挥重要作用。但同时人工智能强大的数据运算能力、传输存储能力等特性也对成本和功耗能效等提出新要求,如何处理这些问题需要从工艺来着手,核心架构的研发创新以及多种工具的支持,先进制程工艺都可以让芯片性能得到提高,而且功耗更低。并且一旦开始大规模的生产此类芯片,其制造成本就会大大下降,从而获取更高的盈利。可以说先进的制造工艺和核心架构能让FPGA抢占利润更为丰厚的AI市场。目前,大部分的FPGA芯片都是基于28nm和20nm工艺,但随着AI、5G等新应用需求,16nm、7nm等更先进制程的FPGA芯片将在2019年逐步放量,带来FPGA市场的一轮新的竞争。同时也为拥有新工艺技术实力的公司带来新机遇,有望在FPGA长期寡头垄断的市场里撞出新火花。而Achronix就是这其中的后起之秀,其FPGA的硬件加速器器件和高性能嵌入式FPGA半导体知识产权(eFPGA
IP)凭借出色的工艺近年来取得的快速发展。
Achronix市场营销副总裁SteveMensor
近日,《华强电子》记者在采访Achronix市场营销副总裁Steve
Mensor时获悉,其第四代新的SpeedcoreGen4
eFPGA架构已经推出,采用台积电7nm工艺节点,主要针对新兴人工智能/机器学习和高数据带宽应用的爆炸式需求,将于2019年上半年投入量产。
Steve表示:“Speedcore
IP是可以集成到ASIC和SoC之中的嵌入式FPGA(eFPGA)。客户通过定制其逻辑、RAM和DSP资源需求,Achronix接下来就会为其配置满足其需求的Speedcore
IP,Speedcore查找表(LUT)、RAM单元模块和DSP64单元模块可以像乐高积木一样进行组合,以便为特定的应用创建优化的可编程功能。在Speedcore
IP的交付包中,也包括一个对SpeedcoreIP进行编程的ACE设计工具个性化版本。与之前一代的Speedcore
嵌入式FPGA(eFPGA)产品相比,Speedcore
Gen4的性能提速60%、功耗降低50%、芯片面积缩小65%;新的机器学习处理器(MLP)单元模块为人工智能/机器学习(AI/
ML)应用提供高出300%的性能。”接下来Steve为记者详细介绍了SpeedcoreGen4新架构主要通过哪些创新来实现能效的显著提升的。
架构性创新是提高系统性能的核心
与上一代Speedcore产品相比,新的SpeedcoreGen4架构采用7nm工艺制程,在逻辑单元模块中的布线布局、矩阵乘法、查找表等方面实现了多项创新,从而可将系统整体性能提高60%。
新增强的逻辑模块
其中的路由架构也借由一种独立的专用总线路由结构得到了增强。新的总线路由是高性能专用总线分组路由通道,总线路由与标准路由通道分离,以确保无拥塞。在内存和MLP之间运行的总线优化,创建巨型分布式运行时可配置交换网络。这为高带宽和低延迟应用提供了最佳的解决方案,并在业界首次实现了将网络优化应用于FPGA互连。
高速核心下一代布线架构
矩阵向量乘法将行划分成块,大型矩阵通常将与矩阵的一行相关联的单个乘积和划分成多个循环。例如:
将32个乘积的和分为8个乘积的四个部分和,累积四个连续的部分和,以计算每行的积的总和。第一个输出的总和在第四个时钟周期结束时完成。对接下来的四个时钟周期进行相同的处理,以计算和组合与第二输出相关联的四个部分和。
基于循环寄存器的块矩阵矢量乘法,循环寄存器允许向量数据被存储和重用。在并行操作中显示多个MAC操作的例子,读取矢量的四个子块并将数据写入循环寄存器文件。
新型纵向连接和MLP级串联路径
其中查找表的所有方面都得到了增强,以支持使用最少的资源来实现各种功能,从而可缩减面积和功耗并提高性能。其中的更改包括将ALU的大小加倍、将每个LUT的寄存器数量加倍、支持7位函数和一些8位函数、以及为移位寄存器提供的专用高速连接。使用LUTS构建附加乘法器,使得有价值的低精度乘法通过最有效的FPGA来实现。
基于GE4LUT的乘法器:比其他FPGA架构更有效
另外,核心架构的研发创新同时能满足多种工具的支持也是非常重要的。Achronix的ACE设计工具中包括了Spee
您可能关注的文档
- 6.1英寸苹果iPhone 9 LCD新机模曝光:全新红色、蓝色.doc
- 6.1英寸新iPhone遇到量产问题 可能推迟到10月上市.doc
- 6.3英寸全面屏 华为麦芒7发布会定档9月12日.doc
- 6.9英寸超大OLED屏、Android首款搭载7nm处理器:外媒称Mate 20将夺取Galaxy S10潜在买家.doc
- 6.18元秒5G、抢千元神券,iQOO品牌盛典即将开启.doc
- 6英寸超薄屏幕!科大讯飞彩色电子阅读器值得信赖!.doc
- 7nm工艺!骁龙855四季度量产:集成NPU人工智能单元.doc
- 8.8GHz!华硕Z790 APEX主板13代酷睿超频神器.doc
- 8K超清分辨率+AI人工智能!曝华为将在9月推高端电视.doc
- 8K次世代游戏体验来了!30系显卡x索尼Z8H.doc
- 2023年贵州省贵阳市中级会计职称经济法真题(含答案).pdf
- 区域生态环境建设——高考地理一轮复习大单元知识清单和练习(解析版).pdf
- 2023年国家电网(财务会计类)专业备考题库资料(计算简答题部分).pdf
- 2024-2025北师大版4四年级数学上册(全册)测试卷10套(附答案).pdf
- 2023-2024学年山东省德州市齐河县统编版四年级上册期末考试语文试卷(含答案解析).pdf
- 2024-2025学年江西省九江市初三第二学期期末考试语文试题(含解析).pdf
- 2024-2025学年福建省漳州市诏安县初三年级下册期末考试英语试题(含答案).pdf
- 2024-2025学年湖北重点学校高二数学上学期9月联考试卷(附答案解析).pdf
- 消防装备维护员(高级技能)考试复习题库(供参考).pdf
- 文言文之人物形象(2大陷阱:忽略故事情节+概括能力不足)-2024年中考语文考试易错题(原卷版).pdf
文档评论(0)