您的位置: 专家智库 > >

乔瑞秀

作品数:13 被引量:7H指数:1
供职机构:中国科学院半导体研究所更多>>
发文基金:国家自然科学基金中国科学院战略性先导科技专项中国科学院国防科技创新基金更多>>
相关领域:自动化与计算机技术电子电信更多>>

文献类型

  • 9篇专利
  • 3篇期刊文章
  • 1篇会议论文

领域

  • 7篇自动化与计算...
  • 5篇电子电信

主题

  • 4篇神经网
  • 4篇神经网络
  • 4篇网络
  • 4篇可配置
  • 4篇浮点
  • 4篇IP核
  • 3篇卷积
  • 3篇卷积神经网络
  • 2篇电路
  • 2篇读写
  • 2篇移植性
  • 2篇阵列
  • 2篇输出模块
  • 2篇总线
  • 2篇总线接口
  • 2篇系统设计
  • 2篇接口
  • 2篇矩阵
  • 2篇矩阵乘
  • 2篇矩阵乘法

机构

  • 13篇中国科学院
  • 4篇中国科学院大...
  • 2篇中国科学院脑...

作者

  • 13篇乔瑞秀
  • 10篇鲁华祥
  • 10篇陈刚
  • 5篇边昳
  • 3篇李志刚
  • 2篇龚国良
  • 2篇申荣铉

传媒

  • 1篇微电子学与计...
  • 1篇西安电子科技...
  • 1篇网络新媒体技...

年份

  • 2篇2024
  • 5篇2023
  • 1篇2020
  • 1篇2019
  • 1篇2017
  • 2篇2016
  • 1篇2015
13 条 记 录,以下是 1-10
排序方式:
卷积神经网络计算装置、数据计算方法
一种卷积神经网络计算装置,应用于计算机技术领域,包括:分布式局部存储模块,卷积计算模块,有效信号控制模块,地址管理模块以及缓冲输出模块,分布式局部存储模块,用于存储输入激活值和权重值,卷积计算模块,用于对输入激活值和权重...
乔瑞秀龚国良邓琪鲁华祥边昳
文献传递
基于现场可编程门阵列的低资源开销TCP/IP协议栈装置
本发明提供了一种基于现场可编程门阵列的低资源开销TCP/IP协议栈装置,涉及网络通信传输技术领域,该低资源开销TCP/IP协议栈装置包括:UDP模块,用于封装和解析UDP协议中的用户数据,得到第一报文数据段;TCP模块,...
赵志远乔瑞秀陈刚申荣铉鲁华祥边昳
一种高效的Softmax函数计算方法及硬件电路
2024年
针对现有Softmax函数硬件实现中存在的面积消耗大、速度慢、计算效率低等问题,设计一种高效的Softmax函数计算方法及硬件电路。提出一种稀疏化最大值计算方式,仅选择有效的输入值进行计算和存储,并采用动态移位更新最大值的方式将最大值求取隐藏在流水线中,提高计算效率;优化分段线性拟合算法,避免乘法器的使用,减少了硬件资源开销。基于现场可编程门阵列(Field-Programmable Gate Array,FPGA)的语音识别实验的结果表明,本方法减少了60%的指数存储需求,同时减少了50%的Softmax计算时间。在45 nm互补金属氧化物半导体(Complementary Metal Oxide Semiconductor,CMOS)工艺下的逻辑综合实验表明,所实现的Softmax函数相较之前的工作,电路综合性能提升14%,面积减小51%。
刘海莹乔瑞秀陈刚陈刚申荣铉
基于FPGA的可配置浮点向量范数求解IP核
本发明提供一种基于FPGA的可配置浮点向量范数求解IP核,包括:一总线接口,用于系统与外部进行数据通信;一浮点向量范数求解电路,该浮点向量范数求解电路与总线接口连接,实现范数求解。本发明,具有独立性强、可移植性强、可配置...
乔瑞秀鲁华祥陈刚
文献传递
一种高性能可重构深度卷积神经网络加速器被引量:6
2019年
由于深度卷积神经网络的卷积层通道规模及卷积核尺寸多样,现有加速器面对这些多样性很难实现高效计算。为此,基于生物脑神经元机制提出了一种深度卷积神经网络加速器。该加速器拥有类脑神经元电路的多种分簇方式及链路组织方式,可以应对不同通道规模。设计了3种卷积计算映射,可以应对不同卷积核大小;实现了局部存储区数据的高效复用,可大量减少数据搬移,提高了计算性能。分别以目标分类和目标检测网络进行测试,该加速器的计算性能分别达498.6×10^9次/秒和571.3×10^9次/秒;能效分别为582.0×10^9次/(秒·瓦)和651.7×10^9次/(秒·瓦)。
乔瑞秀陈刚陈刚龚国良
关键词:加速器高性能超大规模集成电路
基于FPGA的可配置浮点向量范数求解IP核
本发明提供一种基于FPGA的可配置浮点向量范数求解IP核,包括:一总线接口,用于系统与外部进行数据通信;一浮点向量范数求解电路,该浮点向量范数求解电路与总线接口连接,实现范数求解。本发明,具有独立性强、可移植性强、可配置...
乔瑞秀鲁华祥陈刚
可编程电阻器、带隙基准源及调节方法
本公开提供一种可编程电阻器、带隙基准源及调节方法,可编程电阻器包括:第一电阻;第一开关组,与第一电阻串联,用于连通第一电阻与两个编程端口,以对第一电阻进行阻值编程;第二开关组,与第一电阻串联,用于连通第一电阻与两个采样端...
陈刚李志刚乔瑞秀陈义豪孔鑫边昳鲁华祥
卷积神经网络计算装置、数据计算方法
一种卷积神经网络计算装置,应用于计算机技术领域,包括:分布式局部存储模块,卷积计算模块,有效信号控制模块,地址管理模块以及缓冲输出模块,分布式局部存储模块,用于存储输入激活值和权重值,卷积计算模块,用于对输入激活值和权重...
乔瑞秀龚国良邓琪鲁华祥边昳
并行可配置浮点矩阵乘法IP核设计被引量:1
2015年
矩阵乘法是信息处理领域的常见计算,该文设计并实现了一个可自由配置的浮点矩阵乘法IP核,可满足不同计算场合的需求。该IP核采用并行结构设计,使用AXI接口,可通过参数配置实现任意维矩阵乘法,并在嵌入式系统设计中灵活调用,在Xilinx 7系列芯片的FPGA平台上进行验证了。实验结果证明了该浮点矩阵乘法IP核相对于传统乘法器设计具有计算速度快、移植性能好、资源利用少等特点。
乔瑞秀鲁华祥龚国良陈刚
关键词:系统设计IP核矩阵乘法
并行可配置浮点矩阵乘法IP核设计
矩阵乘法是信息处理领域的常见计算,该文设计并实现了一个可自由配置的浮点矩阵乘法IP核,可满足不同计算场合的需求。该IP核采用并行结构设计,使用AXI接口,可通过参数配置实现任意维矩阵乘法,并在嵌入式系统设计中灵活调用,在...
乔瑞秀
关键词:系统设计IP核矩阵乘法
共2页<12>
聚类工具0