郭德源
- 作品数:12 被引量:10H指数:2
- 供职机构:清华大学更多>>
- 发文基金:国家科技重大专项国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- VLIW DSP指令级精度模拟器的快速实现方法被引量:3
- 2013年
- 为了以最小代价开发出超长指令字(VLIW)数字信号处理器(DSP)的指令级精度的模拟器,缩短开发周期,提出了一种基于开源模拟器(gem5)的开发方法。对gem5模拟器和VLIW DSP的指令执行流程分别进行分析,指出指令在gem5模拟器上以纯32位指令环境顺序执行和指令在VLIW DSP上以16/32位混合指令环境并行执行之间的矛盾是开发的难点。在gem5的顺序执行模型的基础上,通过加入并行的判决、执行机制和16/32位混合指令的取指机制建立了VLIWDSP的模型,并具体实现了一款VLIW DSP的模拟器。通过一组针对每条指令的测试程序和一组DSP典型应用程序验证了该方法的正确性和可行性。
- 朱大林郭德源何虎
- 关键词:模拟器
- VLIW-Superscalar混合结构处理器分支预测结构设计被引量:1
- 2014年
- 在一款同时支持超标量与超长指令字执行方式混合结构数字信号处理器上,为超标量结构添加分支预测功能。为控制硬件设计的复杂度,同时保证分支预测的命中率,分支预测方案使用gshare预测器。在设计完成的硬件上,运行由Open64编译器编译的Dhrystone、Coremark基准测试程序。实验结果表明,在添加分支预测功能后,处理器的性能提高30%~35%。
- 杜勇李秦华陈峰扬郭德源李笑天何虎
- 关键词:超标量超长指令字数字信号处理器
- 超长指令字变长指令实现方法及实现该方法的处理器
- 一种超长指令字变长指令实现方法及实现该方法的处理器,该方法是首先将难以用固定长度或有限长度指令编码实现的复杂计算操作拆分为多条简单指令,然后将互相有数据依赖关系的多条简单指令在单个时钟周期内分发到处理器的多个硬件执行单元...
- 郭德源何虎
- 文献传递
- 分支预测与值预测在VLIW处理器中的实现被引量:1
- 2015年
- 为了降低超长指令字(VLIW)架构的平均跳转开销和平均访存时延,并减少VLIW程序的代码体积,提出了一种全新的将分支预测与值预测技术应用于VLIW架构的方法.首先分析现有超标量(Superscalar)架构中动态预测技术与VLIW架构中指令静态并行之间所存在的矛盾;通过拓展原有跳转指令和读内存指令,使之与不同的延时槽个数相对应,并根据不同的指令来阻塞流水线或延时写回寄存器,从而解决动态预测技术造成VLIW架构静态调度周期错乱的问题.基于Gem5仿真平台和清华大学Magnolia VLIW数字信号处理器(DSP)的基准测试程序实验表明,该分支预测与值预测技术能显著地提高VLIW架构的性能,缩小VLIW程序的代码体积.
- 李笑天郭德源何虎
- HR-1 DSP软件模拟器设计被引量:1
- 2012年
- HR-1(华睿1号)是核高基重大专项中面向雷达应用的一款高性能DSP。为了方便HR-1的后续开发验证,需要一款相应的软件模拟器进行支持。在一款周期精度的模拟器——gem5的基础上,设计并实现了HR-1模拟器。实验结果表明该模拟器对HR-1的开发验证具有指导意义。
- 陈敏超李笑天郭德源何虎
- 关键词:DSP模拟器
- 面向嵌入式实时操作系统的MPI实现被引量:2
- 2011年
- 为嵌入式VxWorks实时操作系统提出了一种并行编程解决方案,首次将MPI并行编程平台引入到VxWorks系统当中,以Linux系统中的开源MPI实现mpich2为基础,对mpich2中的MPI函数库部分和smpd进程管理程序进行跨系统移植,通过解决Linux与VxWorks系统之间的诸多差异,如系统函数支持、进程创建方式等,为VxWorks系统提供了一款基于socket通信接口的MPI实现——eMPI,搭建了嵌入式MPI并行应用开发平台.
- 郭德源何虎杨旭
- 关键词:MPI嵌入式VXWORKS并行计算RTP
- 一种处理器的指令执行结果存储结构
- 本发明提出一种处理器的指令执行结果存储结构,包括:处理器;和分别与所述处理器相连的通用寄存器堆和SPILL寄存器堆,其中,当所述处理器的指令执行结果的数据量大于所述通用寄存器堆的存储量时,将所述处理器的指令执行结果的一部...
- 何虎章道陵杨旭郭德源
- 文献传递
- 融合了顺序和VLIW的处理器体系结构及指令执行方法
- 一种融合了顺序和VLIW的处理器体系结构,在处理器取指令单元与译码单元之间增设有超长指令字分发单元和顺序执行分发单元,通过一个由执行方式切换指令控制的执行方式选择开关来决定当前所取指令流向其中一个分发单元,如果流向超长指...
- 郭德源杨旭何虎
- 文献传递
- 基于共享存储的高可伸缩嵌入式集群模型被引量:1
- 2012年
- 利用对称多处理机(SMP)作结点可为嵌入式集群带来更高的计算性价比,但多个并行和存储层次也会带来存储一致性、可伸缩性、性能差异等问题.提出一种基于共享存储的嵌入式集群模型LESC.该模型通过高度综合实现"计算单元-互连一致性模块-系统"三级高可伸缩结构,获得功耗成本有效性.LESC完成分布式共享存储的基本功能,其目录缓存一致性和扩展的共享存储机制改善了传统存储层次,并利用"共享存储虚拟网络"提供模块级的高效通信,避免了网络硬件开销,同时支持MPI编程.经该模型的真实系统平台测试,模块内MPI通信性能是传统嵌入式集群的3倍以上,单元间通信性能可达单元内性能的86%以上,Linpack测试其扩展性能在最差情况下接近理想值的70%.
- 尹文轩高翔朱晓静郭德源
- 关键词:分布式共享存储MPI
- 面向高性能DSP的工具软件研究
- 郭德源
- 关键词:超长指令字MPI实现VXWORKSVLIWCOMPILER