王向前
- 作品数:32 被引量:73H指数:4
- 供职机构:中国电子科技集团公司第三十八研究所更多>>
- 发文基金:国家科技重大专项国家自然科学基金安徽省自然科学基金更多>>
- 相关领域:自动化与计算机技术电子电信自然科学总论更多>>
- 推测执行技术在HPMR系统通信优化中的应用被引量:2
- 2010年
- HPMR(high performance MapReduce)系统是一个采用MapReduce模型的高性能计算软件支撑平台.在进行高性能计算时,HPMR往往需要很多轮Map-Reduce过程,中间的通信过程由KV路由和KV传输组成.KV传输依照KV路由阶段产生的KV路由表进行.HPMR程序的典型通信特征是每一轮的KV传输以高概率使用上一轮的KV路由表.根据这一特点,提出在HPMR的通信模型中引入推测执行技术,由此减少了KV路由的次数,使得HPMR的通信性能得到大大地提升.
- 王昊王向前郑启龙
- 关键词:MAPREDUCE
- 分块内存的数据分布优化被引量:1
- 2015年
- 为了提高访存效率,提供可以与计算流水线并行执行的多个独立的访存流水线,魂芯DSP片上存储器设计时采用分块内存结构,并在核内提供多个独立的地址生成单元用于访存操作.针对分块内存的结构特点,编译器对程序中的存储访问构建关于变量的冲突图,对分块内存进行存储块分配,优化数据在分块内存的分布.以数据在分块内存的优化分布为基础,指导程序中访存操作在地址生成单元的优化分配,使得编译器生成的代码可以最大程度地挖掘程序中数据访问的并行性.实验表明,基于分块内存的数据分配分布优化为其它优化如地址寄存器的分簇、访存向量化、软件流水等经典优化提供了良好基础,保证了编译器生成的代码可以充分发挥魂芯DSP提供的指令级并行能力.
- 王向前洪一郑启龙
- 关键词:数据分布
- 并行计算模型参数动态分析软件包设计
- 2009年
- 并行计算模型的发展引入越来越多的模型参数。对并行计算模型参数动态采集分析软件包DEMPAT的整体框架进行研究,实现基于硬件性能计数器的存储层次参数采集模块。实验表明,该模块能够准确快速地获取存储层次参数且具有较好的可移植性。
- 王向前张云泉侯晓吻
- 关键词:并行计算模型
- 一种平衡的全局指令调度新框架研究
- 2014年
- 全局指令调度可以分为结构驱动和剖析驱动两类。我们展示了一种新算法,尝试结合以上两类方法各自的特点,同时避免它们的一些缺点。该算法可以在寄存器分配之前和之后调用,它已经在Open64编译器上实现,其结果在BWDSP100处理器上得到了评估。
- 王昊王向前
- 高性能MapReduce系统的优化
- 近年来,以多核集群为主流架构的高性能计算机成为高性能计算的主要硬件支撑平台。而共享变量和消息传递是最常用的两类并行编程模型。但其对并行的描述与表达层次较低。开发者在使用它们时,必须花费许多时间和精力来熟悉并显式地使用它们...
- 王向前
- 关键词:内存池
- 文献传递
- 一种分簇结构的部分谓词实现及编译优化方法
- 本发明涉及一种分簇结构的部分谓词实现及编译优化方法,包括通过数据总线与各个片上内存进行双向通讯的计算簇X簇、Y簇、Z簇和T簇,以及通过地址总线与各个片上内存进行双向通讯的地址簇U簇、V簇和W簇,在X簇、Y簇、Z簇和T簇上...
- 王向前王昊项利萍孙立宏洪一
- 文献传递
- 一种基于数字信号处理的高效并行处理优化方法
- 本发明涉及基于数字信号处理的高效并行处理优化方法,该方法包括下列顺序的步骤:(1)在原位逆序的基础上进行块原位部分逆序;(2)三阶/四阶合并;(3)中间的二阶合并循环;(4)最后两阶计算/最终逆序。本发明针对数字信号处理...
- 王向前方志红贾光帅耿锐郭二辉洪一
- HPCC在IBM刀片机群上的诊断测试与结果分析
- 2009年
- 在IBMJS21 Blade Center上进行2次HPCC测试,介绍HPCC的结果分析方法,并采用分层模型AHPCC对HPCC的测试结果进行分析。其目的是通过在高性能机群上执行HPCC测试说明HPCC测试对机群系统的评价和诊断能力。实验发现,在之前的HPL测试结果一直不理想并且无法更进一步发现和解决问题的情况下,采用HPCC测试能够较好地评价系统和诊断系统问题。通过分层模型的评价,能够得到更多关于目标系统的性能参数和发现可能的性能瓶颈,为系统设计及构建积累有价值的经验。
- 王宣强王向前张云泉
- 一种面向数字信号处理器的多谓词控制及编译优化方法
- 本发明涉及一种面向数字信号处理器的多谓词控制及编译优化方法,多谓词控制指令格式为:(p(1),p(2),…,p(n))Rs=Rm op Rn,含义为p(1),p(2),…,p(n),n>=1,n个控制谓词都为真时,...
- 王向前王昊项利萍郭二辉洪一孙立宏
- 文献传递
- 面向DSP的零开销循环编译优化
- 2015年
- 魂芯DSP是一款具有分簇结构的、支持SIMD的VLIW高性能通用处理器。为了提高循环执行的效率,魂芯DSP设计了硬件支持的零开销循环机制。提出了一个通用的从编译层面支持的零开销循环的识别转换算法。以典型的DSP测试用例进行实验评测,零开销循环的识别可以带来6%~37%的性能提升。
- 项利萍王向前