国家高技术研究发展计划(2008AA01Z137)
- 作品数:16 被引量:14H指数:3
- 相关作者:刘杰迟利华胡庆丰蒋杰徐涵更多>>
- 相关机构:国防科学技术大学并行与分布处理国防科技重点实验室西安卫星测控中心更多>>
- 发文基金:国家高技术研究发展计划国家自然科学基金更多>>
- 相关领域:自动化与计算机技术理学更多>>
- 气象应用基准测试程序MM5 Benchmark并行性能优化
- 2010年
- 由美国国家大气研究中心(NCAR)和宾夕法尼亚大学(PSU)共同开发的MM5模式是目前气象领域广泛采用的中尺度模式之一。由于MM5模式的广泛应用和计算特点,MM5 Benchmark成为了高性能计算领域衡量计算机实用性能的典型应用之一。本文介绍了MM5模式的并行计算方法,针对目前流行的Intel Itanium-2 CPU特点,在性能分析的基础上,从编译选项、代码优化、区域分解、处理机拓扑结构等方面对程序性能进行优化。实际测试结果表明,在某国产巨型机上优化后的持续计算性能最大提高20%左右。
- 朱小谦张卫民宋君强胡庆丰
- 关键词:MM5BENCHMARK性能分析
- 共享存储环境下非平衡动力学方程组并行计算
- 2010年
- OpenMP是现代多核机群系统采用的主要并行编程模型之一,在单CPU多核上可以获得良好的加速性能,但在整个机群系统上使用时,需要解决可扩展性差的问题。首先设计了求解非平衡动力学方程的并行算法。基于分布共享的多核机群系统,采用显式数据分布OpenMP并行计算方法,将数据进行分布式划分,分配到每个OpenMP线程,通过数据共享实现数据交换。计算结果表明显式OpenMP并行程序在保持可读性的同时,具有良好的可扩展性,在4核Xeon处理器构成的分布共享机群系统上,非平衡动力学方程组的数值并行计算可以扩展到1 024个CPU核,具有明显的并行加速计算效果。
- 迟利华刘杰
- 关键词:并行计算
- 高性能计算机性能评测基准HPCC应用研究被引量:4
- 2009年
- 随着高性能计算机研制的迅速发展,其性能评测显得越来越重要。基准HPCC集计算、存储访问、网络传输等性能评测功能于一体,用于对高性能计算机进行综合评价。本文在高性能计算机性能评测技术研究的基础上,对基准HPCC的应用进行了深入探讨。
- 晏益慧张辉
- 关键词:性能评测TOP500
- 基于卷积的Perfect-Match-Layers吸收层算法及其在PIC程序中的应用
- 2009年
- 基于卷积的PML吸收层算法能够吸收各种频率、各种传播方向、各种传播速度的电磁波,同时具有计算量小、吸收率高、可并行性好等突出特点。改进基于卷积的PML算法的差分形式,使之适合于PIC粒子模拟,编制了相应代码。对该算法的测试表明,对各种角度的散射电磁波振幅的吸收率达到0.999以上。
- 胡庆丰徐涵刘杰卓红斌迟利华蒋杰晏益慧
- 关键词:时域有限差分法
- 基于安腾微处理器的程序性能优化与分析被引量:3
- 2011年
- 高性能计算越来越广泛地应用到科学和工程的各个领域,但实际应用程序获得的性能并未随着机器峰值性能的提高而同比例提高,应用程序只能发挥峰值性能的5%~10%左右,而且两者的差距在扩大,程序性能优化作为解决该问题的方法之一得到了学术界的广泛关注。本文基于安腾微处理器,总结了程序优化的通用方法,给出了程序优化与分析的一般步骤。根据优化与分析步骤,首先对四个程序进行了详细的性能分析,找到性能瓶颈和重点子程序;然后分别根据四个程序的特点,采用基于Cache和指令流水线的优化技术,对程序进行了性能优化;最后给出了性能优化测试结果,分别得到8%~33%的性能提高,取得了良好的优化效果。
- 迟利华刘杰
- 关键词:程序性能优化
- 一种并行扫描计算局部调度算法
- 2009年
- 为了解决优先级调度算法的可扩展性问题,本文设计并实现了一种局部的深度优先扫描算法(PDFHDS)。该算法在计算初始优先级和计算最终优先级时,对每个结点只遍历一次,在这一次遍历中只访问该结点的全部直接前驱,避免了在PDFDS算法中每修改一个结点的优先级就要访问其全部前驱结点的情况,减少了一部分计算开销,消息传递过程使用单向传递,只向前邻处理器传递有多级外部后继的网格点信息,而不传递只具有一级外部后继的网格点信息,节省了通信开销。从实验数据可知,虽然在处理器个数少的时候性能比不上DFHDS算法,但对于多处理器的情况,PDFDS算法的性能可以比DFHDS算法的提高50%,甚至更多。
- 刘杰陈豆豆迟利华徐涵蒋杰胡庆丰
- 关键词:并行计算
- 并行扫描计算的局部调度方法
- 2010年
- 使用确定论方法并行求解输运方程需要通过并行扫描计算完成,局部调度方法是实现高效并行扫描计算的关键,而传统的调度问题是NP完全问题,是并行计算领域的难点之一。文中对多离散方向并行扫描计算给出了明确的描述,给出了对局部调度方法的性能要求,对并行扫描计算的调度问题和传统调度问题的区别进行了分析。设计了一种基于任务优先级的局部调度方法,利用相邻处理机任务间依赖信息,结合并行扫描计算的一般计算框架,在机群系统上进行了性能测试,测试结果表明文中设计的调度方法具有良好的并行计算加速效果。
- 田平刘杰
- 关键词:调度方法输运方程
- 一种求解输运方程的并行调度算法
- 2010年
- 高效并行扫描问题是调度问题的子集,调度问题是NP完全问题.针对输运问题的特点,如何按特定的计算次序调度本地网格单元,以保证最佳的计算与通信性能是一个难度很大的问题.文中设计了一种基于局部深度优先的优先级(PDFDS)算法,该算法具有局部性、通信量小、优先级队列好等特点.将PDFDS算法应用到求解二维粒子输运方程的程序中,与现有的调度算法相比,新算法具有更好的并行计算效果,对于大规模计算问题,可以扩展到1024个处理器,相对于64个处理器的并行效率达到了96%.
- 周涤宇刘杰
- 关键词:输运方程并行调度优先级算法非结构网格
- 非结构网格粒子输运Sn并行算法被引量:2
- 2010年
- 本文基于网格区域剖分,提出了一种新的非结构网格粒子输运Sn并行算法,实现了多个角方向和多个能群的同时计算,在计算的过程中不用进行优先级计算和优先级队列维护,只需要按照计算队列的次序组织并行计算。综合考虑所有方向和所有网格点的数据依赖关系,结合B-level优先级,提出了一种优先级计算方法,优先计算需要数据发送的任务,延迟需要接收数据的任务,达到减少处理器等待时间和计算与通信重叠的目的。使用本文的Sn并行算法和优先级队列针对二维粒子输运问题进行的数值实验表明,并行算法具有良好的并行计算加速效果,扩展到1 024个处理机时,相对64个处理机的并行效率达到52%。
- 迟利华刘杰田平
- 关键词:粒子输运优先级算法
- 基于多核平台多流体网格法的MPI-OMP嵌套并行实现
- 2009年
- 多核体系结构的问世为开发人员设计和实现应用软件提供了一个更强大的并行计算平台,本文提出了一种多流体网格法的MPI-OMP嵌套并行方案,并给出了其在多核平台上的计算结果。
- 晏益慧
- 关键词:OMPMPI