您的位置: 专家智库 > >

王桂彬

作品数:36 被引量:47H指数:4
供职机构:国防科学技术大学更多>>
发文基金:国家自然科学基金国家科技重大专项国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术电子电信更多>>

文献类型

  • 16篇专利
  • 14篇期刊文章
  • 3篇学位论文
  • 3篇会议论文

领域

  • 23篇自动化与计算...
  • 3篇电子电信

主题

  • 11篇功耗
  • 9篇异构
  • 7篇功耗优化
  • 6篇网络
  • 6篇缓存
  • 6篇计算机
  • 6篇GPU
  • 5篇低功耗
  • 5篇低功耗优化
  • 4篇异构系统
  • 4篇并行计算
  • 4篇并行计算机
  • 4篇处理器
  • 4篇存储器
  • 3篇调度
  • 3篇映射
  • 3篇通信
  • 3篇流编程模型
  • 3篇流处理器
  • 3篇编程

机构

  • 33篇国防科学技术...
  • 2篇南昌航空大学
  • 1篇并行与分布处...
  • 1篇电子信息系统...

作者

  • 36篇王桂彬
  • 16篇夏军
  • 16篇王克非
  • 16篇徐炜遐
  • 16篇庞征斌
  • 16篇罗章
  • 16篇王绍刚
  • 16篇张建民
  • 16篇陆平静
  • 16篇董德尊
  • 16篇赖明澈
  • 16篇常俊胜
  • 16篇张峻
  • 16篇齐星云
  • 16篇徐金波
  • 14篇陈虎
  • 14篇童元满
  • 14篇肖立权
  • 8篇杨学军
  • 6篇唐滔

传媒

  • 3篇计算机学报
  • 3篇计算机工程与...
  • 3篇软件学报
  • 2篇2006中国...
  • 1篇计算机研究与...
  • 1篇计算机工程
  • 1篇小型微型计算...
  • 1篇计算机系统应...
  • 1篇计算机科学
  • 1篇第14届全国...

年份

  • 1篇2017
  • 2篇2016
  • 2篇2015
  • 6篇2014
  • 8篇2013
  • 4篇2012
  • 5篇2011
  • 1篇2008
  • 3篇2007
  • 4篇2006
36 条 记 录,以下是 1-10
排序方式:
面向科学计算的流应用开发与优化
流处理器集成了大量的计算单元和软件管理的片上存储器,对于数据密集的媒体应用可以获得极高的计算性能,它具有低主频、低功耗、高数据并行性、高峰值性能等特点。因此,研究在大规模科学和工程计算领域应用流处理器是当前的一个热点问题...
王桂彬
关键词:流体系结构流编程模型
任意载波分配OFDMA上行链路同步
2014年
为了获得任意载波分配正交频分复用多址(OFDMA)系统上行链路更优的频率偏移(CFOs)和定时误差(TEs)联合估计性能,利用恒包络零自相关(Constant Amplitude Zero Auto Correlation;CAZAC)序列和增加训练块数对已有的联合估计算法进行改进.虽然传输效率降低,但是估计性能有所提高,这种牺牲是值得的.仿真结果表明,这种改进算法估计性能更好,应用范围更为广泛.
王桂彬宋高俊赵文婷王佳仲
关键词:CAZAC序列
一种面向异构并行系统的最大功耗管理方法被引量:3
2013年
高功耗已成为制约高性能计算机发展的重要问题之一.近年来,大量研究关注于如何在满足系统功耗约束的条件下优化系统执行性能.然而,已有方法大都针对同构系统,未考虑异构处理器之间的功耗或速度差异,难以高效应用于基于加速器的异构系统.对当前异构并行系统执行模型进行了抽象,并提出了融合两级功耗控制机制的系统功耗管理框架,自顶向下依次为系统级功耗控制器和异构处理引擎功耗控制器.在异构处理引擎功耗控制中,针对类OpenMP并行循环,首先分析了异构多处理器在满足功耗约束条件下达到性能最优的条件.基于该结果,给出了功耗受限的并行循环划分算法,该方法通过协调并行循环调度和动态电压频率调节技术以优化异构并行处理.在系统级功耗控制中,建立了异构处理引擎效能评估方法,以此作为功耗划分的依据,在兼顾并发应用公平性的同时,提高系统整体执行效能.最后,基于典型CPU-GPU异构系统验证了方法的有效性.
王桂彬杜静唐滔
关键词:任务调度动态电压
模板操作在GPU上的实现与优化被引量:2
2011年
随着GPU的快速发展,使用GPU来加速科学计算应用已成为必然趋势。本文抽取了SPEC2000中富含模板操作的Mgrid的两个典型子程序Rprj3和Interp,使用Brook+语言把它们移植到AMD GPU上运行。采用Brook+语言提供的线程调节机制,我们实现了不同线程粒度下的程序版本,并分析了加速比不同的原因,总结了线程粒度调节对模板程序移植的指导意义。我们使用AMD RadeonHD4870 GPU作为实验平台,对比Intel Xeon E5405 CPU上的运行结果发现,在最大规模下,Rprj3获得的相对于CPU版本的加速比为5.37×,Interp获得的相对于CPU版本的加速比为12.8×。
方旭东唐玉华王桂彬唐滔
关键词:GPU
一种基于网络控制器的超大规模栅栏同步方法
一种基于网络控制器的超大规模栅栏同步方法,步骤为:(1)进行MPI栅栏同步调用,软件构造同步通信域,并将参与线程与物理节点的映射关系发送给所有参与节点;(2)基于软件线程号,构建栅栏同步描述符;(3)基本节点的信息,完成...
徐炜遐王绍刚肖立权庞征斌王克非夏军童元满陈虎张峻齐星云王桂彬常俊胜张建民罗章徐金波董德尊赖明澈陆平静
文献传递
用于无缓存光交换网络的自适应路由方法
本发明公开了一种用于无缓存光交换网络的自适应路由方法,步骤如下:1)源计算节点将信息存入待发送信息队列;2)计算节点赋予路由标记;3)计算节点监听其所连交换节点,当有空闲输出时将信息输出;4)交换节点对内输出端口有空闲则...
罗章徐金波董德尊赖明澈陆平静王绍刚徐炜遐肖立权庞征斌王克非夏军童元满陈虎张峻齐星云王桂彬常俊胜张建民
基于通信感知任务划分的异构系统低功耗优化方法
2011年
针对由通用微处理器和专用加速部件构成的异构并行系统,提出结合通信感知的并行任务划分和动态电压频率调节技术的异构系统能耗优化方法,该方法旨在将并行任务图划分并映射在异构处理单元,在满足性能约束的条件下最小化系统能耗.在目前典型异构并行系统中,主处理器与加速部件大都通过系统总线连接,必然引入不可忽略的通信开销,因此通信感知的任务划分技术是该问题的关键.提出了基于整数线性规划的静态最优能耗优化方法和基于遗传算法的动态能耗优化方法.并通过一个典型科学计算应用验证了本文方法的有效性.
王桂彬
关键词:低功耗优化
Co-array Fortran编译器的设计与实现被引量:1
2007年
基于GUN Fortran编译器,设计并实现了co-array Fortran(CAF)编译器。通过源到源的转换将CAF代码转换为带有运行库调用的Fortran 90程序。典型用例的测试表明,CAF具有较好的可编程性,且CAF程序通过对数据分布的显式控制可获得比OpenMP程序更为高效的执行性能。
唐沛蓉黄春杨学军王桂彬
关键词:FORTRAN
基于硬件性能计数器的GPU功耗预测模型被引量:3
2012年
图形处理器GPU以其高性能、高能效优势成为当前异构高性能计算机系统主要采用的加速部件。虽然GPU具有较高的理论峰值能效,但其绝对功耗开销明显高于通用处理器。随着GPU在高性能计算领域的应用逐渐扩展,面向GPU的低功耗优化研究将成为该领域的重要研究方向之一。准确的功耗预测是功耗优化研究的重要前提,本文提出了基于硬件性能计数器的GPU功耗预测方法。该方法基于硬件性能计数器信息,结合GPU在部分运行频率下的功耗值,通过线性回归的方法预测处理器在其他运行频率下的功耗值。实验结果表明,该方法可以准确地预测GPU功耗。
王桂彬
面向高速缓冲存储器的可综合伪随机验证方法及装置
本发明公开了一种面向高速缓冲存储器的可综合伪随机验证方法及装置,方法步骤如下:1)建立数据镜像模块并初始化;2)生成伪随机数,构造访存控制数据信号并发送到高速缓冲存储器,同时启动超时计数器并在超时后报告超时错误;当收到高...
张建民罗章徐金波董德尊赖明澈陆平静黎铁军王绍刚徐炜遐肖立权庞征斌王克非夏军童元满陈虎张峻齐星云王桂彬常俊胜
共4页<1234>
聚类工具0