您的位置: 专家智库 > >

李正杰

作品数:3 被引量:5H指数:1
供职机构:上海大学计算机工程与科学学院更多>>
发文基金:上海市教育委员会重点学科基金国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇期刊文章
  • 1篇会议论文

领域

  • 3篇自动化与计算...

主题

  • 2篇图形处理器
  • 2篇CUDA
  • 2篇GPU
  • 2篇处理器
  • 1篇搜索
  • 1篇搜索问题
  • 1篇统一计算架构
  • 1篇结点
  • 1篇计算架构
  • 1篇架构
  • 1篇PP
  • 1篇TRIE
  • 1篇FMM
  • 1篇KD

机构

  • 3篇上海大学
  • 1篇华东交通大学

作者

  • 3篇徐炜民
  • 3篇柴亚辉
  • 3篇李正杰
  • 2篇郑衍衡
  • 1篇包南森

传媒

  • 1篇计算机工程与...
  • 1篇上海大学学报...

年份

  • 1篇2012
  • 1篇2011
  • 1篇2010
3 条 记 录,以下是 1-3
排序方式:
FMM算法中PP问题在GPU上的研究与实现
FMM算法是20 世纪最伟大的十大算法之一[2],由于是一种树形算法,要把其移植到GPU 上是一件极 富挑战性的工作。目前FMM的并行算法已有相当多的研究和实现,PetFMM [1]就是其中一种比较优秀的并行算 法实现。...
李正杰徐炜民柴亚辉郑衍衡
关键词:FMMCUDAGPU
FMM算法中PP问题在GPU上的研究与实现被引量:1
2011年
针对目前快速多极子算法中PP问题在图形处理器上实现的缺点,如负载不平衡和计算规模受显存大小的限制等,提出了一种新的基于统一计算设备架构平台的实现方法。采取以Box为并行单位、在内存中开辟缓冲区与多线程流水计算等方式,使其适合于CPU和GPU组成的异构体系结构,充分利用CUDA编程模型的高并行性加速PP问题。实验结果表明,采用CUDA加速后,PP问题的计算时间明显降低,提高了整个FMM模拟效率,适合于各种多体问题的实时模拟。
李正杰徐炜民柴亚辉郑衍衡
关键词:图形处理器统一计算架构
邻居搜索问题在CUDA上基于KD-TRIE方法的优化与实现被引量:4
2012年
介绍如何在CUDA上搭建KD—TRIE,并对其进行搜索,使其能适应解决邻居搜索问题.实验结果表明,当搜索半径较小(如整个空间直径的0.01和0.001),数据规模较大(如10^6)时,使用KD-TRIE进行搜索的效果最佳,与蛮力算法相比可以达到加速比5000~15000倍的效果;当搜索半径较大时,加速比会相应减少.采取优化措施,可以提高加速比.
包南森李正杰柴亚辉徐炜民
关键词:CUDA图形处理器
共1页<1>
聚类工具0