李正杰
- 作品数:3 被引量:5H指数:1
- 供职机构:上海大学计算机工程与科学学院更多>>
- 发文基金:上海市教育委员会重点学科基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- FMM算法中PP问题在GPU上的研究与实现
- FMM算法是20 世纪最伟大的十大算法之一[2],由于是一种树形算法,要把其移植到GPU 上是一件极 富挑战性的工作。目前FMM的并行算法已有相当多的研究和实现,PetFMM [1]就是其中一种比较优秀的并行算 法实现。...
- 李正杰徐炜民柴亚辉郑衍衡
- 关键词:FMMCUDAGPU
- FMM算法中PP问题在GPU上的研究与实现被引量:1
- 2011年
- 针对目前快速多极子算法中PP问题在图形处理器上实现的缺点,如负载不平衡和计算规模受显存大小的限制等,提出了一种新的基于统一计算设备架构平台的实现方法。采取以Box为并行单位、在内存中开辟缓冲区与多线程流水计算等方式,使其适合于CPU和GPU组成的异构体系结构,充分利用CUDA编程模型的高并行性加速PP问题。实验结果表明,采用CUDA加速后,PP问题的计算时间明显降低,提高了整个FMM模拟效率,适合于各种多体问题的实时模拟。
- 李正杰徐炜民柴亚辉郑衍衡
- 关键词:图形处理器统一计算架构
- 邻居搜索问题在CUDA上基于KD-TRIE方法的优化与实现被引量:4
- 2012年
- 介绍如何在CUDA上搭建KD—TRIE,并对其进行搜索,使其能适应解决邻居搜索问题.实验结果表明,当搜索半径较小(如整个空间直径的0.01和0.001),数据规模较大(如10^6)时,使用KD-TRIE进行搜索的效果最佳,与蛮力算法相比可以达到加速比5000~15000倍的效果;当搜索半径较大时,加速比会相应减少.采取优化措施,可以提高加速比.
- 包南森李正杰柴亚辉徐炜民
- 关键词:CUDA图形处理器