复旦大学软件学院并行处理研究所
- 作品数:102 被引量:439H指数:10
- 相关作者:朱传琪黄波朱嘉华马国凯高晓桐更多>>
- 相关机构:江南大学数字媒体学院中国科学院计算技术研究所华东理工大学信息科学与工程学院计算机科学与工程系更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划国家教育部博士点基金更多>>
- 相关领域:自动化与计算机技术电子电信理学文化科学更多>>
- 程序周期行为技术分析
- 2015年
- 由于程序中存在大量循环和递归,程序执行过程中通常体现大量周期行为。这些周期行为的不同实例行为相似,具有类似体系结构特性,如类似的缓存访问特性和C PI等。这种程序行为执行的相似性也为各种体系结构和编译优化提供了可能。探讨了周期行为分析的关键因素、当前主流技术以及主要应用领域。在对现有周期行为分析技术的不足进行讨论的基础上,展望了程序周期行为分析技术的发展趋势。
- 隋然张铮张为华
- 关键词:动态优化
- 一种高效的基于局部特征的显著区域检测算法被引量:3
- 2012年
- 图像特征提取是图像/视频检索问题的关键。研究人员发现,假如对整张图像或视频帧做特征提取,会产生大量的特征信息,从而影响图像/视频帧的匹配时间。由于人们通常只对图像中部分关键的区域感兴趣,因此在对图像做局部特征提取时可以先对图像进行显著区域检测,排除非关键区域上的特征信息,从而减低匹配所需的特征点数,提高匹配的处理速度。但是由于传统的显著区域检测算法计算复杂,会对图像特征提取过程产生额外的时间开销。提出一种快速的显著区域检测算法,根据局部特征提取算法特征检测阶段得到的特征点分布,利用最大子矩阵和算法,在损失较小的准确度的情况下快速检测出图像的显著区。
- 朱斐文肖菁戴晨张为华
- 用于含过程调用DO循环的循环嵌入方法
- 1997年
- 循环是程序中蕴含并行性最为丰富的一种结构,因此成为并行化编译最主要的对象.但循环内的过程调用严重妨碍了循环的数据相关性分析,使得循环语句潜在的大量并行性得不到开发.本文提出的循环嵌入方法使部分含过程调用循环语句的并行化成为可能,对部分用其它过程间分析技术也能开发其并行性的这一类循环语句采用循环嵌入方法,并行化开销低,并且分析更精确.采用循环嵌入方法还可降低程序由于多次过程调用带来的调度开销.这一方法在作者开发的自动并行化编译系统AFT(automaticPortrantransformer)中得到了实现,对Spec92测试程序包的试验结果表明了本文提出的方法是行之有效的.
- 原庆能丁永华臧斌宇朱传琪
- 关键词:并行编译系统
- 一种动态分布数组的数据划分模式被引量:2
- 2005年
- 数据划分是分布主存系统中并行编译的关键技术,它以数组和包含这些数组的嵌套循环为研究对象,以提高数据局部性和挖掘计算并行性为根本目的。对满足给定模式的动态分布的数组向量,通过选取代表元,给出数据划分模式。将单个嵌套循环内的数据划分技术和过程间投影技术很好地结合,解决了动态分布数组的数据划分问题。这种模式弥补了现有数据划分研究的不足。
- 丁强臧斌宇朱传琪
- 关键词:数据划分
- 多处理机系统循环间数据重用的cache优化被引量:5
- 1998年
- cache的使用缓解了CPU和主存储器之间速度差距太大的矛盾,同时,也使cache的命中率成为影响多处理机系统性能发挥的重要因素.人们对如何加强数据的局部性,提高cache命中率,使多处理机系统的性能得到更好的发挥进行了积极的探索.但过去的工作主要集中于如何加强并行循环内的数据局部性,减少甚至消除并行循环内真假共享cache行所引起的cache抖动,对多处理机系统中循环间数据重用的开发和利用却少有论述.该文对如何开发和利用这些循环间数据重用进行了分析和讨论,并提出了一些切实可行、易于实现的方法.这些方法的应用能够有效地提高cache的命中率。
- 丁永华原庆能臧斌宇朱传琪
- 关键词:多处理机系统数据重用最佳化
- 多核缓存优化技术研究综述被引量:1
- 2015年
- 随着多核技术的迅速发展,并发处理和大批量数据操作成为主流,而为了应对更加复杂的程序行为和愈发庞大的数据量,缓存系统的效率也正面临着严重的挑战.如何在复杂的多核环境中更高效的使用缓存,提高缓存响应速度和数据吞吐量一直是体系结构领域的重要课题和研究热点.针对多核环境中缓存的应用场景进行分析,从缓存的效率,内容和共享使用三个角度进行归纳和总结,提出缓存应用的时延问题,容量问题,共享问题等具有针对性的问题,并且对针对这些具体问题和情境的缓存优化技术进行总结和综述,同时对缓存优化的一些新技术和新的优化角度进行探讨,最后对多核缓存优化技术的发展前景进行展望.
- 闵庆豪张为华
- 关键词:缓存多核架构
- 基于指针数组的数据划分模式被引量:2
- 2005年
- 数据划分是分布主存系统中并行编译的关键技术,它以数组和包含这些数组的嵌套循环为研究对象,以提高数据局部性和挖掘计算并行性为根本目的。传统数据划分模式不适合指向数组的指针数组的数据划分,论文提出了解决该类指针数组数据划分的划分模式,文中称为数组向量的数据划分。分析其数据引用的特性,通过选取代表元,给出数据划分的策略,弥补了现有数据划分研究的不足。
- 丁强臧斌宇朱传琪
- 关键词:数据划分指针数组
- 保证Java精确异常的指令调度技术
- 2009年
- Java语言的精确异常要求和Java程序中频繁出现的异常检测严重阻碍或限制了指令调度在Java本地代码编译中的应用,从而减少了代码的指令级并行度。提出的算法可以使指令调度打破Java精确异常要求,能最大程度地发挥作用,并在有效提高代码执行效率的同时确保精确异常要求在异常发生时不被破坏。实验结果证明该算法的有效性和正确性。
- 张垚
- 关键词:JAVA语言指令调度
- 基于共享向量的二维SIMD调度算法被引量:3
- 2006年
- 针对目前二维SIMD结构编译技术研究的不足,结合二维SIMD结构中普遍采用的复用数据通路和寄存器少的限制和应用程序的特点,提出了一种解决数据向量复用的算法.该算法先使用数据向量的代表元计算各SIMD指令间数据向量的重用信息,再根据这些信息对SIMD指令进行调度.该算法可以有效缓解应用程序在二维SIMD结构执行时加载数据的压力,有效提高结构受限二维SIMD结构的并行性.实验数据显示,该算法对各种应用程序可获得平均2.97的加速比和平均3.86的SIMD指令级并行度.
- 张为华臧斌宇王晔钱兴隆朱传琪
- 关键词:代表元调度
- 利用U模变换增加并行粒度与改善数据访问局部性的方法被引量:4
- 2004年
- 提出了一种利用循环变换增加循环并行粒度 ,改善循环数据访问局部性的方法 .该方法利用了给定二重循环的相关向量集的某些性质 ,将外层循环变量不同而内层循环变量相等的若干次迭代合并 ,成为折叠后迭代空间的一个结点 ,并且保持内层循环的并行性不变 ,从而达到增加循环并行粒度的目的 .对于更普遍的情况 ,该文讨论了如何根据给定循环的循环向量集 ,确定一个U模变换对迭代空间进行变换 ,达到内层循环可并行和扩大循环粒度两个目的 .针对循环变换中数据访问局部性可能变差的问题 ,该文提出了对内层循环先合并 ,根据合并后的相关向量集变换迭代空间 ,以及折叠迭代空间的方法 .该文的方法是wavefront循环并行化方法的一种扩展 .
- 马国凯王欣孃王鹏臧斌宇朱传琪
- 关键词:并行化编译