张轮凯 作品数:8 被引量:8 H指数:2 供职机构: 中国科学院计算技术研究所 更多>> 发文基金: 国家自然科学基金 国家重点基础研究发展计划 创新研究群体科学基金 更多>> 相关领域: 自动化与计算机技术 更多>>
一种针对片上众核结构共享末级缓存的改进的LFU替换算法 为了得到更高的吞吐率和性能功耗比,众核处理器 (Manycore Processor) 摒弃了复杂的乱序处理器核,而在芯片内集成了大量的轻量级顺序处理器核。为了更好地支持核间数据共享,并减少访问片外存储器带来的开销,众核... 张轮凯 宋风龙 王达提升稀疏目录缓存一致性系统性能的方法 被引量:3 2014年 稀疏目录技术在缓存一致性非一致存储访问(cache coherent non-uniform memory access,ccNUMA)系统中有广泛应用.但是,稀疏目录技术的一个主要缺陷在于目录项替换在目录热点存在的情况下会严重降低系统的性能.针对此问题,研究如何提升稀疏目录性能.首先,从定性和定量的角度对主流的稀疏目录替换算法进行了分析,并且发现最为原始的最久未使用(least-recent-used,LRU)算法的性能实际上要优于一些近期提出的目录替换算法,如最少共享者(least-sharer-count,LSC)算法.其次,将victim cache的思想应用到稀疏目录上,提出了victim目录(victim directory),该技术在主稀疏目录模块上加入了一个小的全相联二级目录存储.最后,提出了选择性victim目录(selective victim directory)技术,使得victim目录选择性地仅存储有用的目录项,从而进一步减少了目录替换的数量.选择性victim目录通过向所有节点的cache发出探查消息(probe messages),从而选择性地存储较为有用的目录项.实验证明,选择性victim目录取得了比简单victim目录更好的性能;而且在仅增加了1KB左右的硬件开销的代价下,选择性victim目录节省了35.7%的程序运行时间. 张轮凯 宋风龙 王达 范东睿 孙凝晖一种片上共享高速缓存的替换装置和方法以及相应处理器 本发明提供一种片上共享高速缓存的替换装置和方法以及相应处理器,该装置包括局部性打分模块和替换选择模块,其中:所述局部性打分模块包括多个打分寄存器,所述打分寄存器用于存储缓存块地址和所述缓存块地址的分数;所述局部性打分模块... 张轮凯 李海忠 雷峥蒙 张浩 范东睿一种多核或众核处理器功能验证设备及方法 本发明提供一种多核或众核处理器功能验证设备,包括重复逻辑电路、片上存储以及其它逻辑电路;重复逻辑电路包括用于模拟多核或众核处理器中的各个结点的复用结点、用于对复用结点的功能验证过程进行控制的控制模块和用于存储与所述复用结... 马啸宇 范东睿 包尔固德 张轮凯文献传递 一种带有无效缓存路访问过滤机制的低功耗高速缓存 2012年 功耗是当今处理器设计领域的重要问题之一.随着多核处理器的普及,片上缓存占有了越来越多的芯片面积和功耗.提出一种带有无效缓存路访问过滤机制的低功耗高速缓存结构来降低CPU的动态功耗,具体为,通过无效缓存块的预先检查(Pre-Invalid Way Checking,PIWC)消除对无效缓存路的访问,及通过不匹配缓存路的预先检测(Pre-Mismatch Way Detecting,PMWD)消除对tag低位不匹配缓存路的访问.对实际程序的测试表明,65.2%-88.9%缓存路的无效访问可以通过以上方法被消除,约60.9%-85.6%由缓存访问带来的动态能耗从而被降低.同时,跟tag-data顺序访问方法相比,对于大多数程序,我们的方法可以获得5.1%-13.8%的节能效果提升. 范灵俊 唐士斌 张轮凯 郑亚松 张浩关键词:动态功耗 一种多核或众核处理器功能验证设备及方法 本发明提供一种多核或众核处理器功能验证设备,包括重复逻辑电路、片上存储以及其它逻辑电路;重复逻辑电路包括用于模拟多核或众核处理器中的各个结点的复用结点、用于对复用结点的功能验证过程进行控制的控制模块和用于存储与所述复用结... 马啸宇 范东睿 包尔固德 张轮凯文献传递 一种针对片上众核结构共享末级缓存的改进的LFU替换算法 被引量:5 2013年 为了得到更高的吞吐率和性能功耗比,众核处理器摒弃了复杂的乱序处理器核,而在芯片内集成了大量的轻量级顺序处理器核。为了更好地支持核间数据共享,并减少访问片外存储器带来的开销,众核处理器往往采用共享的末级缓存LLC(Last LevelCache)。因为需要对为数众多相对独立的访问请求作出响应,因此相对于传统多核处理器的末级片内缓存,众核处理器的末级片内缓存更容易产生抖动现象。传统的最久未使用LRU(Least Recent Used)高速缓存替换策略在这种情况下往往无能为力,而几种最新提出的高速缓存替换策略也见效甚微。基于传统的最不经常使用LFU(Least Frequent Used)替换算法,提出一种改进的高速缓存替换算法。相对于LFU替换算法,该算法获取信息的粒度更粗,并且可以掌握更加全局的信息,而这些优势使得该算法更适合作为众核处理器末级片内缓存的替换算法。实验结果表明,在一个64核的众核处理器上,该替换算法可以有效地缓解末级片内缓存的抖动现象,同时该算法实现需要的硬件开销很小。 张轮凯 宋风龙 王达一种片上共享高速缓存的替换装置和方法以及相应处理器 本发明提供一种片上共享高速缓存的替换装置和方法以及相应处理器,该装置包括局部性打分模块和替换选择模块,其中:所述局部性打分模块包括多个打分寄存器,所述打分寄存器用于存储缓存块地址和所述缓存块地址的分数;所述局部性打分模块... 张轮凯 李海忠 雷峥蒙 张浩 范东睿文献传递