您的位置: 专家智库 > >

贾小敏

作品数:14 被引量:15H指数:2
供职机构:国防科学技术大学计算机学院更多>>
发文基金:国家自然科学基金国家教育部博士点基金国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 5篇期刊文章
  • 5篇会议论文
  • 2篇学位论文
  • 2篇专利

领域

  • 11篇自动化与计算...

主题

  • 5篇应用程序
  • 5篇进制
  • 5篇二进制
  • 5篇二进制翻译
  • 4篇准确率
  • 3篇多核
  • 3篇模拟误差
  • 3篇处理器
  • 3篇CACHE
  • 2篇低延迟
  • 2篇多线程
  • 2篇上网
  • 2篇同时多线程
  • 2篇片上网络
  • 2篇取指策略
  • 2篇仲裁器
  • 2篇网络
  • 2篇物理链路
  • 2篇显式
  • 2篇显式并行指令...

机构

  • 14篇国防科学技术...

作者

  • 14篇贾小敏
  • 12篇张民选
  • 11篇齐树波
  • 10篇赵天磊
  • 6篇付桂涛
  • 6篇唐遇星
  • 2篇曹跃胜
  • 2篇孙彩霞
  • 2篇邢座程
  • 2篇陈延仓
  • 2篇胡军
  • 2篇乐大珩
  • 2篇冯超超
  • 2篇李晋文
  • 1篇徐炜遐
  • 1篇何小威
  • 1篇谢胡
  • 1篇孙岩

传媒

  • 1篇计算机研究与...
  • 1篇计算机学报
  • 1篇计算机工程
  • 1篇电子科技大学...
  • 1篇计算机科学
  • 1篇第十五届计算...
  • 1篇第十四届计算...

年份

  • 1篇2012
  • 8篇2011
  • 2篇2010
  • 1篇2009
  • 1篇2007
  • 1篇2006
14 条 记 录,以下是 1-10
排序方式:
程序执行的精确重现技术及其在体系结构模拟中的应用
2011年
近年来有研究提出利用动态二进制翻译技术(Dynamic Binary Translation,DBT)加速程序代表性模拟点的提取,然而这些研究并未考虑DBT方法对模拟结果准确度的影响.实验发现,对于某些程序,DBT加速方法会带来将近20%的误差.经分析,误差的根源在于程序在DBT执行和模拟执行时执行踪迹有巨大差异,即程序执行踪迹的不可重现性.本文系统地分析了引起程序执行踪迹不可重现的原因,提出了解决方法.实验证实,利用文中提出的方法,可以在不影响性能的情况下,实现程序执行踪迹的精确重现,从而保证DBT方法与传统模拟方法具有完全相同的精确度.
赵天磊唐遇星徐炜遐付桂涛齐树波贾小敏张民选
关键词:模拟误差二进制翻译
存储密集流应用感知的多核共享Cache划分机制
片上末级Cache (Last Level Cache,LLC)的管理是片上多核(Chip Multi-Processors,CMP)处理器的关键问题.为充分利用Cache资源,大部分研究将LLC组织为共享结构.Cach...
贾小敏齐树波谢胡赵天磊张民选
关键词:CACHE划分
多核处理器片上Cache访问行为分析与优化机制研究
多核处理器(Chip Multi-Processors,CMP)相比单核处理器具有功耗低、复杂度小、可扩展性好和性价比高等优势,已成为工业界和学术界的主流微处理器体系结构。近来在服务器和数据中心等领域,服务聚合(Serv...
贾小敏
关键词:多核处理器
文献传递
高准确率的应用程序行为分析方法
2011年
模拟是体系结构研究的重要手段。由于模拟的速度非常慢,有研究提出利用动态二进制翻译技术(DBT)提取程序的代表性模拟点,对代表性模拟点进行详细模拟即可获取程序的准确性能参数,从而缩短模拟时间。然而相关研究并未考虑DBT方法对模拟结果准确度的影响。实验发现,对于某些程序,DBT加速方法会给模拟结果带来近20%的误差。为消除误差,系统分析了引起指令踪迹差异的原因,并提出了一系列消除这些差异的方法。实验结果证实,利用该文提出的方法,可以在不影响DBT方法性能的同时,保证其与传统模拟方法具有完全相同的精确度。
赵天磊唐遇星齐树波付桂涛贾小敏张民选
关键词:PROFILE二进制翻译模拟误差
利用动态二进制翻译加速应用程序行为特征分析被引量:6
2012年
应用程序运行时典型行为特征分析的一种重要方法是SimPoint,但是为SimPoint生成基本块向量剖析(basic block vector profile,BBV profile)文件非常耗时.首先提出了一个利用动态二进制翻译技术生成BBVprofile的通用框架DBT-BBV,然后详细分析了几种降低开销的优化技术,最后基于DBT-BBV和提出的优化技术设计实现了一个高效的BBVProfile收集工具QPoint.利用SPEC2006测试程序集评估了所提出的优化技术和QPoint的性能和开销.与现有工具相比,QPoint有两个优势:①QPoint的性能高于现有工具,在普通PC机上最高速度为292MIPS,平均速度为109MIPS,BBV Profile收集的平均开销小于4%,在同类工具中最低;②QPoint支持众多体系结构平台,包括x86/x86_64,ARM,POWER,SPARC,MIPS等,并且可跨指令集收集BBVProfile.结果显示,动态二进制翻译技术在应用程序行为特征分析加速方面具有非常好的效果.
赵天磊唐遇星付桂涛贾小敏齐树波张民选
关键词:二进制翻译PROFILE
基于EPIC同时多线程的软件模拟器开发及取指策略研究
指令级并行(Instruction Level Parallelism,ILP)的进一步开发变得越来越困难,因此线程级并行(Thread Level Parallelism,TLP)便成为了微体系结构研究者们关注的热点。...
贾小敏
关键词:显式并行指令计算同时多线程取指策略资源利用率
面向片上网络的低延迟路由器结构
本发明公开了一种面向片上网络的低延迟路由器结构,目的是解决现有路由器结构转发报片延迟较大和不能够充分的利用物理链路中的存储资源的问题。本发明由P个输入单元,P个输出单元和P个通道双缓冲组成;每个输入单元由一个缓冲分配器,...
李晋文齐树波张民选邢座程曹跃胜胡军冯超超赵天磊乐大珩贾小敏陈延仓
文献传递
SoC体系结构处理器关键技术和研发现状
C设计技术可以充分利用已有的设计积累,显著提高ASIC的设计能力,因此受到了广泛关注.集成电路制造工艺的发展使得芯片集成度越来越高,单芯片晶体管数目越来越多,可以把更多的功能集成到片内,进一步推动了SoC技术的发展.随着...
张民选孙彩霞贾小敏齐树波孙岩何小威
关键词:SOC
面向片上网络的低延迟路由器结构
本发明公开了一种面向片上网络的低延迟路由器结构,目的是解决现有路由器结构转发报片延迟较大和不能够充分的利用物理链路中的存储资源的问题。本发明由P个输入单元,P个输出单元和P个通道双缓冲组成;每个输入单元由一个缓冲分配器,...
李晋文齐树波张民选邢座程曹跃胜胡军冯超超赵天磊乐大珩贾小敏陈延仓
一种高准确率的应用程序行为分析方法
赵天磊唐遇星齐树波付桂涛贾小敏张民选
共2页<12>
聚类工具0