您的位置: 专家智库 > >

国家自然科学基金(61133004)

作品数:10 被引量:41H指数:3
相关作者:钱德沛汪文祥刘轶张晶晶刘驰更多>>
相关机构:中国科学院大学龙芯中科技术有限公司中国科学院更多>>
发文基金:国家自然科学基金国家高技术研究发展计划国家科技重大专项更多>>
相关领域:自动化与计算机技术电子电信更多>>

文献类型

  • 9篇中文期刊文章

领域

  • 8篇自动化与计算...
  • 1篇电子电信

主题

  • 5篇处理器
  • 4篇多核
  • 4篇多核处理
  • 4篇多核处理器
  • 3篇一致性
  • 2篇片上多核处理...
  • 2篇缓存
  • 2篇缓存一致性
  • 2篇编程
  • 1篇虚拟化
  • 1篇虚拟机
  • 1篇硬件
  • 1篇事务存储
  • 1篇事务存储系统
  • 1篇算子
  • 1篇启动性能
  • 1篇区域共享
  • 1篇细粒度
  • 1篇细粒度并行
  • 1篇响应速度

机构

  • 4篇中国科学院
  • 4篇中国科学院大...
  • 4篇龙芯中科技术...
  • 3篇北京航空航天...
  • 1篇华为技术有限...
  • 1篇深圳市腾讯计...

作者

  • 2篇钱德沛
  • 2篇刘轶
  • 2篇汪文祥
  • 1篇栾钟治
  • 1篇吴瑞阳
  • 1篇王焕东
  • 1篇胡伟武
  • 1篇李玲
  • 1篇郝沁汾
  • 1篇陈李维
  • 1篇孟由
  • 1篇张广飞
  • 1篇王永会
  • 1篇曾露
  • 1篇陈新科
  • 1篇傅杰
  • 1篇任彤
  • 1篇宋平
  • 1篇刘驰
  • 1篇谢明

传媒

  • 3篇高技术通讯
  • 2篇软件学报
  • 1篇Journa...
  • 1篇小型微型计算...
  • 1篇中国科学:信...
  • 1篇Fronti...

年份

  • 1篇2019
  • 3篇2015
  • 2篇2014
  • 2篇2013
  • 1篇2012
10 条 记 录,以下是 1-9
排序方式:
A low-power high-swing voltage-mode transmitter被引量:2
2012年
A low-power voltage-mode-logic (VML) transmitter fabricated in TSMC 28 nm CMOS technology is presented. The VML driver outputs a high-swing signal and consumes less power than a current-mode-logic (CML) driver. To further reduce power, the driver is divided into two voltage domains by level shifters. Moreover, the proposed driver topology can achieve mutually decoupled impedance self-calibration and equalization control. The measurement result shows that the transmitter merely dissipates 23 roW/channel while exhibiting an 880 mV differential eye height at 4.488 Gb/s.
陈帅李昊石小兵杨丽琼杨宗仁钟石强黄令仪
关键词:EQUALIZATION
A novel index system describing program runtime characteristics for workload consolidation
2019年
Workload consolidation is a common method to improve the resource utilization in clusters or data centers. In order to achieve efficient workload consolidation, the runtime characteristics of a program should be taken into con-sideration in scheduling. In this paper, we propose a novel index system for efficiently describing the program runtime characteristics. With the help of this index system, programs can be classified by the following runtime characteristics: 1) dependence to multi-dimensional resources including CPU, disk I/O, memory and network I/O;and 2) impact and vulnerability to resource sharing embodied by resource usage and resource sensitivity. In order to verify the effectiveness of this novel index system in workload consolidation, a scheduling strategy, Sche-index, using the new index system for workload consolidation is proposed. Experiment results show that compared with traditional least-loaded scheduling strategy, Sche-index can improve both program performance and system resource utilization significantly.
Lin WANGDepei QIANRui WANGZhongzhi LUANHailong YANGHuaxiang ZHANG
关键词:RUNTIMECHARACTERISTICSWORKLOADCONSOLIDATIONCLUSTERSCHEDULING
一种基于算子的可扩展复杂事件处理模型被引量:8
2014年
随着大数据处理的深入发展,系统单位时间内产生的数据日趋庞大,数据间的关联关系日趋复杂,这使得传统的"存储-查询"或者"发布-订阅"的方式无法很好地满足诸如故障监控、股票分析、医疗及生命保障等对大数据具有实时处理需求的系统.复杂事件处理技术实现的是将用户对特定的事件序列的查询需求映射到特定识别结构上.该结构从多个持续的数据流中分析并提取满足特定模式的事件序列.该技术能够很好地支持对大量数据进行实时在线分析.但由于在数据处理的过程中,系统不可能预置全部的查询语义,许多系统在使用过程中会需要使用新的语义,以查询新产生的模式.因此,一种支持扩展的语义的复杂事件处理模型是非常必要的.同时,现有的复杂事件处理模型仅针对某几类特定的查询进行描述以及优化,对整体模型缺乏统一描述,导致许多模型在多规则复杂查询的情况下效率欠佳.针对上述问题,提出了基于算子的可扩展复杂事件处理模型.该模型能够良好地支持现有的各类查询语义,具有较快的识别速度.基于该模型的形式化描述,对系统在识别过程中的性能消耗进行了详细分析,给出了模型构造最优算法.通过实验验证了算子模型优化方案的正确性.实验结果表明,经过优化后的树结构事件处理速度比开源复杂事件处理引擎Esper快3倍以上.
孟由栾钟治谢明钱德沛
用于多核同步优化的cache一致性协议设计
2013年
通过对多核同步过程中的访存行为进行分析,提出了一种识别同步类型的方法,并设计了一种实现同步优化的新的cache一致性协议。该协议增加了一个用于记录同步信息的cache状态,通过阻塞的方式可以让多个处理器核串行地完成同步操作,保证同步操作中原子指令能够顺利执行成功,从而大大减少由多核同步冲突引发的访存请求数量,将多核同步过程中的访存行为优化到了几乎最好的情况。实验结果表明,通过同步优化,这个新的cache一致性协议能够使多核同步的性能提升到接近最理想的结果。实验表明,相比传统的cache一致性协议,实验中采用的几个标准多核性能测试程序优化后的同步性能提升了1倍,而并行程序整体运行时间降低25%。
陈李维张广飞张广飞汪文祥王焕东
关键词:CACHE一致性协议
龙芯GS464E处理器核架构设计被引量:15
2015年
龙芯GS464E是龙芯公司最新推出的高性能处理器核架构.在本文中,将介绍GS464E架构的核心特性.相比于之前的GS464架构,重点强化了访存性能和分支预测准确率,实现了MIPS DSP指令集和虚拟机支持,增大了处理器中各项队列的项数,并增大了Cache容量和TLB容量.访存子系统拥有3级Cache结构,每一级都采用LRU替换策略,可以支持多核缓存一致性协议.经过上述强化设计,GS464E处理器核已成为一个创新性的高性能处理器核架构.
吴瑞阳汪文祥王焕东胡伟武
关键词:多核处理器缓存一致性
基于NUMA架构的解释器访存优化设计与实现
2015年
为了提高非一致内存访问(NUMA)架构虚拟机解释器的访存性能,研究了解释器在NUMA架构下的访存优化技术,提出了一种NUMA架构下的解释器访存优化方案,而且设计并实现了解释器的静态指令分派优化方法和动态指令分派优化方法。根据这一方案虚拟机启动时首先获取NUMA节点信息,并在每个NUMA节点中自动生成解释器所需的全部数据结构;解释器在运行时,通过静态或动态的指令分派技术来实现其执行线程在NUMA节点上访存的局部化。试验结果表明,上述方法能够显著提升解释器在NUMA系统中的性能。在DaCapo测试集上的总体性能提升了8%,最高性能提升幅度高达23%,而且算法实现代价低,适用于绝大多数的NUMA服务器系统。
任彤傅杰靳国杰
关键词:虚拟机解释器响应速度启动性能
片上多核处理器的区域共享的双粒度目录
2015年
研究了双粒度目录(DGD)下片上多核处理器的访存行为以及DGD对不同共享行为的目录开销,以进一步降低DGD结构的面积开销。针对DGD需要为共享缓存区域创建额外的块目录项的问题,提出了创新的区域共享的双粒度目录(RSDGD)结构。该结构可用一个区域共享目录项同时维护最多3个共享者共享同一个缓存区域的一致性,从而能有效减少所需的块目录项数量,降低总的目录开销。实验结果表明,和原有的DGD相比,该结构平均减少了25%的目录空间需求,而仅产生了不到0.6%的性能损失。该结构有效地降低了芯片的面积开销,提高了目录结构的可伸缩性。
曾露陈新科王焕东
关键词:片上多核处理器缓存一致性区域共享
一种支持细粒度并行的SDN虚拟化编程框架被引量:15
2014年
软件定义网络(software defined network,简称SDN)通过集中式的控制器提高了网络的可编程性,成为近年来网络领域非常热门的话题.以Openflow网络为代表的软件定义网络将逻辑控制与数据转发相隔离,为网络虚拟化技术提供了良好的平台.集中式的抽象与控制使得SDN虚拟化框架的处理效率成为主要瓶颈.现有的SDN虚拟化框架由于缺乏对细粒度并行的支持,为编程人员充分利用多核/众核资源、控制更大规模的网络带来了极大的挑战.为了提高SDN虚拟化框架的处理效率,提出一种新的SDN虚拟化编程框架,通过新颖的API和运行时,在框架内部支持细粒度的并行处理.该框架通过对网络中流和网络资源进行抽象,使开发人员可以直接通过划分流空间来定义不同的虚拟网络,利用无锁的编程方式对共享的网络资源和流进行操作.实验结果表明,该框架在逻辑控制的执行效率方面具有良好的可扩展性,可以创建出更大规模的虚拟网络,并对其进行更为复杂的控制.
宋平刘轶刘驰张晶晶钱德沛郝沁汾
关键词:细粒度并行
硬件事务存储系统研究综述
2013年
随着多核处理器的发展,硬件平台已经提供了充裕的并行能力,这对软件并行编程提出了更高的要求.传统的基于锁机制的并行编程模型存在着诸多难题.借鉴数据库中事务的思想,人们提出事务存储,旨在提供一种可编程性良好的同步手段.硬件事务存储快速有效的优势使之成为研究的热点.阐述了事务存储的基本概念、执行模型和编程接口.介绍了硬件事务存储系统的三大核心内容,对比了两种典型的硬件事务存储系统.分析讨论了目前硬件事务存储系统研究的热点和难点问题.最后介绍了硬件事务存储研究的平台和测试程序.
王永会张鑫伟刘轶
关键词:事务存储并行编程多核处理器
共1页<1>
聚类工具0