常锐
- 作品数:10 被引量:2H指数:1
- 供职机构:中兴通讯股份有限公司更多>>
- 相关领域:自动化与计算机技术更多>>
- 无盘启动方法、装置、终端设备和存储介质
- 本发明实施例提供的无盘启动方法、装置、终端设备和存储介质,将主机侧设置的基于PCIE NTB的共享内存通过NTB映射到子卡设备上;至少将共享内存中存储的无盘启动镜像文件中的分区信息和系统文件复制到子卡设备上的Ramdis...
- 罗斌常锐曾长华
- 基于PCIE NTB的安全快速无盘启动方法研究
- 2024年
- 目前基于PXE网络协议无盘启动方法是业界主流的解决方法,但是随着云计算、AI大模型、算力网络推进,以及DPU异构芯片的出现,计算机系统由单节点组件向分布式多节点系统演进。对应的操作系统的启动引导也随之变化,在新的计算机体系架构下,传统的PXE无盘启动方法存在启动效率低、交互流程复杂、镜像管理非云原生、存在安全漏洞、文件服务器受限、单点故障等诸多弊端和不足。给出一种新型多计算节点的安全、快速启动方法,OS镜像易于统一编排部署的解决方案。充分利用计算机系统的已有内部互联总线,比如PCIE总线的NTB(Non-Transparent Bridge)非透明桥实现共享内存,进一步实现无盘启动,同时给出Ramdisk根文件系统的快速制作方法以及基于UEFI的Ramdisk虚拟镜像创建打包的体系化方法,可以云化集群部署。实践表明,采用内部总线从物理上有效隔离了非法镜像的来源,裁剪镜像到500 MB内,在4 GB/s的总线带宽下,启动时间可以优化到1~2 s,效率提高30倍,多节点可以并行化同时启动,未来基于新型CXL总线技术可以平滑演进升级。
- 常锐
- 关键词:无盘启动UEFIPCIEPXE
- 大模型训练技术综述被引量:2
- 2024年
- 实现高效训练已成为影响大模型应用普及的关键要素之一。按照数据准备、数据加载、模型初始化及评估、训练并行、模型状态保存的一般训练流程,对大模型高效训练的主要技术进行分析和论述。面对大模型规模的持续增长、数据处理类型的扩展,现有大模型训练技术仍存在较大的优化空间。认为未来大模型训练重点研究方向包括以数据为中心、数据加载智能化和异构加速、网络通信领域定制、训练并行及自动化。
- 田海东张明政常锐童贤慧
- 关键词:数据准备数据加载训练网络检查点
- 使用双Bootrom启动引导CPU的工程应用方法和装置
- 本发明公开了一种使用双Bootrom启动引导CPU的工程应用方法,采用两片Bootrom:主用Bootrom和备用Bootrom,正常工作时,采用主用Bootrom烧结的启动代码引导启动CPU;当主用Bootrom引导启...
- 常锐
- 文献传递
- 一种配置方法及装置
- 本发明提供一种配置方法,所述方法包括:基本输入输出系统BIOS通过基板管理控制器BMC获取外围组件快速互连转接卡PCIE Riser卡的现场可更换单元FRU中存储的配置信息;当所述BIOS启动时,所述BIOS根据所述配置...
- 熊玉娜常锐刘隽
- 文献传递
- 使用双Bootrom启动引导CPU的工程应用方法和装置
- 本发明公开了一种使用双Bootrom启动引导CPU的工程应用方法,采用两片Bootrom:主用Bootrom和备用Bootrom,正常工作时,采用主用Bootrom烧结的启动代码引导启动CPU;当主用Bootrom引导启...
- 常锐
- 文献传递
- 无盘启动方法、装置、终端设备和存储介质
- 本发明实施例提供的无盘启动方法、装置、终端设备和存储介质,将主机侧设置的基于PCIE NTB的共享内存通过NTB映射到子卡设备上;至少将共享内存中存储的无盘启动镜像文件中的分区信息和系统文件复制到子卡设备上的Ramdis...
- 罗斌常锐曾长华
- 文献传递
- 一种配置方法及装置
- 本发明提供一种配置方法,所述方法包括:基本输入输出系统BIOS通过基板管理控制器BMC获取外围组件快速互连转接卡PCIE Riser卡的现场可更换单元FRU中存储的配置信息;当所述BIOS启动时,所述BIOS根据所述配置...
- 熊玉娜常锐刘隽
- 基于Soft-RoCE的KV客户端网络传输性能提升
- 2024年
- RDMA网络因高带宽、低延迟、低CPU负载特点,广泛应用于数据密集业务。应用场景模型是数据中心集群内部Server-Server架构,两端都需搭载RDMA硬件网卡卸载加速网络传输,但是对于更典型的Client-Server架构应用场景,C/S架构由于客户端数量多,从成本因素考虑,客户端选择软件RDMA实现,这样基于RDMA内存语义的客户端的设计成为影响性能的关键因素。提出一种新型基于Soft-RoCE的KV软件客户端和FPGA硬件服务端的架构设计,仅需要支持一种RDMA WRITE单边原语,简化了服务端硬件的复杂度和成本,同时保持RDMA高带宽特性。增加本地事件通知机制有效减少RDMA消息,利用SRIOV和虚拟化资源隔离以及绑核技术手段,使KV客户端可并发、可扩展,并在Key-Value数据库取得吞吐量达2M+IOPS的高性能效果。
- 常锐古国强童贤慧徐怡倩
- 序列号信息的更新方法、装置及终端
- 本发明提供了一种序列号信息的更新方法、装置及终端,其中,该方法包括读取当前非易失性变量区NV?Variable中存储的系统管理基本输入输出系统SMBIOS信息的序列号信息;判断读取的SMBIOS信息的序列号信息与预先存储...
- 常锐熊玉娜李存龙
- 文献传递