于碧辉 作品数:24 被引量:145 H指数:6 供职机构: 中国科学院沈阳计算技术研究所 更多>> 发文基金: 国家科技重大专项 国家社会科学基金 更多>> 相关领域: 自动化与计算机技术 电子电信 机械工程 电气工程 更多>>
一种多方通话动态控制技术 2018年 近些年多媒体技术和数据通信技术发展迅速,多方音视频通话逐渐兴起.多方音视频通话能够解决人们远距离通信问题,但在媒体流控制方法上,现存通话系统并未将集中式和散布式两种媒体流控制方式进行有效结合,无法发挥两种控制方法的各自优势.针对上述问题,提出了一种多方通话动态控制技术,以客户端网络带宽和用户数量作为变换条件,通过对星状网络和网状网络两种拓扑结构的结合,使多方通话系统能够自适应调节媒体流分发方式.本系统以SIP会议控制为基础并运用Web RTC技术提高通话质量,实验结果表明,该技术可有效掌握系统内各客户端网络拥塞状况和资源占用率,对系统媒体流控制方式能够适时进行调整,使媒体流传输通畅高效,提高通话质量. 马跃 柴安颖 于碧辉 于波关键词:动态控制 拓扑结构 SIP 基于语义相关度主题爬虫的语料采集方法 被引量:6 2019年 针对特定领域语料采集任务,设计了基于语义相关度主题爬虫的语料采集方法.根据选定的主题词,利用页面描述信息,基于维基百科中文语料训练出的词分布式表示综合HowNet计算页面信息相关度,结合URL的结构信息预测未访问URL链指的页面内容与特定领域的相关程度.实验表明,系统能够有效的采集互联网中的党建领域页面内容作为党建领域生语料,在党建领域网站上的平均准确率达到94.87%,在门户网站上的平均准确率达到64.20%. 周昆 王钊 于碧辉基于Spark的分布式数字信号处理算法库设计 被引量:2 2018年 传统的基于DSP与FPGA的数字信号处理技术更加适用于实时信号处理,且受到数据规模和频率分辨率的限制,使得其不适于进行大规模数据下的离线式数据处理、分析与挖掘的应用.目前工业大数据分析平台可以采用Spark作为实时信号处理和离线信号处理加速的计算引擎,但该分析平台缺少适用于分布式并行计算引擎的数字信号处理等数学计算的解决方案.基于此,本文提出了基于Spark的分布式数字信号处理算法库,为面向分析的工业大数据应用场景提供支撑.本文介绍了该算法库的架构设计,并以FFT算法和DFT算法为例介绍了传统数字信号处理算法在Spark下的分布式实现,最后对算法库进行了正确性测试和性能分析.结果表明该算法库能够正确完成数字信号处理的功能,同时可以满足工业大数据分析平台对于大规模数据集进行数字信号处理的需求. 乔昕 刘峰 刘峰关键词:SPARK 数字信号处理 分布式计算 算法库 基于资源签名与遗传算法的Hadoop参数自动调优系统 被引量:5 2017年 在Hadoop集群的优化配置中,配置参数存在种类繁多、含义复杂、相互关联影响的特性,导致难以实现快速准确寻优。针对以上问题,构建了Hadoop集群自动调优系统,其中在系统中设计了资源获取器与参数配置库,分别用于获取各作业的资源消耗与存储分发配置方案。该系统利用MapReduce作业的小规模数据集资源签名将任务分类,在遗传算法框架中通过任务的测试评估对配置方案进行自动迭代优化。实验结果表明,调优后集群的任务完成时间明显缩减,集群的资源利用率有了明显提升。 马跃 余骋远 于碧辉关键词:HADOOP集群 遗传算法 MCM-ICE:联合独立编码和协同编码的多模态分类模型 2024年 多模态数据处理是一个重要的研究领域,它可以通过结合文本、图像等多种信息来提高模型性能.然而,由于不同模态之间的异构性以及信息融合的挑战,设计有效的多模态分类模型仍然是一个具有挑战性的问题.本文提出了一种新的多模态分类模型——MCM-ICE,它通过联合独立编码和协同编码策略来解决特征表示和特征融合的挑战.MCM-ICE在Fashion-Gen和Hateful Memes Challenge两个数据集上进行了实验,结果表明该模型在这两项任务中均优于现有的最先进方法.本文还探究了协同编码模块Transformer输出层的不同向量选取对结果的影响,结果表明选取[CLS]向量和去除[CLS]的向量的平均池化向量可以获得最佳结果.消融研究和探索性分析支持了MCM-ICE模型在处理多模态分类任务方面的有效性. 郭锐锋 魏靖烜 于碧辉 于碧辉数控机床传感器数据分析中ETL系统改进 被引量:1 2017年 ETL(Extract-Transform-Load)系统是数控机床传感器数据分析中不可或缺的一个重要组成部分.针对近年来数据量越来越大和实时性要求越来越高的问题,本文对ETL系统中传统的变更数据捕获方案做了改进,设计了适用于该数据的实时数据抽取方案,并详述了整个分布式架构的设计.实验表明,该ETL系统在数控机床传感器数据的实时处理上,具有较高的效率. 刘峰 蔡明高 于波 于碧辉关键词:数控机床 传感器 ETL 基于迁移学习和BiLSTM-CRF的中文命名实体识别 被引量:53 2019年 针对中文命名实体识别问题,该文提出了一种基于迁移学习和深度学习的TrBiLSTM-CRF模型.该模型采用基于实例的迁移学习算法,通过权值生成和样本选择,将源域的知识迁移到目标域,有效地解决了深度学习对少量数据学习能力不足的问题;通过词向量、BiLSTM、CRF等操作融合了上下文语义信息,克服了对人工特征和专家知识的依赖.实验结果表明,TrBiLSTMCRF模型在小规模数据集上进行中文机构名命名实体识别时,其准确率、召回率和F值分别为91. 57%、72. 29%和0. 80%,相比于该文提到的其他方法,取得了较好的效果. 武惠 吕立 于碧辉关键词:中文命名实体识别 孪生网络中文语义匹配方法的研究 被引量:5 2021年 语义匹配是问答领域的一个核心任务,能够为问答系统和信息检索等领域提供技术支持.目前对于语义匹配这一特殊分类问题,神经网络主要使用交叉熵或者对比代价损失函数,忽略了损失函数的分类限制宽泛,导致其在分类边缘存在误差.为了解决此种问题,本文在已有的孪生神经网络的基础上,引入am-softmax损失函数,提升模型精确度,同时在现有的词向量和字向量作为网络输入的基础,进一步引入Attention机制,使模型进一步获取更多的文本信息.实验结果表明,与之前的深度学习模型相比,模型的性能有进一步提高. 于碧辉 于碧辉关键词:语义匹配 面向电网安全监测的领域本体自动构建 被引量:5 2020年 针对电力监控系统面临的网络安全问题实际需求,开展了本体自动构建技术研究,以现有的领域本体自动化构建技术为基础,从非结构化文本数据提取出电网安全监测领域本体SafeAgent,采用机器学习、自然语言处理、关联规则等方法抽取本体概念,挖掘概念之间的关系,完善了领域本体自动化构建方案.经实验验证,本文采用的方法能以较高准确率完成领域本体的自动化构建工作,克服对人工以及专家知识的依赖. 于碧辉 孙思 李岳关键词:本体 层次聚类 关联规则 电网安全 MQTT协议在移动互联网即时通信中的应用 被引量:26 2016年 移动互联网下的即时通信应用现今已经成为人们日常沟通必不可少的工具,然而作为其开发基础的即时通信协议却始终没有一个统一的标准,已有的即时通信协议都不能够很好的适应移动互联网网络环境不稳定,低带宽高延迟,设备计算能力差等特点.MQTT协议作为一种基于发布/订阅模型的轻量级消息传输协议,在移动平台具有节省流量和能耗,可扩展性强的优点.本文首先介绍了当前一些主流的即时通信协议,指出了它们在移动互联网环境下存在哪些缺陷;之后研究了MQTT协议的消息格式与使用方式,并与已有的即时通信协议进行了对比;最后基于MQTT协议,对即时通信应用的两项核心功能IM和Presence进行了设计和实现,并经过测试表明使用MQTT协议能够在移动互联网环境下提供比传统即时通信协议更少的带宽耗费和更良好的用户体验. 马跃 孙翱 贾军营 孙建伟 于碧辉 杨雪华关键词:移动互联网 即时通信 系统设计