北京大学信息科学技术学院高可信软件技术教育部重点实验室
- 作品数:305 被引量:1,692H指数:21
- 相关作者:谢冰王千祥赵海燕邵维忠邹艳珍更多>>
- 相关机构:广州大学计算机科学与教育软件学院长沙理工大学计算机与通信工程学院北京理工大学计算机学院更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术理学文化科学电子电信更多>>
- 基于领域偏好的可变时间窗口时序数据主题模式识别算法被引量:5
- 2019年
- 随着传感器的普及,智慧城市、普适计算等领域应用不断涌现,对时序数据处理的需求也在不断增长。时序数据中反复出现的高度相似的模式被称为主题模式。时序数据的主题模式蕴含有了大量的信息,对主题模式的识别是时序数据处理的重要分支领域。现有主题模式识别算法无法根据特定应用或领域的知识来指定主题模式识别的偏好,从而难以发现对分析领域问题最具价值的模式。针对这一问题,文中给出了一种可以根据领域偏好定义子序列相似性的机制,并设计了一种针对上述相似性度量机制的可变时间窗口主题模式识别加速剪枝算法。实验证明,所提方法在多个公开数据集上,能高效且准确地发现具有领域偏好的主题模式。
- 王一博彭广举何远舵王亚沙赵俊峰王江涛
- 关键词:时序数据主题模式
- 基于多Web信息源的主题概念网络获取被引量:1
- 2013年
- Wikipedia一方面能够提供关于特定百科条目的概念性描述;另一方面,也通过分类系统将这些百科条目组织成一个概念网络.它对信息的广泛覆盖和有效组织使其成为了自动化知识获取的常用信息源.然而,仅仅依靠Wikipedia自身的信息,还不足以准确地刻画其内部概念间的关联性知识,而这是符号化知识表述的一个重要组成部分.因此,提出了一种基于多Web信息源的主题概念网络获取方法.它以Wikipedia的分类系统为基础,同时利用搜索引擎收集相关的Web信息作为关联性知识验证和发现的参照系,并通过集成信息检索和自然语言处理等领域的方法,实现了以给定的主题词为核心,在Wikipedia分类系统对应的概念网络中获取面向该主题的概念网络,同时网络内的概念间关系得到识别和标注.我们基于不同领域的主题词进行了实验,对实验结果的经验性评估展示了所获取的主题概念网络既能满足面向主题的要求,其内部的概念关联性知识又具备了一定的精度要求.
- 许焱金芝李戈魏强
- 关键词:知识获取信息检索自然语言处理
- 互联网时代的软件技术:现状与趋势被引量:24
- 2010年
- 互联网(Internet)的快速发展为信息技术与应用扩展了更为广阔的空间,同时也为传统的软件开发理论、方法和技术带来了一系列的挑战.回顾了现有基于网络的新型计算范型和应用模式.探讨了软件模型、软件运行平台和支撑机制、软件开发方法和软件质量评价与保障体系的现状和发展趋势.讨论并展望了进一步的研究工作.
- 梅宏刘譞哲
- 关键词:互联网软件技术网构软件
- UML类图中面向非功能属性的描述和检验被引量:21
- 2009年
- 为系统构建模型是软件开发中的一项关键活动.一个高质量的模型不仅要包含系统的功能属性,即系统能够做什么,同时还应包含系统的非功能属性,即系统的质量如何.目前,通用的建模方法和工具对功能属性建模支持良好,而对如何为非功能属性建模关注得不多,特别是如何将二者统一起来并对描述的非功能属性的有关性质进行检验.通过在UML类图中增加非功能属性标注和约束关系表等建模元素来扩展UML类图,使其能够描述非功能属性.在此基础上,又提供了对扩展UML类图中非功能属性的一致性和可满足性进行检验的方法.通过实例对上述的面向非功能属性的建模和检验方法进行了说明,并介绍了相应的支持工具.
- 张岩梅宏
- 关键词:非功能属性统一建模语言类图
- 一个新的专门的压缩函数框架
- 压缩函数是杂凑函数的核心部件,其设计必须兼顾安全性和效率。本文给出了一个新的压缩函数框架和两种针对MD构造模式的改进。本文提出的压缩函数具有简洁高效、并行度高、易于扩展的特点。本文提出的第一种构造模式能够抵御利用压缩函数...
- 关键词:碰撞
- 文献传递网络资源链接
- POP:一个基于微服务架构的在线编程系统被引量:3
- 2017年
- 随着云计算的发展,基于云端的编程模式越来越受到开发者的青睐。在线编程系统与PaaS平台相结合,可以大大简化应用开发过程,为开发者提供便利。Docker的出现推动了PaaS平台的迅猛发展,Docker的种种特性给予了在线IDE更加理想的开发部署应用的环境。POP(Public Online Programming)是一种利用Docker技术实现的基于微服务架构的公共在线编程系统。POP通过对Docker资源的合理调度管理,使得在线编程系统在部署、调试和运行各类应用时能够更加节省资源和时间。
- 胡星王泽瑞李烁杨楠张知凡王巧王千祥
- 关键词:云计算DOCKER
- 基于运行时模型的多样化云资源管理方法被引量:4
- 2014年
- 多样化的受管资源和不断变化的管理需求,使得云管理面临很大的难度和复杂度.面对一个新的特定的管理需求,管理员往往是在已有管理软件的基础上进行二次开发,通过管理功能的获取和组织来构造新的管理系统.然而,由于缺乏通用的方法,二次开发的难度和复杂度依然很大.为了能够根据管理需求快速定制、集成、扩展已有的管理软件,提出一种基于运行时模型的多样化云资源管理方法.首先,在系统管理接口的基础上构造不同受管资源的运行时模型;其次,通过对不同的运行时模型进行合并,来构造包含所有目标受管资源的组合模型;最后,通过组合模型到用户特定模型的转换,来满足特定的管理需求.在OpenStack与Hyperic两款独立管理软件的基础上,实现了基于运行时模型的虚拟机软、硬件资源统一管理系统,验证了方法的可行性和有效性.
- 陈星张颖张晓东武义涵黄罡梅宏
- 关键词:软件体系结构
- 数据安全治理中的安全技术研究被引量:20
- 2021年
- 以数据为中心的数字经济连续几年快速发展,占国民GDP的比重不断提高.但在发展的同时,数据安全事件频发,数据安全问题愈加突出.在已经将数据视为生产要素的大背景下,以规范数据处理活动、提高数据安全能力、建设数据健康生态为目标的数据安全治理是引导数据产业继续稳步前进的关键.《中华人民共和国数据安全法》的推行可以为数据安全治理提供方向,但还需要相应的技术来配合数据安全治理的落地.数据安全治理的技术研究,需要从数据安全的基本概念出发,围绕用于数据安全治理的数据生命周期,研究数据生命周期各个阶段的适用技术.此外,也需要根据数据安全治理的主要理念,如隐私保护或数据权属,进行数据安全治理的技术路线研究,形成推进数据安全治理的相应思路.
- 吴振豪高健博李青山陈钟
- 关键词:数据安全技术隐私保护
- 连续空间查询的位置隐私保护综述被引量:8
- 2015年
- 在移动互联网中,移动用户把个人位置信息发送到位置服务提供者并通过空间查询获取兴趣点数据;在连续空间查询中,用户沿着轨迹提交多个位置信息,这导致了严重的用户隐私风险。近年来,连续空间查询的位置隐私保护技术成为无线网络安全和隐私领域的研究热点。首先介绍了位置服务中的空间查询和隐私威胁;归纳了连续空间查询的隐私保护模型,并比较了对应的隐私保护方法。最后介绍了发展趋势并指明了未来的研究方向。
- 吴振刚孙惠平关志陈钟
- 循环神经网络模型在腹膜透析临床预后预测中的初步应用被引量:5
- 2019年
- 目的:应用深度学习模型循环神经网络(recurrent neural network,RNN)及其变体门控循环单元(gated recurrent unit,GRU),基于临床真实数据,构建腹膜透析临床预后预测模型,并比较其与医学研究中常用的逻辑回归( logistic regression, LR)模型的预测性能,探索预测结果中可能的医学意义。方法:使用北京大学第三医院腹膜透析门诊的常规诊疗数据,基于患者在开始透析时的基线数据、随访数据和预后数据构建RNN和GRU预测模型。使用受试者工作特征曲线下面积(area under the ROC curve,AUROC)、召回率(recall)、F1分数(F1-score)三个指标在测试集上评价比较模型对患者死亡风险的预测效果。结果:共纳入656例患者,其中死亡患者261例,共计 13 091 条诊断记录。经过十折交叉验证调整超参数并在单独的测试集测试结果显示,LR模型、RNN模型、GRU模型的AUROC分别为0.701 4、0.786 0、0.814 7,RNN和GRU模型的预测性能显著优于传统的LR模型。在召回率和F1分数方面,RNN和GRU模型的性能也均显著优于LR模型,且GRU模型表现最好。进一步分析显示GRU模型在不同预测窗口下对于不同死因或相同死因的召回率不尽相同。结论: RNN模型(尤其是GRU模型)相比于传统医学研究所使用的LR模型,对于腹膜透析临床预后预测具有更佳效果,可能有助于医生早期干预,提高医疗质量,具有很强的临床应用价值。
- 唐雯高峻逸马辛宇张超贺马连韬王亚沙
- 关键词:腹膜透析预后循环神经网络