杨立
- 作品数:29 被引量:101H指数:4
- 供职机构:中国科学院软件研究所更多>>
- 发文基金:国家科技重大专项国家高技术研究发展计划北京市科委基金更多>>
- 相关领域:自动化与计算机技术经济管理文化科学更多>>
- 一种索引结构优化的检索增强生成技术在保险领域的交互应用研究
- 2025年
- 人工智能生成式大模型的提出对保险领域的智能交互场景产生了重大影响,在赋能行业应用软件“垂域精准计算”的技术要求的同时,为辅助代理端、业务端、用户端提供积极作用。然而大型语言模型在通用任务的生成表现中虽已经取得显著的成功,对于“垂域精准计算”面向的特定领域知识密集型任务的应用仍面临着重大限制,在处理问答即时响应时,常会产生“幻觉”现象,从而无法控制输出结果质量。仅依靠在场景应用中引入检索增强生成技术仍会存在等长切分导致上下文语义衔接被截断、相似性搜索内容过于发散检索精度缺失等痛点问题。本文提出了一种“检索增强优化索引结构的技术解决方法”,该方法在传统检索增强索引过程中增加了文档切分策略、针对块的关键词提取、语义对齐与分类、元数据补全四个技术模块,采用基于语义逻辑关系的切分方式,并基于改进的信息加权计算统计算法(term frequency-inverse document frequency,TF-IDF)实现切分段落的关键信息提取,结合引入保险行业领域词根表及业务标签库对关键词进行语义对齐、类别划分,最后完成元数据关键信息补全。在保险领域的交互应用验证结果表明,该方法有效缓解了定长切分导致语义缺失的问题,提升了知识索引结果的准确性。
- 成翌宁张正杨立马肖肖
- 面向聊天机器人的多注意力记忆网络
- 2019年
- 如何对多轮的对话历史进行建模和推理是构建一个智能聊天机器人的主要挑战之一.基于循环或门控的记忆网络已经被证明是进行对话建模的有效方式.然而,这种方式有两个缺点,一是使用复杂的循环结构,导致计算效率较低;二是使用代价较大的强监督信息或先验信息,不利于扩展和迁移应用到新的领域.针对上述问题,本文提出了一种端到端的多注意力记忆网络.首先,该网络采取结合词向量和位置编码的方式对文本输入进行表示;其次,使用并行的多层注意力在不同子空间捕获对话交互中的关键信息来更好地建模对话历史;最后,通过捷径连接的方式叠加多注意力层管理信息流,实现对建模结果的多次推理.在bAbI-dialog数据集上的实验表明,该网络可以有效地对多轮对话进行建模和推理,而且具有较好的时间性能.
- 任建龙杨立孔维一左春
- 关键词:聊天机器人
- 基于知识图谱与语义角色标注的软件缺陷报告分派方法及装置
- 本发明公开了一种基于知识图谱与语义角色标注的软件缺陷报告分派方法,包括:获取待分派软件缺陷报告中的文本数据;对文本数据进行语义角色标注,得到语义角色标注向量表示;利用知识图谱对文本数据注入知识,得到文本向量表示;拼接归一...
- 杨立徐文文江华禧左春梁赓
- 文献传递
- 面向机器学习系统的需求建模与决策选择被引量:4
- 2020年
- 机器学习支撑的系统应用越来越普遍,但是此类系统的需求通常难以表达完整且可能存在一些难以检测的冲突,使得这些系统通常无法在生产环境中高效满足用户的综合需求。此外,对于在实际场景中使用的机器学习系统,用户信任通常取决于包含可解释性、公平性等非功能需求在内的综合需求的满足程度,且在不同领域内应用机器学习通常有特定的需求,为保证需求描述的质量及实施过程的决策带来了挑战。为解决以上问题,文中提出了一个机器学习系统的需求建模和决策选择框架,包括一个MLS(Machine Learning Systems)需求概念模型和机器学习管道过程元模型,以及对训练数据集、算法等组件的决策选择方法,旨在规范实际场景中机器学习系统的需求设计、开发和评估。实例研究表明,提出的MLS需求描述和实现方法是可行且有效的。
- 杨立马佳佳江华禧马肖肖梁赓左春
- 关键词:机器学习系统非功能需求元模型
- 基于精准计算的人工智能应用方法研究
- 2018年
- 阐述精准计算在人工智能中应用的必要性,详细分析了基于精准计算的人工智能应用及需形成标准、工具需要"流行化"、"封闭+开放"问题的混合空间求解等五方面需要注意的问题。展望了精准计算在人工智能应用的未来发展方向,包括从关注字段到关注取值,从确定性内容到不确定性内容转变等。
- 左春左春杨立
- 关键词:人工智能先验知识
- 一种人在回路的机器学习应用开发方法和系统
- 本发明涉及一种人在回路的机器学习应用开发方法和系统,将开发机器学习应用的过程视为控制过程,数据流为信号流,依据控制论中的负反馈调节原理,设计了包括线上和线下两个阶段以及三个人工辅助的负反馈回路。线上回路的数据可以丰富基础...
- 任建龙杨立孔维一左春马肖肖
- 文献传递
- 一种专题地图地理面要素自动提取和矢量化方法
- 本发明公开了一种专题地图地理面要素自动提取和矢量化方法,其步骤包括:1)获取专题地图并进行地理配准;2)对专题地图进行自适应图像聚类,并对所得聚类图像进行中值滤波;3)对于每一聚类图像,获取该聚类图像中各要素的边界并扩展...
- 马肖肖杨立方明哲梁赓左春
- 文献传递
- 一种基于Serverless的前端应用构建方法和系统
- 本发明涉及一种基于Serverless的前端应用构建方法和系统,能够实现前端应用的动态迭代更新。本发明将Serverless的概念向前端进行延伸,将前端应用的运行时和前端UI的定义分离,以无状态函数构成的函数包的形式定义...
- 杨立孔维一方明哲徐文文左春
- 文献传递
- 基于知识图谱与语义角色标注的软件缺陷报告分派方法及装置
- 本发明公开了一种基于知识图谱与语义角色标注的软件缺陷报告分派方法,包括:获取待分派软件缺陷报告中的文本数据;对文本数据进行语义角色标注,得到语义角色标注向量表示;利用知识图谱对文本数据注入知识,得到文本向量表示;拼接归一...
- 杨立徐文文江华禧左春梁赓
- 基于领域知识的知识发现研究
- 目前,知识发现的研究与应用是学术界和应用领域关注的热点,但是面对通常是领域相关的复杂应用环境,现有的知识发现研究在体系结构和算法方面尚未很好地融入领域知识,应用效果难如人意。如何从面向最终用户的角度出发,实现基于领域知识...
- 杨立
- 关键词:知识发现领域知识语义网技术语义距离
- 文献传递