黄沛杰 作品数:64 被引量:102 H指数:6 供职机构: 华南农业大学 更多>> 发文基金: 国家自然科学基金 广东省大学生创新实验项目 广东省科技计划工业攻关项目 更多>> 相关领域: 自动化与计算机技术 文化科学 理学 一般工业技术 更多>>
一种图像校正方法、装置、电子设备及存储介质 本申请提供一种图像校正方法、装置、电子设备及存储介质,该方法包括:对待校正图像进行关键点检测,获得图像关键点;根据图像关键点的空间位置对图像关键点进行分组,获得关键点分组;对每个关键点分组进行图像变换,获得各关键点分组分... 黄沛杰 李杰鸿 梁椅辉 邹昆 董帅一种基于QoS的Web服务组合算法 被引量:1 2015年 针对基于响应时间的Web服务组合,提出一种迭代加深的A*算法(IDA*算法)对服务节点进行搜索筛选。在利用节点数量的要求设计出服务节点限制判断条件的基础上,将该IDA*算法进行具体实现。实验结果表明,与图规划搜索算法相比,该IDA*算法在所需目标节点数较少的范围内比图规划搜索效率高。还进一步将IDA*改进为基于top-k的算法,并进行分析比较。 黄涵 林丕源 黄沛杰 王增钦 张键锋关键词:WEB服务 QOS TOP-K 收益可变泛化定向问题建模及优化算法研究 2019年 在泛化定向问题的基础上,基于现实应用中收益随时间变化的特点,提出一类收益可变泛化定向问题,并以收益最大化建立数学模型,采用改进的遗传算法来求解.使用分组竞争的选择策略保持种群的优良性;多个针对收益可变的变异算子作用在分组竞争中优胜的个体上,增强了遗传算法局部搜索能力,进一步提高解的质量.最后,在多个算例上进行仿真实验,与研究进展方法对比,验证了算法的有效性和稳定性. 林丕源 张鑫睿 朱泽鹏 吴志辉 黄沛杰关键词:遗传算法 路径规划 基于数据挖掘技术的养鸡企业海量数据分析与应用 林丕源 严尚维 林旭东 孙爱东 朱梅阶 毛宜军 黄沛杰 邹桂林 施振旦 林毅申 肖媚燕 1、该成果提供的资料齐全,符合科技成果鉴定要求。2、该成果将数据挖掘技术应用于对大型养鸡企业的海量历史数据分析,挖掘获得的知识与结论能指导养鸡企业的生产和经营,提供辅助决策支持。3、该成果研究了肉鸡品种结构对经济效益的影...关键词:关键词:数据挖掘技术 向量模型和多源词汇分类体系相结合的词语相似性计算 被引量:3 2018年 现有的词语语义相似性计算主要包括基于向量模型以及基于词汇分类体系两类方法,但这两类方法都存在自身的缺点。向量模型所依赖的文本共现中的上下文信息不等同于真正意义上的语义,而词汇分类体系方法则存在构建代价大,并且在一定程度上还不够完善的问题。该文提出一种向量模型与多源词汇分类体系相结合的词语相似性计算方法,采用多源词汇分类体系的近义词关系以及向量模型得到的词向量,计算得到词语的向量表达,并探索了不同类型词汇分类体系提供的知识的选用和融合问题,弥补了单一词向量和单一词汇分类体系在词语相似性计算中的缺点。该文采用了NLPCC-ICCPOL 2016词语相似度评测比赛中的PKU 500数据集进行评测。在该数据集上,该文的方法取得了0.637的斯皮尔曼等级相关系数,比NLPCC-ICCPOL 2016词语相似度评测比赛第一名的方法的结果提高了23%。 梁泳诗 黄沛杰 岑洪杰 唐杰聪 王俊东关键词:向量模型 基于优化“未定义”类话语检测的话语领域分类 被引量:2 2018年 "未定义"类话语在面向任务的对话语料中广泛存在,具有成分复杂,与其余"已定义"类话语边界模糊的特点,影响着话语领域的分类总体正确率。"未定义"类话语一旦错分,将会使用户对口语对话系统的功能有效性产生怀疑,导致大大降低用户体验。该文提出一种基于优化"未定义"类话语检测的领域分类方案,采用两阶段法完成口语话语的领域分类任务。首先,采用聚类方法将"已定义"类话语聚为几个大类,简化众多的"已定义"类话语独立存在时与"未定义"类话语之间的边界。进而利用分类模型对聚类后的"已定义"类话语大类以及"未定义"类话语进行领域分类,优化目标是"未定义"类话语的检测效率。最后,将第一阶段分类为"已定义"类的话语,在去除了绝大部分"未定义"类话语干扰的基础上进行再次分类。该文的分类模型采用了深度学习模型LSTM,并利用无标签微博数据训练词向量用于话语特征表达。在SMP 2017意图领域分类比赛的多任务语料上的评测结果表明,该方案在"未定义"类话语检测的F1值以及所有话语的领域分类总正确率上均有明显提升。 柯子烜 黄沛杰 曾真限定领域口语对话系统中的商品属性抽取 被引量:1 2016年 按功能或问题域划分,商品属性抽取(product feature mining)在限定领域的对话系统中属于口语语言理解(spoken language understanding,SLU)的范畴。商品属性抽取任务只关注自然文本中描述商品属性的特定部分,它是细粒度观点抽取(fine-grained opinion mining)的一个重要的子任务。现有的商品属性抽取技术主要建立在商品的评论语料上,该文以手机导购对话系统为背景,将商品属性抽取应用到整个对话过程中,增强对话系统应答的针对性。使用基于CBOW(continuous bag of words)语言模型的word2vector(W2V)对词汇的语义层面建模,提出一个针对口语对话的指数型变长静态窗口特征表达框架,捕捉不同距离词语组合的重要特征,使用卷积神经网络(convolutional neural network,CNN)结合词汇的语义和上下文层面对口语对话语料中的商品属性进行抽取。词嵌入模型给出了当前词和所给定的属性类别是否存在相关性的证据,而所提出的特征表达框架则是为了解决一词多义的问题。实验结果表明,该方法取得了优于研究进展中方法的商品属性识别效果。 叶大枢 黄沛杰 邓振鹏 黄强关键词:卷积神经网络 口语对话系统 基于隐含主题协同注意力网络的领域分类方法 被引量:1 2020年 基于注意力机制的神经网络模型在文本分类任务中显示出了很好的效果。然而当训练数据的规模有限,或者测试数据与训练数据的分布有较大差异时,一些有价值的信息词很难在训练中被模型捕捉到。为此,该文提出了一种新的基于协同注意力(co-attention)网络的领域分类方法。该文利用隐含主题模型学习隐含主题注意力,并将其引入到文本分类常用的双向长短时记忆网络(BiLSTM)中,与软或硬注意力(soft-or hard-attention)机制一起构成协同注意力。在中文话语领域分类基准语料SMP-ECDT上的实验结果表明,隐含主题协同注意力网络取得了显著优于注意力机制的领域分类效果,比基线注意力机制Soft att、Hard att以及单独的隐含主题注意力机制BTM att分别提高了2.85%、1.86%和1.74%的分类正确率。此外,实验结果还验证了,在额外的未标记数据上训练隐含主题,可以进一步提高该文方法的领域分类性能。 黄培松 黄沛杰 丁健德 艾文程 章锦川一种自监督伪标签优化的跨语言命名实体识别方法及系统 本发明公开了一种自监督伪标签优化的跨语言命名实体识别方法及系统,该方法包括:根据用户获得目标语言伪标签数据集的功能需求,利用源语言数据集训练源语言模型来并利用源语言模型为用户进行目标语言的标注工作,提供给用户目标语言的伪... 黄沛杰 冯湛炜 徐禹洪 谢浩杰 林丽欣 林丕源包装袋(花生2) 1.本外观设计产品的名称:包装袋(花生2)。;2.本外观设计产品的用途:本包装袋用于盛装花生,便于销售。;3.本外观设计产品的设计要点在于:包装袋表面的图案。;4.最能体现本外观设计设计要点的图片或照片:主视图。;5.本... 陈志鸿 林宇华 黄沛杰 陈佩 邢明 李远志 张凤丹文献传递