张科 作品数:6 被引量:23 H指数:3 供职机构: 教育部 更多>> 发文基金: 中央高校基本科研业务费专项资金 国家自然科学基金 青海省自然科学基金 更多>> 相关领域: 自动化与计算机技术 理学 历史地理 语言文字 更多>>
基于矩阵分解的DeepWalk链路预测算法 被引量:5 2020年 现有的链路预测方法的数据来源主要是基于邻居、路径和随机游走的方法,使用的是节点相似性假设或者最大似然估计,尚缺少基于神经网络的链路预测研究。基于神经网络的一些研究表明,基于神经网络的DeepWalk网络表示学习算法可以更加有效地挖掘到网络中的结构特征,已有研究证明DeepWalk等同于分解目标矩阵。因此,提出了一种基于矩阵分解的DeepWalk链路预测算法(LPMF)。该算法首先基于矩阵分解的DeepWalk算法分解得到网络的表示向量;然后通过余弦相似度计算每对节点之间的相似度,构建目标网络的相似度矩阵;最后利用相似度矩阵,在三个真实的引文网络中进行链路预测实验。实验结果表明,提出的链路预测算法性能优于现存的20余种链路预测算法。这充分表明了LPMF能够有效地挖掘网络中节点之间的结构关联性,而且在实际网络的链路预测中能够发挥出较为优异的性能。 冶忠林 曹蓉 赵海兴 赵海兴 朱宇关键词:链路预测 神经网络 矩阵分解 相似度矩阵 新时代全球视野下的汉学与中国研究:新议题、新模式、新方法 2023年 习近平总书记在考察中国人民大学时指出“坚持和发展中国特色社会主义理论和实践提出了大量亟待解决的新问题,世界百年未有之大变局加速演进,世界进入新的动荡变革期,迫切需要回答好‘世界怎么了’、‘人类向何处去’的时代之题”。为推进中外学术合作,回答时代之问,2022年,教育部中外语言交流合作中心通过“新汉学计划”先后与中国人民大学、北京大学、武汉大学、四川大学合作举办中外博士生工作坊,为“新汉学计划”培养的外籍博士生和中国大学相同领域的中国博士生搭建交流和合作的学术舞台,聘请中外资深专家学者担任点评导师,邀请顶级学术期刊主编现场“把脉”,挖掘年轻一代的学术新秀。工作坊累计吸引了50多个国家近300名中外青年学生、学者参与,就“新时代中国社会转型与发展”“后疫情时代的国际教育发展的趋势与展望”“翻译与研究:中国文化经典的世界之旅”“新时代国际中文教育多元化培养体系的构建与发展”等主题展开探讨。 王昕生 张科关键词:工作坊 国际教育发展 中文教育 博士生 基于多源信息融合的分布式词表示学习 被引量:4 2019年 分布式词表示学习旨在用神经网络框架训练得到低维、压缩、稠密的词语表示向量。然而,这类基于神经网络的词表示模型有以下不足:(1)罕见词由于缺乏充分上下文训练数据,训练所得的罕见词向量表示不能充分地反映其在语料中的语义信息;(2)中心词语的反义词出现于上下文时,会使意义完全相反的词却赋予更近的空间向量表示;(3)互为同义词的词语均未出现于对方的上下文中,致使该类同义词学习得到的表示在向量空间中距离较远。基于以上三点,该文提出了一种基于多源信息融合的分布式词表示学习算法(MSWE),主要做了4个方面的改进:(1)通过显式地构建词语的上下文特征矩阵,保留了罕见词及其上下文词语在语言训练模型中的共现信息可以较准确地反映出词语结构所投影出的结构语义关联;(2)通过词语的描述或解释文本,构建词语的属性语义特征矩阵,可有效地弥补因为上下文结构特征稀疏而导致的训练不充分;(3)通过使用同义词与反义词信息,构建了词语的同义词与反义词特征矩阵,使得同义词在词向量空间中具有较近的空间距离,而反义词则在词向量空间中具有较远的空间距离;(4)通过诱导矩阵补全算法融合多源特征矩阵,训练得到词语低维度的表示向量。实验结果表明,该文提出的MSWE算法能够有效地从多源词语特征矩阵中学习到有效的特征因子,在6个词语相似度评测数据集上表现出了优异的性能。 冶忠林 赵海兴 张科 朱宇夯基垒台,积厚成势 为国际中文教育事业培养青年人才 2023年 “新汉学计划”是教育部中外语言交流合作中心(简称“语合中心”)于2013年开始设立的品牌项目,旨在与顶尖高校合作,通过高水平人才培养项目和高质量学术合作项目,为海外研究中国的优秀青年提供丰富优质的研修资源与多样化的发展空间,为青年学者的成长与发展提供助力。本栏目所收录的5篇文章是“新汉学计划”最新成果的一次集中展示,既有对国际中文教育的研究,亦有对中国文学、文化的探索。 张科关键词:中文教育 学术合作 青年学者 高校合作 基于邻节点和关系模型优化的网络表示学习 被引量:14 2019年 网络表示学习旨在于将网络的拓扑结构、节点内容和其他信息嵌入到低维度的向量空间中,从而为网络数据挖掘、链路预测和推荐系统提供一种有效的工具.然而,现有的基于神经网络的表示学习算法即忽略了上下文节点的位置信息,又忽略了节点与文本之间的语义关联.因此,基于以上2点,提出了一种新颖的基于邻节点和关系模型优化的网络表示学习算法(network representation learning algorithm using the optimizations of neighboring vertices and relation model,NRNR).首先,该算法首次采用当前节点的邻居节点优化网络表示学习模型,使得上下文窗口中节点的位置信息被嵌入到网络表示中;其次,该算法首次引入知识表示学习中的关系模型建模节点之间的结构特征,使得节点之间的文本内容以关系约束的形式嵌入到网络表示中;再次,NRNR提出了一种可行且有效的网络表示联合学习框架,将上述2种目标融入到一个统一的优化目标函数中.实验结果表明:NRNR算法在网络节点分类任务中优于各类对比算法,在网络可视化中,NRNR算法学习得到的网络表示展现出了明显的聚类边界. 冶忠林 赵海兴 张科 朱宇 张科关键词:网络嵌入