节点文献

基于互译特征词对匹配的老-汉双语句子相似度计算方法研究

免费订阅

【作者】 李思卓周兰江周枫张建安

【Author】 LI Sizhuo;ZHOU Lanjiang;ZHOU Feng;ZHANG Jian’an;Key Laboratory of Intelligent Information Processing,School of Information Engineering and Automation,Kunming University of Science and Technology;Kunming Battalion,Third College,Information Engineering University,PLA Strategic Support Force;

【通讯作者】 周兰江;

【机构】 昆明理工大学信息工程与自动化学院智能信息处理重点实验室解放军战略支援部队信息工程大学三院昆明大队

【摘要】 句子相似度的计算在自然语言处理的各个领域有很广泛的应用,但跨语言的句子相似度计算方法却非常少。文中提出一种基于互译特征词对匹配,构建老-汉双语句子相似度计算方法,改进了传统的依赖于词形词序通过计算相同词个数和共有单词的位置信息的相似度计算方法,充分考虑了老挝语和汉语句子中的词汇互译信息、相似概率,避免了由于特征词位置导致的精度丢失。此方法用来最终识别相似度较高的老-汉双语平行句对,依据相似度对源句子和目标句子进行对齐,在老-汉双语平行语料库的建设中使用。实验结果表明,此方法在一定程度上提高了老-汉双语句子相似度计算的准确率。

【基金】 国家自然科学基金:老挝语词法分析及老-汉双语平行语料抽取方法研究(61662040);国家自然科学基金:基于篇章特征的越南语新闻事件信息抽取关键技术研究(61562049)~~
【所属期刊栏目】 计算机科学与应用 (2019年24期)
  • 【DOI】10.16652/j.issn.1004-373x.2019.24.019
  • 【分类号】TP391.1
  • 【下载频次】4
节点文献中: 

本文链接的文献网络图示:

浏览历史:
下载历史: