节点文献

融合越南语语言特征与改进PCFG的越南语短语树库构建

免费订阅

【作者】 李英郭剑毅余正涛线岩团陈玮

【Author】 Li Ying;Guo Jianyi;Yu Zhengtao;Xian Yantuan;Chen Wei;The School of Information Engineering and Automation,Kunming University of Science and Technology;The Key Laboratory of Intelligent Information Processing,Kunming University of Science and Technology;

【机构】 昆明理工大学信息工程与自动化学院昆明理工大学智能信息处理重点实验室

【摘要】 短语树库是自然语言处理的研究和实际应用的重要资源,就越南语而言目前也缺乏这类树库资源,不利于汉越双语信息处理工作.提出一种融合越南语语法特征与改进PCFG(概率上下文无关文法)的越南语短语树库构建方法,能够自动分析出越南语的短语结构树,从而可解决了越南语短语树库的自动构建问题.首先通过分析越南语的语言特征,制定出越南语的语言特征集;然后利用Inside-Outside算法从人工标注的少量越南语短语树获取PCFG模型中的语法规则集;最后将语法特征集作为语法规则集的补充融入PCFG模型,用得到的新模型最终完成越南语短语树库的构建.实验结果表明,新的PCFG模型针对越南语短语树库构建的准确率达到了81.14%,相比传统PCFG模型以及基于最大熵的树库构建方法准确率明显提高了2%~3%.

【基金】 国家自然科学基金(61262041,61363044,61472168)
  • 【DOI】10.13232/j.cnki.jnju.2017.02.018
  • 【分类号】TP391.1
  • 【下载频次】20
节点文献中: 

本文链接的文献网络图示:

浏览历史:
下载历史: