网络首发时间:2019-05-10 12:58:19

节点文献

不同维度下维吾尔语N-gram语言模型性能分析

免费订阅

【作者】 毛丽旦·尼加提古丽尼尕尔·买合木提艾斯卡尔·艾木都拉

【机构】 新疆大学软件学院新疆大学信息科学与工程学院

【摘要】 针对当前维吾尔语语言模型存在的语料库数据稀疏问题以及困惑度较高等问题,在SRILM和MITLM两种工具生成的2-gram,3-gram,…,9-gram语言模型做了对比实验,试图找出在一定规模的维吾尔语语料条件下使困惑度最低的N-gram语言模型。通过对比分析最终得出结论,对于基于维吾尔语句子的N-gram模型,维度N取在介于3~5之间较宜,困惑度和计算复杂度等因素考虑N=3为较优。这一结论将有助于维吾尔语自然语言处理的发展。

【基金】 国家自然科学基金项目:面向汉维机器翻译性能优化的关键技术研究(61562081)
  • 【DOI】10.16652/j.issn.1004-373x.2019.10.007
  • 【分类号】TP391.1
  • 【下载频次】18

中国知网独家网络首发,未经许可,禁止转载、摘编。"

节点文献中: 

本文链接的文献网络图示:

浏览历史:
下载历史: