节点文献

用于双语科技术语对齐的汉维文可比语料库构建

免费订阅

【作者】 彭飞吐尔根·依布拉音艾山·吾买尔米尔夏提·力提甫

【Author】 PENG Fei;Tuergen Yibulayin;Aishan Wumaier;Mirxat Litip;College of Information Science and Engineering Technology, Xinjiang University;Xinjiang Laboratory of Multi-Language Information Technology, Xinjiang University;

【机构】 新疆大学信息科学与工程学院新疆大学新疆多语种信息技术重点实验室

【摘要】 面向汉文维吾尔文(以下简称汉维)双语科技术语抽取这一应用目标,本文提出新闻科技领域的汉维可比语料库设计方案并进行实验.将网络采集的汉维语料利用机器翻译系统进行初加工后映射到向量空间中并使用LSI算法计算出各向量间的相关性,利用计算后的向量建立索引并依次计算出源文本与候选文本的相似值.本文设计两种实验进行对比,对选取的可比语料进行评估、筛选,最终达到构建汉维可比语料库的目的.

【基金】 国家自然科学基金项目(61463048,61462083,61331011);国家重点基础研究发展计划(973)项目(2014cb340506)
【所属期刊栏目】 信息科学与技术 (2017年03期)
  • 【DOI】10.13568/j.cnki.651094.2017.03.011
  • 【分类号】TP391.1
  • 【下载频次】123
节点文献中: 

本文链接的文献网络图示:

浏览历史:
下载历史: