节点文献

汉文-维吾尔文双语语料库中段落对齐技术研究

免费订阅

【作者】 热西旦·塔依吐尔根·依布拉音

【Author】 Raxida Tay1,Turgen Ibrahim2(1.Department of Computer Science,Yili Normal University,Yining,Xinjiang 835000,China;2.College of Information Science and Engineering,Xinjiang University,Urumqi,Xinjiang 830046,China)

【机构】 伊犁师范学院计算机科学系新疆大学信息科学与工程学院

【摘要】 随着信息技术的普及与推广,双语电子文本资源呈指数形式增长,这给构建大规模双语语料库提供了可能.双语对齐作为语料库加工过程中的关键技术,已经引起研究者的高度重视.针对目前可收集到的双语资源大都没有做到段落对齐,本文提出了基于回车符段落对齐基础上的多层次分段对齐思想,充分利用汉文-维吾尔文双语文本中的语言特点,根据双语文本中的数字信息,找出互为译文的句对,从而达到高质量的段落对齐目的.

【基金】 国家自然科学基金(编号:60663006);新疆维吾尔自治区高新技术计划项目(200712109)
【所属期刊栏目】 信息科学与技术 (2010年01期)
  • 【分类号】TP391.1
  • 【被引频次】9
  • 【下载频次】136
节点文献中: 

本文链接的文献网络图示:

浏览历史:
下载历史: