节点文献

北京大学CCL语料库的研制

免费订阅

【作者】 詹卫东郭锐常宝宝谌贻荣陈龙

【Author】 ZHAN Weidong;GUO Rui;CHANG Baobao;CHEN Yirong;CHEN Long;

【机构】 北京大学

【摘要】 北京大学中国语言学研究中心CCL语料库是面向语言学本体研究和语言教学的大规模语料库,目前包括现代汉语、古代汉语和汉英句对齐平行语料,规模超过7亿汉字。CCL语料库检索系统以包括汉字、字母、标点等在内的字符为基本索引单位,提供普通查询、批量查询、模式查询等多种检索方式。同时该系统支持限定范围查询、基于复杂检索表达式的查询、统计模式频次、对查询结果进行排序、下载查询结果等功能。本文介绍CCL语料库的建设情况与主要功能,具体涉及语料分布概况、语料库查询功能和使用方式、语料库索引与检索技术架构等。

【基金】 2015年度教育部人文社科重点研究基地重大项目(15JJD740002)的支持
【所属期刊栏目】 研制开发 (2019年01期)
  • 【分类号】TP391.1;H03
  • 【下载频次】296
节点文献中: 

本文链接的文献网络图示:

浏览历史:
下载历史: