节点文献

面向法庭科学的多属性中文短文本作者归属

免费订阅

【作者】 罗文华李孟林

【Author】 LUO Wen-hua;LI Meng-lin;

【机构】 中国刑事警察学院网络犯罪侦查系

【摘要】 针对当前主流的卷积神经网络分类模型偏重依赖训练集规模和参数的缺点,提出了基于传统N-grams模型并结合多属性特征综合计算中文短文本相似度的分析方法。首先采用N-grams模型提取词频分布和句子的语义逻辑关系特征,然后通过似然率算法求出中文短文本似然率,最后进一步结合发送时间、发送位置、发送频率、输入法等属性计算出中文短文本相似度。实验表明,采用N-grams模型并融合多属性综合计算相似度相较单纯使用N-grams,实现了对作者归属判断的更有力支撑。

【关键词】 短文本N-grams多属性似然率余弦相似度
【所属期刊栏目】 网络安全与信息技术 (2020年02期)
  • 【DOI】10.14060/j.issn.2095-7939.2020.02.016
  • 【分类号】TP391.1;D631.2
  • 【下载频次】19
节点文献中: 

本文链接的文献网络图示:

浏览历史:
下载历史: