节点文献

基于用户关系的维吾尔文微博数据获取方法的研究

免费订阅

【作者】 亚森·伊斯马伊力吐尔根·依布拉音卡哈尔江·阿比的热西提

【Author】 Yasen Yisimayili;Tuergen Yibulayin;Kahaerjiang Abiderexiti;Colleges of Information Science and Engineering,Xinjiang University;Key Laboratory of Xinjiang Multilingual IT;

【机构】 新疆大学信息科学与工程学院新疆大学新疆多语种信息技术重点实验室

【摘要】 目前,互联网上的大部分群体性数据资源集中在微博、论坛等社交网络上.跨语言社会舆情分析是我国智能信息处理的一个研究热点.维吾尔语是我国主要少数民族语言之一,为了构建一个好的跨语言舆情分析系统,维吾尔文微博的数据获取显得尤为重要.维吾尔文微博数据获取最大的难点是微博开发商不提供API.本文以技术和经济为基础的"Guduk"微博为研究对象,提出了一种基于用户关系的维吾尔文微博数据获取爬虫系统方案,此方案解决了在不提供API情况下的数据获取难点.本文的研究为跨语言舆情分析系统提供大量的维吾尔文社交网络数据资源、数据获取方法和技术.

【关键词】 跨语言舆情数据获取用户关系网络爬虫微博API
【基金】 国家重点基础研究发展计划(973)项目(2014cb340506);国家自然科学基金项目(61331011)
【所属期刊栏目】 信息科学与技术 (2015年01期)
  • 【DOI】10.13568/j.cnki.651094.2015.01.013
  • 【分类号】TP393.092
  • 【被引频次】7
  • 【下载频次】115
节点文献中: 

本文链接的文献网络图示:

浏览历史:
下载历史: