文献知网节
  • 记笔记

基于VP树结构的多层匹配算法在哼唱识别中的应用

侯珏刘轶郑方蒋丹宁秦勇程刚刘勇

清华大学信息技术研究院语音和语言技术中心IBM中国研究院深港产学研基地产业发展中心

摘要:哼唱识别是音频检索的一个重要应用,其难点是音频歌曲数据的非结构性以及搜索速度和准确率平衡的问题。本文提出了新的数据库构造方法,将音频歌曲集用手工标注方法提取主旋律并且按自然演唱停顿方式进行分段,采用段落结构而不是整首歌作为索引。同时,提出了一种基于VP树的搜索结构以及相应的多级搜索算法,在快速匹配层采用粗搜索算法,在精确匹配层采用基于动态时间规整算法。实验证明,在对检出率影响不大的前提下,识别速度提高了40%以上。
会议名称:

第十届全国人机语音通讯学术会议暨国际语音语言处理研讨会

会议时间:

2009-08-14

会议地点:

中国甘肃兰州

  • 专辑:

    信息科技

  • 专题:

    计算机软件及计算机应用

  • 分类号:

    TP391.3

  • 手机阅读
    即刻使用手机阅读
    第一步

    扫描二维码下载

    "移动知网-全球学术快报"客户端

    第二步

    打开“全球学术快报”

    点击首页左上角的扫描图标

    第三步

    扫描二维码

    手机同步阅读本篇文献

  • CAJ下载
  • PDF下载

下载手机APP用APP扫此码同步阅读该篇文章

下载:19 页码:427-432 页数:6 大小:412k

引文网络
  • 参考文献
  • 引证文献
  • 共引文献
  • 同被引文献
  • 二级参考文献
  • 二级引证文献
  • 批量下载
相关推荐
  • 相似文献
  • 读者推荐
  • 相关基金文献
  • 相关法规
  • 关联作者
  • 相关视频