不知道大家有没有遇到这样一种情况,看综艺时,突然听到一首很好听的歌曲,但是就是不知道歌名,在心里急得呀。
每每遇到这种情况,对于“听歌识曲”这个功能,黑马都很想给个大大的赞。自2013年QQ音乐率先推出“听歌识曲”的功能后,听歌识曲技术迅速在各大音乐App中普及,现在这个功能是离不开了。
但是,如果遇到一些酒吧弹唱、演唱会现场、直播即兴演唱等翻唱识别之时,黑马多年来遇到的音乐App中,基本没有能够识别出来的。
所以,黑马就来测试一下当下主流的音乐App,在2020年的当下,这些音乐App的听歌识曲技术是否有所进步?谁的听歌识曲能力最强?
我们以QQ音乐、网易云音乐、咪咕音乐和虾米音乐这四款当下最主流的音乐App为例,分别从翻唱识别、识别准确性、识别速度等几个日常最常碰到的识别场景来测试。
到底谁才是音乐App识别王者?
首先是翻唱识别,为什么先测试这个功能?因为现在对于翻唱识别的需求很大。
现在,谁还不会看个直播,能够识别主播即兴演唱的歌曲,很有必要。更别说平时我们在路边听到的歌曲、在酒吧听到的弹唱或者是综艺节目中的即兴演唱,而这些没有经过检录的翻唱歌曲,一般的听歌识曲技术是识别不了的,这时候翻唱识别功能一定会用到。
时至今日,黑马认为翻唱识别功能应该成为每个音乐App听歌识曲必备的技术。
但是在这一轮测试下来,黑马只能用一个词形容:惨不忍睹,几乎全军覆没,只剩下QQ音乐可以识别。
黑马测试了直播演唱识别场景:
综艺节目嘉宾的演唱识别:
短视频歌曲翻唱识别:
这些场景中,全部都只有QQ音乐能够翻唱识别,所幸,识别速度还挺快,多少给音乐App争了点面子。
要知道早在2013年的时候,就有网友提出过想要翻唱识别的功能,现在已经2020年了,也才只有QQ音乐加入了这个功能,实在不应该。
黑马想说,有时候路边的街头歌手唱的歌,也挺好听的,他们值得音乐类App加入翻唱识别功能。
接下来是识别的准确性,没有翻唱识别这一刚需功能,起码的识别准确性要保证吧?
为了保证测试结果的公平,黑马从QQ音乐热歌榜、网易云音乐热歌榜、咪咕音乐新歌热歌榜、虾米音乐热歌榜中,去掉重复的歌曲,抽取了《晴天》、《生而为人》、《想起了你》、《入海》等四大平台上热门的50首歌曲。
在黑马的测试中,这四款App的识别准确率为:QQ音乐(100%) > 网易云音乐(96%) > 虾米音乐(74%) > 咪咕音乐(0%)。
QQ音乐和网易云音乐的识别准确性基本是同一水平,引领第一阵营。虾米音乐则要差一些,共有13首音乐没有识别出来,并且识别速度上也偏慢了一些。最为奇怪的是,咪咕音乐竟然一首歌都没有识别出来。
起初黑马以为是曲库不全的缘故,导致识别率过低,但是在换成咪咕音乐App放的歌曲测试中,一样识别不了。
后来以为是安卓版的App或许出现了点BUG,但是在更换成 iPhone 8 Plus 测试后,一样识别不出歌曲。
询问客服,原因也未可知,难道是工程师懒得维护?
测试榜单结果如下:
最后我们再来看看识别速度,如果说识别的准确率决定了听歌识曲的可用度,那么识别速度可以说是影响了听歌识曲的体验,到底谁更快?
黑马挑选了《七里香》、《那些你很冒险的梦》、《年少有为》等15首都可以成功识别的歌曲来测试。
测试结果如下,QQ音乐(4.53s) < 网易云音乐(4.87s) < 虾米音乐(7.27s)。
从结果来看,QQ音乐和网易云音乐耗时最短,依旧处于第一梯队,其中QQ音乐的耗时稍短于网易云音乐。
虾米音乐排第三,至于咪咕音乐,在上一轮测试中已经出局。
需要提醒的是,以上的测试都是从歌曲的开始时间测试的,如果直接从歌曲中间的人声测试,其识别速度还会更快,而以上的测试结果也仅能反映出在黑马的这个测试环境中的结果,实际中不同的环境和场景会有细微区别。
测试榜单如下:
在以上的测试环节中,大家应该也知道听歌识曲王者是谁了吧?
在识别率和识别速度上,QQ音乐和网易云音乐基本不相上下,但是QQ音乐在翻唱识别上具备绝对优势。另外,黑马在测试中发现一个问题,网易云音乐的曲库有些少了,有些歌曲即使识别到了歌名,但是因为没有版权而听不了,QQ音乐则没有出现这个问题。
至于虾米音乐和咪咕音乐,就中规中矩了。
说到这,为什么QQ音乐在听歌识别上能做的更好?一般人看热闹,而黑马由于太闲了则对其原因更感兴趣。
这一探究,发现QQ音乐的确有点门道。
其采用了一个名为Landmark的指纹算法,能够有效的增加抗噪声处理,提高识别速度。
为避免有的小伙伴疑惑,这里黑马解释一下,这里的指纹算法不是我们习以为常的指纹,而是指音频指纹。
这也很好理解,就像指纹是每个人独一无二的特征一样,所谓的歌曲也有一个“指纹”,这个“指纹”是最能表现出一首歌的特征的数据,通过识别这个音频指纹,就可以识别出歌曲来,这也是目前听歌识曲的技术原理。
这个算法有多牛逼?简单说,QQ音乐凭借着这个音频指纹(Audio Fingerprinting)技术荣获MIREX2022世界冠军。
这个MIREX含金量也不低,是国际音频检索领域的顶尖赛事,能在这个赛事上获得冠军,相当于听歌识曲技术得到了业界的高度认可。
有了这个算法,再加上哈希表和倒排索引,以及QQ音乐本身丰富的曲库、用户量和分析样本量,其听歌识曲速度自然就快了。
等等,这个哈希表和倒排索引又是什么东西?要解释起来,又是一篇长篇大论,只需要知道的是可以提高歌曲的识别效率就足够了,这也是为啥QQ音乐的听歌识曲耗时比同类产品短的原因。
但是黑马发现,QQ音乐真正厉害的在于翻唱识别功能,作为首个在音乐App中加入的功能,这个翻唱识别技术是怎么实现的?
解释起来也是一大篇论断,也很难解释,因为目前在音乐类的App中,只有QQ音乐具备翻唱识别功能,还没有一个成熟的商用方案。
这里就简单解释一下,翻唱识别技术是一种介于音频指纹和流派分类的一个基于音频内容的音乐检索技术。
音频指纹我们已经解释过了,如果要通过音频指纹系统识别到一首被人翻唱的歌曲,那么检索库中必须有这首翻唱歌曲,否则听歌识曲技术旧识别不出来。
(8种翻唱类型的组合)
这也是为什么翻唱版本的歌曲不能被其他音乐App识别到的原因,因为检索库中缺少了翻唱版本。
因此翻唱识别技术的检索算法中,会比音频指纹模糊,但是又不能太过于模糊,否则音频特征识别不到,还必须要知道这首歌曲的大概类别,因此要比流派、歌手分类检索要严格。
再通过一些特征提取、提取特征后的处理以及距离计算等算法来检索翻唱识别的歌曲。
总之,我们只需要知道的是翻唱识别技术,可以让听歌识曲的检索范围更大,同时在很多的生活使用场景中也的确需要翻唱识别技术。
其他的音乐App,这个功能赶紧跟进吧。
在以上的测试环节中,QQ音乐的听歌识曲技术的体验是最好的,准确度、识别速度以及识别范围都有着优势。
这种优势来源于QQ音乐把听歌识曲技术从精准识别拓展到了模糊识别,直接拓宽了识别范围和精度。
毕竟生活中给我们带来感动的,可能是我们正在听的一首完整的歌曲,也或许是我们不经意间听到的一两句歌词,河边的街头歌手的演唱、现场演唱会的激情、甚至旁人的随口吟唱……
从那不经意的歌词中,获取我们想要的音乐,这才是听歌识曲技术的意义。归根结底,听歌识曲技术只是一种手段,能为我们留住美好音乐才是其价值所在。
音乐,打通着人类的情感,听歌识曲,让每首音乐都拥有名字。