3 v; |9 B" z+ Q5 P( l! z! S, F 7 V2 l2 d d) M3 |( F- H3 k$ ~ ) R; R6 B) C8 z2 s' d. [: E 为了契合题意,我们队建立的几个模型,皆是为了面向推荐系统、打破传统风格分类界限而建立。 3 q7 J. E; Y) D9 N2 _ 0 _( W. p" ^2 d: Q4 k. | . e' | a& s o: d' w& ^9 u
5 Q8 K7 P' H7 ]5 S
为了跳出传统风格分类(包括情感,文本,风格等)的不足,隐含在我们论文当中的思想是:“重估一切分类”。换句话说:最科学的分类类别,就是没有分类类别。可能这一观点多少有些令人困惑。然而,换一个角度,我们能够更好地理解这个思想。如果我们能提出一种分类方法,使得该方法不依赖于任何先验的类别信息(风格,情感,标签,或者任何你能想到的一切),那么就做到了“最好的分类类别,就是没有分类类别”。为了部分地做到这一点,我们通过无监督的分类模型(SOM神经网络)、分形维数模型、用户行为核密度估计模型来达到这一点。我们的分类方法撇开了现有分类的拐杖(如风格、感情、流派),同时加入了用户的行为信息,并且通过实证数据进行了初步验证。这无疑在网络电台推荐领域有着更好的应用前景。2 T$ @6 \6 J% { L
# t' {( Q4 Y5 D- U, k* ?' c# N! ]
3 k6 f% ?3 p& V$ T* o- R! I8 I s
X0 c' w R- b 而纵观其他参赛模型,几乎全部都是利用现有的类别(如风格和情感),然后在特征提取(如标签,音频特征,语义特征等)和分类方法上(BP,小波,SVM,GMM,蜂群算法等)做文章。我们可以发现,在前人的工作中,这类成果已经较为广泛和完善,可以直接使用而无需经过新的思考。如果对这些方法进行机械组合,那么我们得到的结果是没有太多实用价值的,如对于网络电台推荐性能的提高和音乐市场分析、大众音乐审美等进一步应用没有太大指导作用。以较有代表性的特等奖2854队作品为例,其模型三(基于LDA和SVM的分类方法)是基于现有的古典/流行/摇摆/爵士四类风格进行多分类,这并没有突破传统风格类别的界限;在当今这样一个音乐类别关系错综繁杂,且新生类别层出不穷的时代,这样即使分类正确率再高,对于网络电台的推荐也没有太多指导意义。其在模型四中,该论文虽然发现了分形维数这一个创新点,但目光依然局限于传统风格分类,没有发掘分形维数可以打破传统风格分类的潜质。 , ?* [7 O6 f/ i3 C# y1 P V2 `& J' B4 f" x
' \9 h% l! F+ t: f0 H 8 X3 _" k- s7 Z, m( T, } 正如以上提到的特等奖论文一样,绝大多数论文都没有考虑打破传统风格界限,也没有考虑来自于用户方面的信息。这样的成果虽然在理论上有着一定的重要性,但在实际应用中只能拘泥并巩固传统分类,这多少违背了B题的初衷。我们组的亮点是勇于打破传统,迈出开放性分类的第一步,这与B题的要求十分契合,也与本赛事鼓励创新的初衷相一致,所以理应有更好的成绩。5 y, i+ J$ K' J, } n
7 }* g" {! Y9 E& h2 e* O
白浪 发表于 2013-5-13 13:31 ) g w( B) q* y7 r大致看了一下,论文给出的模型有东拼西凑的嫌疑,在一篇论文中解决同一个问题的模型之间应该是层层递进的关 ...
( G d* c( `+ f4 H) L# T! R p
谢谢你的回复!其实我们论文的四个模型既有层层推进,也有相互平行,主线也是清晰的。所有模型看似松散,实际上都是针对“开放性分类、面向推荐”这一个主线进行。在这一个主线下,又分了两个互相平行的部分:前两个模型为第一条子线,主要是为了和传统的“特征提取--机器学习分类”的方法承接起来,只不过采用了无监督的办法摆脱传统分类约束。后两个模型形成第二条子线,进一步发掘第一条子线中蕴含的“重估一切分类”的思想。采用分形维和用户指纹这两个高度压缩的信息代表音乐内部信息和用户信息。分形维数不是我们的首创,但是分形维数和核密度估计的结合确实是我们的创新点。第二条主线我们没有进一步给出分类方法,这引起了误解,使得论文看起来像东拼西凑,但是我们确实已经完成了分类。所谓的音乐分类,本质上可以看做是提取出一种一维的特征。分形维已经解决了这一点。这就是分形维的优势:特征即分类。这使得其与用户行为的估计可以较容易的结合起来。我们确实也这么做了。但光靠分形维确实单薄。因此我们的第一条主线就有了存在意义:与之互补。最后,我们没有像2854队一样“给出”基于分形维的分类方法,因为这支特等奖队伍根本没有仔细思考过——他们队后两个模型是完全抄袭的。东拼西凑的嫌疑最大的是他们。