4 C0 I5 D6 Q1 ?6 y* R/ [+ l7 \* }+ p( j5 V& C" g
理由一,本队的论文具有一些其他参赛模型所不具有的创新性:开放式分类。 : o$ U$ K. L, j/ U& s! E, u. d, Z) k% j- t& g7 `7 E; ^; O v+ M
0 ]+ Z" d6 r6 |; D6 Q + w# }* F# k d9 {; t& P 正如B题题目中所陈述的那样,现有分类类别“有的类别之间关系不清楚,造成混乱;有的类别过度粗略或精细;有的类别标签没有得到公认;有的音乐归属则存在争议或者难以划归。”这就要求我们不仅要提出分类方法,更重要的是提出一种科学的分类类别,并且能够为应用于推荐系统等方面埋下伏笔。5 Q' l% e9 I. C) N
0 K) X& N1 k% K 2 q- p: O0 N* R: Y2 k4 ]
3 i: N, O9 }$ b, {+ j 为了契合题意,我们队建立的几个模型,皆是为了面向推荐系统、打破传统风格分类界限而建立。 , | T3 x& f0 N4 v9 D$ X! d9 o9 @0 f1 t5 z4 F9 S% N; Y: u
) z, I7 G; w5 j" z* _8 K( m
+ X3 m- M: ~- a K* ]5 A1 V3 | 为了跳出传统风格分类(包括情感,文本,风格等)的不足,隐含在我们论文当中的思想是:“重估一切分类”。换句话说:最科学的分类类别,就是没有分类类别。可能这一观点多少有些令人困惑。然而,换一个角度,我们能够更好地理解这个思想。如果我们能提出一种分类方法,使得该方法不依赖于任何先验的类别信息(风格,情感,标签,或者任何你能想到的一切),那么就做到了“最好的分类类别,就是没有分类类别”。为了部分地做到这一点,我们通过无监督的分类模型(SOM神经网络)、分形维数模型、用户行为核密度估计模型来达到这一点。我们的分类方法撇开了现有分类的拐杖(如风格、感情、流派),同时加入了用户的行为信息,并且通过实证数据进行了初步验证。这无疑在网络电台推荐领域有着更好的应用前景。( {8 j1 Q: r7 t! H" A
+ L. d: d+ ^8 w 1 H) T- T+ J9 S7 f- m1 ~+ }# H# E O+ f$ d
而纵观其他参赛模型,几乎全部都是利用现有的类别(如风格和情感),然后在特征提取(如标签,音频特征,语义特征等)和分类方法上(BP,小波,SVM,GMM,蜂群算法等)做文章。我们可以发现,在前人的工作中,这类成果已经较为广泛和完善,可以直接使用而无需经过新的思考。如果对这些方法进行机械组合,那么我们得到的结果是没有太多实用价值的,如对于网络电台推荐性能的提高和音乐市场分析、大众音乐审美等进一步应用没有太大指导作用。以较有代表性的特等奖2854队作品为例,其模型三(基于LDA和SVM的分类方法)是基于现有的古典/流行/摇摆/爵士四类风格进行多分类,这并没有突破传统风格类别的界限;在当今这样一个音乐类别关系错综繁杂,且新生类别层出不穷的时代,这样即使分类正确率再高,对于网络电台的推荐也没有太多指导意义。其在模型四中,该论文虽然发现了分形维数这一个创新点,但目光依然局限于传统风格分类,没有发掘分形维数可以打破传统风格分类的潜质。0 B D! h% [6 a; u; M, E. Q
$ r! Z( H/ V) ^) Z q
/ e$ z3 C V* g0 J- K: n8 I# P1 E$ n' R# y) Y1 Q# ?
正如以上提到的特等奖论文一样,绝大多数论文都没有考虑打破传统风格界限,也没有考虑来自于用户方面的信息。这样的成果虽然在理论上有着一定的重要性,但在实际应用中只能拘泥并巩固传统分类,这多少违背了B题的初衷。我们组的亮点是勇于打破传统,迈出开放性分类的第一步,这与B题的要求十分契合,也与本赛事鼓励创新的初衷相一致,所以理应有更好的成绩。 6 {7 E5 I: O' t 9 k% W0 S* r' e) T( l4 M1 w# |: L 0 m! I& T% w* J s. p
a0 a0 x$ k4 m& `8 k( j 8 T0 U" u7 J% w6 Z. A- t9 }! s0 D; u2 j$ Q
理由二,本组模型专注于面向应用,“接地气”,考虑了用户的行为信息,为网络电台的推荐等应用埋下了伏笔,有着近一步研究应用的可能性。& X6 Y A$ v# h# v( i