, s1 `6 z4 X- L- @- Y 2 R1 t6 g4 J- c4 B! ~
) P* t S6 g9 E! E$ |# y
正如B题题目中所陈述的那样,现有分类类别“有的类别之间关系不清楚,造成混乱;有的类别过度粗略或精细;有的类别标签没有得到公认;有的音乐归属则存在争议或者难以划归。”这就要求我们不仅要提出分类方法,更重要的是提出一种科学的分类类别,并且能够为应用于推荐系统等方面埋下伏笔。2 B- _& v. E; N: W. }1 ~9 ^, s
' O1 j/ b# l7 F( m; ^ 5 q; M8 g& `& K$ y5 l, u 0 ^4 @9 ]5 u* v 为了契合题意,我们队建立的几个模型,皆是为了面向推荐系统、打破传统风格分类界限而建立。 4 T7 g$ F! }) E+ s4 m- H1 a ; e/ q4 T8 W2 D 6 S* o9 x# Q c' q& R/ X; I2 G9 L% W5 N# f
为了跳出传统风格分类(包括情感,文本,风格等)的不足,隐含在我们论文当中的思想是:“重估一切分类”。换句话说:最科学的分类类别,就是没有分类类别。可能这一观点多少有些令人困惑。然而,换一个角度,我们能够更好地理解这个思想。如果我们能提出一种分类方法,使得该方法不依赖于任何先验的类别信息(风格,情感,标签,或者任何你能想到的一切),那么就做到了“最好的分类类别,就是没有分类类别”。为了部分地做到这一点,我们通过无监督的分类模型(SOM神经网络)、分形维数模型、用户行为核密度估计模型来达到这一点。我们的分类方法撇开了现有分类的拐杖(如风格、感情、流派),同时加入了用户的行为信息,并且通过实证数据进行了初步验证。这无疑在网络电台推荐领域有着更好的应用前景。 , p' l( U5 O7 S6 i ; b2 g* L3 l8 f, G ; g% l2 j" C t& D* c
3 M$ x0 i: L' X' R. l4 X! M 而纵观其他参赛模型,几乎全部都是利用现有的类别(如风格和情感),然后在特征提取(如标签,音频特征,语义特征等)和分类方法上(BP,小波,SVM,GMM,蜂群算法等)做文章。我们可以发现,在前人的工作中,这类成果已经较为广泛和完善,可以直接使用而无需经过新的思考。如果对这些方法进行机械组合,那么我们得到的结果是没有太多实用价值的,如对于网络电台推荐性能的提高和音乐市场分析、大众音乐审美等进一步应用没有太大指导作用。以较有代表性的特等奖2854队作品为例,其模型三(基于LDA和SVM的分类方法)是基于现有的古典/流行/摇摆/爵士四类风格进行多分类,这并没有突破传统风格类别的界限;在当今这样一个音乐类别关系错综繁杂,且新生类别层出不穷的时代,这样即使分类正确率再高,对于网络电台的推荐也没有太多指导意义。其在模型四中,该论文虽然发现了分形维数这一个创新点,但目光依然局限于传统风格分类,没有发掘分形维数可以打破传统风格分类的潜质。+ u0 q: e# g7 Q$ H
H& C8 o! m: i: r# ^- i' v h5 m ?7 w8 A: d) n% `/ h7 C6 S- ?
正如以上提到的特等奖论文一样,绝大多数论文都没有考虑打破传统风格界限,也没有考虑来自于用户方面的信息。这样的成果虽然在理论上有着一定的重要性,但在实际应用中只能拘泥并巩固传统分类,这多少违背了B题的初衷。我们组的亮点是勇于打破传统,迈出开放性分类的第一步,这与B题的要求十分契合,也与本赛事鼓励创新的初衷相一致,所以理应有更好的成绩。) k: h; X3 U. O0 \
3 @7 m7 f+ E4 u E 3 ?( W: f( a9 ` U% Q# m8 O, g% S4 D0 O- e* c+ ^
7 O) h# J f5 b. k( ]# G0 K
0 x1 c) \. V9 `8 X4 _ f
理由二,本组模型专注于面向应用,“接地气”,考虑了用户的行为信息,为网络电台的推荐等应用埋下了伏笔,有着近一步研究应用的可能性。5 O1 X" U9 B0 `( ?5 M( \ D4 N
4 }. p2 G& `* ?' s/ {( g 我们认为,音乐分类不能脱离人类的欣赏而独立存在。对于一个音乐作品,每个听众的理解是不同的。在我们需要综合考虑一下两点:" Y0 K3 ^( T+ K" u4 X& a' C
- z( j; L$ H5 h9 J: J
1,音乐自身的特征;) z! x/ Q; B$ \% D4 h2 O' V& _
. Q2 x& |, U$ ~& q! a2,特定听众的音乐鉴赏行为特征。0 \0 c i4 W, u7 ?# e1 y2 e& i
9 |& s% `0 I$ W8 D z
针对以上两点,我们建立了音频指纹和用户指纹的概念。可能由于时间紧迫和数据不够,这两个概念的应用价值难以被发现。由此,我们组在赛后也在着手建立相应的推荐系统。另外,在音乐市场分析和音乐审美分析的应用也是显而易见的。(如,针对各年代人气音乐的分形维数,可以绘制随音乐史变迁的分形维数变化,分析大众音乐审美倾向;通过用户指纹的变化,可以分析音乐市场的新动向,等等)。这些都是机械分类所无法达到的。 5 T1 J: W5 u- _8 p0 p . C$ ]* I& C3 y. Z ~6 `' V 4 K7 l' w F( ]' |* r0 ^ - q2 N' Q; N6 T8 \' B+ ^4 s" Q* u 此外,评语中谈到“考虑不够周全”。若这里的“不周全”是指音乐的外部信息考虑不周,那么事实上,针对音乐内部信息与外部信息的关系,我们在文中也进行了相应分析,可见论文第18~19页。我们的结论是,在实际应用中,音乐的内部信息往往才是主要矛盾。因此在模型中未有涉及情感、文本、标签等外部信息,也为情理之中。 $ T# O% A0 n1 `+ I$ v, C9 k X; m, [3 d: [5 p/ I) i7 A) r
6 Y4 U i3 T. R: l: j
" K. l/ E' u+ Y
+ Q7 i" W9 ~: Q
7 ^" M6 D J* @2 @0 G8 k 综上所述,我们认为,尽管我们的论文有很多不足,模型也并不复杂,论述也稍显粗糙,但本组论文勇于打破传统,迈出开放性分类的第一步,并且面向推荐系统,考虑实际应用,这与B题的要求十分契合,也与本赛事鼓励创新的初衷相一致。与其他参赛队的论文相比,理应有更好的成绩。希望组委会和专家评审们能够再一次重新评估,给出更详细的建议。同时,这也可进一步宣传推广“认证杯”数学建模比赛。希望我们小小的意见能够被组委会考虑。若能如此,我们将不胜感激。再次表示感谢! Z3 X. e3 U, ?6 Y4 u# g4 v0 I( F& o- S$ i" o" C
. t0 y& \* q, k$ D9 x4 C