2 \! j f5 x, I# p9 m/ B4 t' t0 \2 |7 @0 ^; g- ?! H3 o
理由一,本队的论文具有一些其他参赛模型所不具有的创新性:开放式分类。 / g) C( G8 [2 ]/ r1 f! E 6 c7 {5 c) Q7 P0 c( k/ l4 O * a" s6 N9 W/ c' r 3 r) s5 ^- u6 `% _/ { 正如B题题目中所陈述的那样,现有分类类别“有的类别之间关系不清楚,造成混乱;有的类别过度粗略或精细;有的类别标签没有得到公认;有的音乐归属则存在争议或者难以划归。”这就要求我们不仅要提出分类方法,更重要的是提出一种科学的分类类别,并且能够为应用于推荐系统等方面埋下伏笔。 $ J4 e% }( C n 8 n! ?% b+ W% a, J5 R" N0 L$ t$ J . J4 L% f: V) i- F% ~
: ]" [7 B$ b* @6 T 为了契合题意,我们队建立的几个模型,皆是为了面向推荐系统、打破传统风格分类界限而建立。1 r) B2 Z. u8 p
$ U; U" B( K6 U3 ~: [8 V) K
# Q6 C4 H- |5 X) r. s8 F5 K9 @* X0 {1 v ( {# s$ r U4 N# t/ R 为了跳出传统风格分类(包括情感,文本,风格等)的不足,隐含在我们论文当中的思想是:“重估一切分类”。换句话说:最科学的分类类别,就是没有分类类别。可能这一观点多少有些令人困惑。然而,换一个角度,我们能够更好地理解这个思想。如果我们能提出一种分类方法,使得该方法不依赖于任何先验的类别信息(风格,情感,标签,或者任何你能想到的一切),那么就做到了“最好的分类类别,就是没有分类类别”。为了部分地做到这一点,我们通过无监督的分类模型(SOM神经网络)、分形维数模型、用户行为核密度估计模型来达到这一点。我们的分类方法撇开了现有分类的拐杖(如风格、感情、流派),同时加入了用户的行为信息,并且通过实证数据进行了初步验证。这无疑在网络电台推荐领域有着更好的应用前景。 0 o$ e) ]$ H1 l z 3 h2 y: w6 S( }3 Z ( \$ C Z4 s! I* O
X* h' ~" K7 e5 H/ D" @. _" l
而纵观其他参赛模型,几乎全部都是利用现有的类别(如风格和情感),然后在特征提取(如标签,音频特征,语义特征等)和分类方法上(BP,小波,SVM,GMM,蜂群算法等)做文章。我们可以发现,在前人的工作中,这类成果已经较为广泛和完善,可以直接使用而无需经过新的思考。如果对这些方法进行机械组合,那么我们得到的结果是没有太多实用价值的,如对于网络电台推荐性能的提高和音乐市场分析、大众音乐审美等进一步应用没有太大指导作用。以较有代表性的特等奖2854队作品为例,其模型三(基于LDA和SVM的分类方法)是基于现有的古典/流行/摇摆/爵士四类风格进行多分类,这并没有突破传统风格类别的界限;在当今这样一个音乐类别关系错综繁杂,且新生类别层出不穷的时代,这样即使分类正确率再高,对于网络电台的推荐也没有太多指导意义。其在模型四中,该论文虽然发现了分形维数这一个创新点,但目光依然局限于传统风格分类,没有发掘分形维数可以打破传统风格分类的潜质。* T7 T! _0 x) U8 \
& |3 K2 E4 _( n M8 k$ Y+ b
9 K( k/ g# E$ z+ p
, m1 l0 j& t5 `: E1 U, e8 x! S 正如以上提到的特等奖论文一样,绝大多数论文都没有考虑打破传统风格界限,也没有考虑来自于用户方面的信息。这样的成果虽然在理论上有着一定的重要性,但在实际应用中只能拘泥并巩固传统分类,这多少违背了B题的初衷。我们组的亮点是勇于打破传统,迈出开放性分类的第一步,这与B题的要求十分契合,也与本赛事鼓励创新的初衷相一致,所以理应有更好的成绩。 8 Y$ p/ N1 z0 P/ m! ]6 X h6 ~# ], E2 U
' k2 T9 l$ u+ L7 W4 s9 |0 @ " J& v" x, y, M & A( v; F6 b7 K. D
2 n2 l3 b% E2 C; J/ B) F理由二,本组模型专注于面向应用,“接地气”,考虑了用户的行为信息,为网络电台的推荐等应用埋下了伏笔,有着近一步研究应用的可能性。 ; `& \/ `8 x% H- e 6 D i N4 R9 `; O) [ 我们认为,音乐分类不能脱离人类的欣赏而独立存在。对于一个音乐作品,每个听众的理解是不同的。在我们需要综合考虑一下两点: * n, n6 B4 z3 v* B 9 C7 b# I! Z, M; g1 t1,音乐自身的特征;7 h' {: r0 i6 T- |7 o- z/ B
i* ^4 Z1 p2 Q* f! w
2,特定听众的音乐鉴赏行为特征。 9 d4 L8 ?2 t6 [1 M1 P& \0 V2 Z $ V, o3 N' m! e; l3 a) W 针对以上两点,我们建立了音频指纹和用户指纹的概念。可能由于时间紧迫和数据不够,这两个概念的应用价值难以被发现。所以,我们组在赛后也在着手建立相应的推荐系统。另外,在音乐市场分析和音乐审美分析的应用也是显而易见的。(如,针对各年代人气音乐的分形维数,可以绘制随音乐史变迁的分形维数变化,分析大众音乐审美倾向;通过用户指纹的变化,可以分析音乐市场的新动向,等等)。这些都是机械分类所无法达到的。5 e, Y% W# f* W: e3 O0 i0 P2 y# x
( d5 e8 m. @# S# W' j b4 `+ ^: Z6 l - e2 Q% e# c4 u R0 z
! a' X) |* |" F C0 K4 X
此外,评语中谈到“考虑不够周全”。若这里的“不周全”是指音乐的外部信息考虑不周,那么事实上,针对音乐内部信息与外部信息的关系,我们在文中也进行了相应分析,可见论文第18~19页。我们的结论是,在实际应用中,音乐的内部信息往往才是主要矛盾。因此在模型中未有涉及情感、文本、标签等外部信息,也为情理之中。 ( K- ~( d% w, W B( y8 P7 g" W" ?4 } - e! H1 t9 F& x b. ^- Z. d) |$ E + F/ U4 u3 ]6 R+ x8 g9 A
/ c [$ ~! M8 `$ d1 a4 l
# q/ J9 {/ `0 U8 D+ K' K , j/ _8 G; V6 v 综上所述,我们认为,尽管我们的论文有很多不足,模型也并不复杂,论述也稍显粗糙,但本组论文勇于打破传统,迈出开放性分类的第一步,并且面向推荐系统,考虑实际应用,这与B题的要求十分契合,也与本赛事鼓励创新的初衷相一致。与其他参赛队的论文相比,理应有更好的成绩。希望组委会和专家评审们能够再一次重新评估,给出更详细的建议。同时,这也可进一步宣传推广“认证杯”数学建模比赛。希望我们小小的意见能够被组委会考虑。若能如此,我们将不胜感激。再次表示感谢!: c; g- X% C/ V. ~
) r# F F$ T: f$ s 0 u) @! h9 V L, K& o/ {: A' |: o! K3 F) L! P1 c
/ i n9 W$ O$ Z8 P8 w- I, ^% o" W
可行性我们确实有考虑。不过是否可行还要具体实践验证,3天比赛说明不了什么。我们队对这个课题很感兴趣,现在正在继续做这个推荐系统(第一阶段我们针对推荐系统埋下了个大坑,第二阶段出的题有些偏离预想。私自挖坑的后果!)。另外我感觉我们1楼写的东西,语言不是犀利跋扈吧(我感觉,所谓的“抨击”,实际上只是指出缺点而已啊。或许我们驾驭文字能力欠佳。总之你可能理解错了= =)。