# D8 h1 g' x3 | ' C* g) @' O( j$ `6 X1 I) z8 P; l 您好!/ ~6 C+ h* C+ I% D/ m- a
$ f/ g4 \8 `8 D6 P' g
我们是本次参赛的挑战者,队号为1009。首先,我谨代表我校参赛者们为贵组委会为批改论文和整理成绩所付出的辛勤的劳动表示感谢!我们对于贵组委会为广大数模爱好者提供这样一个竞技交流的平台而感到感谢;确实,多年来一直坚持自己的竞赛理念并坚持为广大数学建模爱好者提供优质的交流平台,是一件非常不容易,意义重大的事情。 P y. x4 K) Z' B, N+ b! W0 i; @& A; y, A/ D! l
但是,在此次2013第一阶段比赛的成绩初稿公布后,我们队以及我校数模组指导老师都对于我所在的队伍的成绩存在着很大的争议。得益于比赛的公平公开性,经队内的激烈讨论过后,本着对贵组委会的信任,我们决定和贵组委会交流(在一般的国赛中恐怕根本不会有这种机会。)。我们的初衷是,在提出自己的想法之余,为此次比赛平台的公平公开性做出微薄的努力。如有对论文评审结果有理解上的偏差,请专家们不啬赐教! ; ]. f' v( l) A0 D6 v o8 ] / ^! f4 `; x0 [; I. _7 c 本组选择的题目是B题,题目有关音乐分类问题。附件是本组的论文。在初稿中,我们的成绩是二等奖(75分,只差一分就是三等奖),评语是:“该文建立的模型较完整,思路清晰,但考虑的不够周全”。因此,我们队伍积极参阅了同时选择B题的大部分的优秀论文。在我们与其他选择B题的队伍(包括特等奖与部分一等奖的论文)的论文进行大量比较后,本队的队员一致认为:虽然我们的模型有一定的局限性,论文行文也有不够流畅的地方,然而本组的论文应至少具有一等奖的水平。以下是本队提出的理由: * a) i# L( k: q) l ! w! n; X. l& G& s% s& T# b * o: F# x" f k. V4 j% e9 l
& O9 C7 i$ r( H. @3 {! h) u6 F( r1 V 0 N7 c/ l8 A/ x & m- G7 G: w$ L, K+ Y理由一,本队的论文具有一些其他参赛模型所不具有的创新性:开放式分类。 & ]; V6 g( A {/ i' @3 k2 ]# \% u/ W8 a& c9 y2 W' c! c" t. b0 j
8 E7 S$ e: j# Y4 R7 s F' F5 m! \9 ]5 `" ?& z4 k 正如B题题目中所陈述的那样,现有分类类别“有的类别之间关系不清楚,造成混乱;有的类别过度粗略或精细;有的类别标签没有得到公认;有的音乐归属则存在争议或者难以划归。”这就要求我们不仅要提出分类方法,更重要的是提出一种科学的分类类别,并且能够为应用于推荐系统等方面埋下伏笔。6 w. N! Z( Q' c& J; h) Z. P
0 C. O9 v' H" Z% a5 J, d $ n5 Q& e/ S U. N) S
! {2 D1 d+ ^3 S# _. e4 j
为了契合题意,我们队建立的几个模型,皆是为了面向推荐系统、打破传统风格分类界限而建立。 ! _6 T, [* R8 v( L+ \: t* I3 I7 P3 t ( T! T7 l5 p6 _* r' [' h ) x, R' G3 P* ]# V5 F- I3 s
5 z. P9 x; L" [' t
为了跳出传统风格分类(包括情感,文本,风格等)的不足,隐含在我们论文当中的思想是:“重估一切分类”。换句话说:最科学的分类类别,就是没有分类类别。可能这一观点多少有些令人困惑。然而,换一个角度,我们能够更好地理解这个思想。如果我们能提出一种分类方法,使得该方法不依赖于任何先验的类别信息(风格,情感,标签,或者任何你能想到的一切),那么就做到了“最好的分类类别,就是没有分类类别”。为了部分地做到这一点,我们通过无监督的分类模型(SOM神经网络)、分形维数模型、用户行为核密度估计模型来达到这一点。我们的分类方法撇开了现有分类的拐杖(如风格、感情、流派),同时加入了用户的行为信息,并且通过实证数据进行了初步验证。这无疑在网络电台推荐领域有着更好的应用前景。) I" C' A% e) |9 j. E+ O( H
2 D1 G5 X) w; W% p/ ]" o" h& L
) }% k! a) ~0 U: _& B
# T" s! a E7 f# G N, u
而纵观其他参赛模型,几乎全部都是利用现有的类别(如风格和情感),然后在特征提取(如标签,音频特征,语义特征等)和分类方法上(BP,小波,SVM,GMM,蜂群算法等)做文章。我们可以发现,在前人的工作中,这类成果已经较为广泛和完善,可以直接使用而无需经过新的思考。如果对这些方法进行机械组合,那么我们得到的结果是没有太多实用价值的,如对于网络电台推荐性能的提高和音乐市场分析、大众音乐审美等进一步应用没有太大指导作用。以较有代表性的特等奖2854队作品为例,其模型三(基于LDA和SVM的分类方法)是基于现有的古典/流行/摇摆/爵士四类风格进行多分类,这并没有突破传统风格类别的界限;在当今这样一个音乐类别关系错综繁杂,且新生类别层出不穷的时代,这样即使分类正确率再高,对于网络电台的推荐也没有太多指导意义。其在模型四中,该论文虽然发现了分形维数这一个创新点,但目光依然局限于传统风格分类,没有发掘分形维数可以打破传统风格分类的潜质。: ?8 P: Q$ _9 d$ `# W
- H9 V1 b3 g+ a* i, {! S
/ n9 h3 Z& ~ Z! h, @8 W+ [% z4 r2 J- b) v8 G/ G
正如以上提到的特等奖论文一样,绝大多数论文都没有考虑打破传统风格界限,也没有考虑来自于用户方面的信息。这样的成果虽然在理论上有着一定的重要性,但在实际应用中只能拘泥并巩固传统分类,这多少违背了B题的初衷。我们组的亮点是勇于打破传统,迈出开放性分类的第一步,这与B题的要求十分契合,也与本赛事鼓励创新的初衷相一致,所以理应有更好的成绩。 N- |& N; P! O2 n' Q' k/ G% }. q1 a9 R: E
, ^, K3 k) W. p( L: `8 z6 i- O' ?, w) @% i
# D, y8 t" |8 I7 x- l# J9 t
2 j1 ?. E! h/ \! V6 C5 L理由二,本组模型专注于面向应用,“接地气”,考虑了用户的行为信息,为网络电台的推荐等应用埋下了伏笔,有着近一步研究应用的可能性。 2 b+ F, e4 v% \- Q, [/ O5 f$ i. Q8 H P0 z" i q/ U$ j- I
我们认为,音乐分类不能脱离人类的欣赏而独立存在。对于一个音乐作品,每个听众的理解是不同的。在我们需要综合考虑一下两点: |2 F2 S. h; @
9 z$ N: C; ^' y: I8 x8 R
1,音乐自身的特征; 0 o4 t `0 m8 N( v0 s, N" q5 A1 b- V1 N. c6 b( S8 K
2,特定听众的音乐鉴赏行为特征。 , e: C' h9 J% D" r 1 T$ j$ e( ]- Y1 B8 k+ |+ z 针对以上两点,我们建立了音频指纹和用户指纹的概念。可能由于时间紧迫和数据不够,这两个概念的应用价值难以被发现。由此,我们组在赛后也在着手建立相应的推荐系统。另外,在音乐市场分析和音乐审美分析的应用也是显而易见的。(如,针对各年代人气音乐的分形维数,可以绘制随音乐史变迁的分形维数变化,分析大众音乐审美倾向;通过用户指纹的变化,可以分析音乐市场的新动向,等等)。这些都是机械分类所无法达到的。 s, n+ o' v* _- G; G
7 w! l- I/ g! E1 z% C; Y
9 Z. @1 R2 G5 ?- C
. ^) V. B. s+ z; O! v! V) \ 此外,评语中谈到“考虑不够周全”。若这里的“不周全”是指音乐的外部信息考虑不周,那么事实上,针对音乐内部信息与外部信息的关系,我们在文中也进行了相应分析,可见论文第18~19页。我们的结论是,在实际应用中,音乐的内部信息往往才是主要矛盾。因此在模型中未有涉及情感、文本、标签等外部信息,也为情理之中。; ^( V2 O: O' \0 L& r6 T; Y
6 T- u: j0 }8 d8 O" n3 ~
" t2 ?9 `7 ^% |