3 y4 P4 T3 O$ `* S; e3 R 我们是本次参赛的挑战者,队号为1009。首先,我谨代表我校参赛者们为贵组委会为批改论文和整理成绩所付出的辛勤的劳动表示感谢!我们对于贵组委会为广大数模爱好者提供这样一个竞技交流的平台而感到感谢;确实,多年来一直坚持自己的竞赛理念并坚持为广大数学建模爱好者提供优质的交流平台,是一件非常不容易,意义重大的事情。 9 c5 ~; B7 a) m: \% b9 S! r1 M: F' F) P, O, }0 N3 P2 k0 e
但是,在此次2013第一阶段比赛的成绩初稿公布后,我们队以及我校数模组指导老师都对于我所在的队伍的成绩存在着很大的争议。得益于比赛的公平公开性,经队内的激烈讨论过后,本着对贵组委会的信任,我们决定和贵组委会交流(在一般的国赛中恐怕根本不会有这种机会。)。我们的初衷是,在提出自己的想法之余,为此次比赛平台的公平公开性做出微薄的努力。如有对论文评审结果有理解上的偏差,请专家们不啬赐教!7 }9 |% b* x2 j* }
& D. j* ?& L s7 ~1 N% A
本组选择的题目是B题,题目有关音乐分类问题。附件是本组的论文。在初稿中,我们的成绩是二等奖(75分,只差一分就是三等奖),评语是:“该文建立的模型较完整,思路清晰,但考虑的不够周全”。因此,我们队伍积极参阅了同时选择B题的大部分的优秀论文。在我们与其他选择B题的队伍(包括特等奖与部分一等奖的论文)的论文进行大量比较后,本队的队员一致认为:虽然我们的模型有一定的局限性,论文行文也有不够流畅的地方,然而本组的论文应至少具有一等奖的水平。以下是本队提出的理由: J, d( C( X7 ^! u, i( O$ g4 q 2 ~( ~4 H; t6 }4 D- ? w, I $ w4 `& B4 ], y5 t3 l( d. E3 ?( A/ @) c: P) W1 Z% |: y4 W
7 Y5 Z. r" ?/ `0 G
& [( I1 v" T. u3 N0 Y6 Y
理由一,本队的论文具有一些其他参赛模型所不具有的创新性:开放式分类。 " Y; m$ O& u G* v: S+ m0 X 1 | X. Y' s( T' B/ Z. n . x( G* z8 E# X, R! J9 Q' o! r/ q $ `% s" X# R7 E! J 正如B题题目中所陈述的那样,现有分类类别“有的类别之间关系不清楚,造成混乱;有的类别过度粗略或精细;有的类别标签没有得到公认;有的音乐归属则存在争议或者难以划归。”这就要求我们不仅要提出分类方法,更重要的是提出一种科学的分类类别,并且能够为应用于推荐系统等方面埋下伏笔。* \# x* n. }1 |: ^$ ~# q. e, r5 `
8 ~/ E- b) J$ Z( v6 y3 H* G / M; s l5 I; v" K2 l
1 ^; E' w- a1 c: M
为了契合题意,我们队建立的几个模型,皆是为了面向推荐系统、打破传统风格分类界限而建立。3 ]; q/ @* e' R1 z# J6 r( z
, @( Z3 Q3 g. W. C! q' }# x
% f6 E( F: C+ g v) u& } B d3 C
( T4 o. |1 M% \ r: ~" Z" O- u 为了跳出传统风格分类(包括情感,文本,风格等)的不足,隐含在我们论文当中的思想是:“重估一切分类”。换句话说:最科学的分类类别,就是没有分类类别。可能这一观点多少有些令人困惑。然而,换一个角度,我们能够更好地理解这个思想。如果我们能提出一种分类方法,使得该方法不依赖于任何先验的类别信息(风格,情感,标签,或者任何你能想到的一切),那么就做到了“最好的分类类别,就是没有分类类别”。为了部分地做到这一点,我们通过无监督的分类模型(SOM神经网络)、分形维数模型、用户行为核密度估计模型来达到这一点。我们的分类方法撇开了现有分类的拐杖(如风格、感情、流派),同时加入了用户的行为信息,并且通过实证数据进行了初步验证。这无疑在网络电台推荐领域有着更好的应用前景。 2 y' q' H1 x5 t4 d3 \% a* @( \% `% y j, X# {7 p+ L
白浪 发表于 2013-5-13 13:31 ; z! m, P9 x3 m0 S
大致看了一下,论文给出的模型有东拼西凑的嫌疑,在一篇论文中解决同一个问题的模型之间应该是层层递进的关 ...
. M4 `. X9 ^% c M: O
谢谢你的回复!其实我们论文的四个模型既有层层推进,也有相互平行,主线也是清晰的。所有模型看似松散,实际上都是针对“开放性分类、面向推荐”这一个主线进行。在这一个主线下,又分了两个互相平行的部分:前两个模型为第一条子线,主要是为了和传统的“特征提取--机器学习分类”的方法承接起来,只不过采用了无监督的办法摆脱传统分类约束。后两个模型形成第二条子线,进一步发掘第一条子线中蕴含的“重估一切分类”的思想。采用分形维和用户指纹这两个高度压缩的信息代表音乐内部信息和用户信息。分形维数不是我们的首创,但是分形维数和核密度估计的结合确实是我们的创新点。第二条主线我们没有进一步给出分类方法,这引起了误解,使得论文看起来像东拼西凑,但是我们确实已经完成了分类。所谓的音乐分类,本质上可以看做是提取出一种一维的特征。分形维已经解决了这一点。这就是分形维的优势:特征即分类。这使得其与用户行为的估计可以较容易的结合起来。我们确实也这么做了。但光靠分形维确实单薄。因此我们的第一条主线就有了存在意义:与之互补。最后,我们没有像2854队一样“给出”基于分形维的分类方法,因为这支特等奖队伍根本没有仔细思考过——他们队后两个模型是完全抄袭的。东拼西凑的嫌疑最大的是他们。