- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 564676 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 174626
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 3
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
|---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
数模国赛梳理
! m) e9 ]) z# `& u6 j) m: W+ y: A y 2 n6 ]" `- w2 ~3 s/ y% P8 y1 [6 f
本篇博客梳理一下大三上学期刚开学时候做的数学建模比赛。
" Q( q7 W9 d; R3 l# I/ C5 W3 r! i我们队选择的题目是一个关于拍照赚钱任务定价的问题。具体来说就是一个APP为了进行超市商品调查,发布一系列的拍照任务,网络用户自愿领取需要拍照的任务,任务完成后即可获得相应的定价酬金。APP 中的任务定价是其核心要素。如果定
% j+ O% O5 \7 m% \6 k价不合理,有的任务就会无人问津,而导致商品调查的失败。根据题目提供的一系列数据,从而挖掘出定价的规律和定价改进方案。题目提供的数据有上一年发布的任务的统计,包括经纬度坐标、任务的定价与是否完成的情况,以及所有注册用户的信息,包括用户的坐标位置、等级、能够接受任务的数量上限。. h4 {5 I# ~( J0 F3 V
这感觉实际上是一个迷你版的数据挖掘的题目,我们的任务是挖掘上一年定价的规律以及如何通过修改定价提高任务的完成比例。4 J# h$ `3 G0 N2 R% c* k: z! O
' d3 ~/ X6 `4 T1 @- y& P' F9 E2 X特征筛选
, E% E, N7 F; P/ \+ I- X. J5 ~+ U' J% u4 a
我们首先是完成特征的提取和筛选,通过散点图观察,发现这些任务主要聚集在三个地区,通过kmeans聚类得到了三个中心点,通过地图查询发现这三个中心点刚好分别对应广州深圳东莞三个城市。而且通过三维散点图发现,越靠近这三个聚类中心点,任务的定价越低、任务数量也越密集。考虑到市场供求关系,我们猜测任务的定价可能跟城市的发达程度、交通便利程度以及周围任务的竞争者数量有关。所以我们选取了几个特征,包括任务发布地点分别距离三个聚类中心点的距离、任务周围用户的数量、周围用户的平均等级。通过SPSS也进一步验证了这些特征与任务的定价有着较强的相关性。
& y+ {7 U7 V2 S3 u6 f. A- C
+ K+ ?( q& w8 p4 ^9 Q& e! ^定价模型的确定 x; u: v! [5 _, i& \6 l/ j/ I& J% E! P
W3 e" ]% m: v& _6 S; A& u因为任务成功就说明定价较为合理,所以筛选出上一年成功的任务信息,利用上面提取的特征,利用BP神经网络对定价进行回归,用来预测新任务的定价。同时利用上一年所有任务信息,训练二分类BP神经网络,作为任务是否成功的分类器模型。
- x5 t; f3 n/ E用上面得到的神经网络回归器预测上一年未完成的任务的定价作为新的定价标准。然后将这些任务输入上面的神经网络分类器进行分类评估,发现完成比例略微有上升。我们认为等级小于一定数值的用户是新用户,所以应该给予他们一定的新手红包作为鼓励,我们筛选出周围用户平均等级小于一定级别的任务点,将这些任务点的定价提高20元,通过神经网络分类器评估发现,成果比例有较大提升。' d) p2 r5 l# P- t; v8 Z( Q3 Z1 y5 p
; ~; }0 _' c" V( d5 s, C9 k% X# P任务打包发布
! }+ l+ D" j, K1 x+ w
7 w C/ Z% e: E+ ~ m考虑到有些任务距离很近,如果将它们打包成一个任务将会提高效率,所以将所有任务通过聚类聚成500个点,以聚类中心的信息表示该任务包所有任务的信息。发现通过打包任务的成功率又有一定的提升。
P. D' l: c+ e! u# E7 \9 I% {: O) j6 O6 {. V7 D! _
新任务的定价! L7 n7 E- e7 R1 H) m* l
; H9 I) p# \! a9 v对于一批新的任务,同样采用聚类打包的形式,并输入神经网络回归器进行定价的预测,并用上面提到的分类器进行效果评估,能达到较好的完成率。
( U# f2 ?! [$ `# K9 p, G
6 h$ s1 ^' x6 Y3 J6 I- e7 \5 @3 ~模型改进 {2 t5 \1 E5 h# Y& g% b: _
9 h5 I$ C* f& O9 Z' @
由于使用神经网络黑箱模型,对价格的预测和修改缺少说服力,也缺少一定的解释性,所以可使用svm分类器作为任务是否成功的评价算法,同时观察各个任务点距离分类超平面的距离,对于分类为不能完成的任务,可通过修改价格使得任务点靠近分类超平面,这样就使得价格的制定有更好的解释性。同时也可以对于分类为可以完成的任务,在保证其不接触超平面的前提下,减少任务定价节约成本。) [5 E& r/ |) l5 t/ _% V6 X' }' O4 q
--------------------- 0 |7 O( @0 H, n- k
作者:Cchbin - _# @1 ~3 }; k( x" J
来源:CSDN
' C! n7 I9 ?# s! h; V9 K7 b6 c8 v# V7 c6 c+ n* V8 x1 o- Y, s
! H% S, d' b1 S( T/ Q5 w- n2 z9 N( P8 s: A" e$ D- U0 R e# O* f
, ~! h' L4 M7 l- |2 X
|
zan
|