淘米 发表于 2012-6-5 11:44

打个比方,有40个成年男人的身高数据,用什么方法确定出“高”的标准

题目其实不是我要做的问题,是一个类比,不然我觉得我说不清楚

我实际的问题是做的深圳邀请赛B题短信种子用户识别,第一问建立每个用户的评分模型,再手动算得40个用户的积分吧
然后做第二问了,需要建立模型,区别出多少积分的用户才能算是“高”,即认定种子用户。。用做出的标准来衡量上万上百万用户。。

这是我们遇到的问题,我们这是在校内选拔,要是有什么建议麻烦赐教!比如40个数据是不是少?或者是这么想有什么不妥之类都行。。谢谢各位大神!

qqqq77722 发表于 2012-6-5 11:44

淘米 发表于 2012-6-5 18:50 static/image/common/back.gif
再取差值,怎么弄?

先取平均,再取每个值与平均值之差。。

qqqq77722 发表于 2012-6-5 12:26

我认为,平均高度,再取差值比较好点。

淘米 发表于 2012-6-5 18:50

qqqq77722 发表于 2012-6-5 12:26 static/image/common/back.gif
我认为,平均高度,再取差值比较好点。

再取差值,怎么弄?

淘米 发表于 2012-6-7 13:15

qqqq77722 发表于 2012-6-5 11:44 static/image/common/back.gif
先取平均,再取每个值与平均值之差。。

我最后用的方法差不多,就是平均值+标准差*系数

手执福音书 发表于 2012-7-22 20:19

用模糊聚类求。。。。。。。。。。。。。。

a6070933 发表于 2012-9-1 20:03

{:3_41:}{:3_41:}{:3_41:}{:3_41:}{:3_41:}
页: [1]
查看完整版本: 打个比方,有40个成年男人的身高数据,用什么方法确定出“高”的标准