打个比方,有40个成年男人的身高数据,用什么方法确定出“高”的标准
题目其实不是我要做的问题,是一个类比,不然我觉得我说不清楚、
我实际的问题是做的深圳邀请赛B题短信种子用户识别,第一问建立每个用户的评分模型,再手动算得40个用户的积分吧
然后做第二问了,需要建立模型,区别出多少积分的用户才能算是“高”,即认定种子用户。。用做出的标准来衡量上万上百万用户。。
这是我们遇到的问题,我们这是在校内选拔,要是有什么建议麻烦赐教!比如40个数据是不是少?或者是这么想有什么不妥之类都行。。谢谢各位大神! 淘米 发表于 2012-6-5 18:50 static/image/common/back.gif
再取差值,怎么弄?
先取平均,再取每个值与平均值之差。。 我认为,平均高度,再取差值比较好点。 qqqq77722 发表于 2012-6-5 12:26 static/image/common/back.gif
我认为,平均高度,再取差值比较好点。
再取差值,怎么弄? qqqq77722 发表于 2012-6-5 11:44 static/image/common/back.gif
先取平均,再取每个值与平均值之差。。
我最后用的方法差不多,就是平均值+标准差*系数 用模糊聚类求。。。。。。。。。。。。。。 {:3_41:}{:3_41:}{:3_41:}{:3_41:}{:3_41:}
页:
[1]