凉夜溪风 发表于 2012-4-14 21:42

关键是随着时间的推移 粉丝的增多,粉丝间的重复率也不断增大,最后总粉丝数趋于一个稳定值,,变化的重复率怎么搞,,

莈洧.洳淉 发表于 2012-4-15 09:21

重复率 哎 到底怎么算第一题啊

莈洧.洳淉 发表于 2012-4-15 09:32

对啊  网络推广 不包括电视推广  粉丝我们知道是单向的 但也不好算

快乐相伴930525 发表于 2012-4-15 09:42

莈洧.洳淉 发表于 2012-4-15 09:21 static/image/common/back.gif
重复率 哎 到底怎么算第一题啊

自己算呗。。。。。。{:3_48:}

Micro_sun 发表于 2012-4-15 10:46

韩香连 发表于 2012-4-13 16:41 static/image/common/back.gif
咨询的内容:请问数据左侧是Twitter用户,右侧是他的粉丝链接吗??

数据堂回复:应该是相反的。“A B” ...

这意思就是说左边的是右侧的粉丝??
晕。!

莈洧.洳淉 发表于 2012-4-15 21:27

{:3_46:} 搞好啦   虽然质量不太好

我i撤 发表于 2012-4-17 12:57

这是我们组做的数据预处理:
参考数据给出了Twitter社交网站用户之间的链接关系(follow 关系),一共有835541行,其中835424行数据为两列,第一列表示传播者,第二列表示其粉丝;而一共有117行数据出现异常情况:只有一列,其中第47390行数据为3ActspfMurder,根据前后行数据对比可知,该数据应为:3Actspf Murder,表示Murder为3Actspf的粉丝,而对于剩余的116行,对比前后数据,均找不出其规律,故将其删除。

我i撤 发表于 2012-4-17 13:02

C题的数据并不都是两列,用Matlab统计得到一共有835541行,其中835424行数据为两列,117行数据为一列,即异常情况。我们采取的方法是将异常情况删除掉。不过117相比于835424很小,不删除对结果影响也不大

我i撤 发表于 2012-4-17 13:06

Micro_sun 发表于 2012-4-15 10:46 static/image/common/back.gif
这意思就是说左边的是右侧的粉丝??
晕。!

用Matlab统计知:左边一列的一个用户名一般对应1~500个右边一列的用户名,其中一半以上超过了400个,根据题目意思,显然右边一列的人是左边一列人的粉丝,这是常识。

fly-star 发表于 2012-4-17 15:32

好的,用WORD打开比较清楚
页: 1 2 3 4 5 [6] 7
查看完整版本: 关于c题的两点说明