凉夜溪风
发表于 2012-4-14 21:42
关键是随着时间的推移 粉丝的增多,粉丝间的重复率也不断增大,最后总粉丝数趋于一个稳定值,,变化的重复率怎么搞,,
莈洧.洳淉
发表于 2012-4-15 09:21
重复率 哎 到底怎么算第一题啊
莈洧.洳淉
发表于 2012-4-15 09:32
对啊 网络推广 不包括电视推广 粉丝我们知道是单向的 但也不好算
快乐相伴930525
发表于 2012-4-15 09:42
莈洧.洳淉 发表于 2012-4-15 09:21 static/image/common/back.gif
重复率 哎 到底怎么算第一题啊
自己算呗。。。。。。{:3_48:}
Micro_sun
发表于 2012-4-15 10:46
韩香连 发表于 2012-4-13 16:41 static/image/common/back.gif
咨询的内容:请问数据左侧是Twitter用户,右侧是他的粉丝链接吗??
数据堂回复:应该是相反的。“A B” ...
这意思就是说左边的是右侧的粉丝??
晕。!
莈洧.洳淉
发表于 2012-4-15 21:27
{:3_46:} 搞好啦 虽然质量不太好
我i撤
发表于 2012-4-17 12:57
这是我们组做的数据预处理:
参考数据给出了Twitter社交网站用户之间的链接关系(follow 关系),一共有835541行,其中835424行数据为两列,第一列表示传播者,第二列表示其粉丝;而一共有117行数据出现异常情况:只有一列,其中第47390行数据为3ActspfMurder,根据前后行数据对比可知,该数据应为:3Actspf Murder,表示Murder为3Actspf的粉丝,而对于剩余的116行,对比前后数据,均找不出其规律,故将其删除。
我i撤
发表于 2012-4-17 13:02
C题的数据并不都是两列,用Matlab统计得到一共有835541行,其中835424行数据为两列,117行数据为一列,即异常情况。我们采取的方法是将异常情况删除掉。不过117相比于835424很小,不删除对结果影响也不大
我i撤
发表于 2012-4-17 13:06
Micro_sun 发表于 2012-4-15 10:46 static/image/common/back.gif
这意思就是说左边的是右侧的粉丝??
晕。!
用Matlab统计知:左边一列的一个用户名一般对应1~500个右边一列的用户名,其中一半以上超过了400个,根据题目意思,显然右边一列的人是左边一列人的粉丝,这是常识。
fly-star
发表于 2012-4-17 15:32
好的,用WORD打开比较清楚