[数据资源]带有转发和情感标签的1万活跃用户微博数据
本帖最后由 衫衫学长 于 2016-8-31 21:49 编辑为了鼓励国赛的同学,尽力分享之前收藏的一些数据文件和各种文献。
--------------------------------------------------
数据名称:带有转发和情感标签的微博数据
数据介绍:2010年4月至9月,包含1万活跃用户的微博数据。
每一行为一条微博,以|**|连接每一个字段。第一列为用户ID,第二列为微博文本,第三列为情感标签,第四列如果存在,代表这条微博是转发微博,第四列为原微博的用户ID。
文件以UTF-8编码。
四类情感标签,0:愤怒,1:厌恶,2:高兴,3:低落。
数据样例:
1|**|我给自己贴了 心血管 标签。|**|2
1|**|用坚持不懈追求―― 中国介入心脏病学大会(CIT 2010)于2010年3月31日至4月3日在国家会议中心召开。http://sinaurl.cn/hm2hK|**|0
1|**|2010年3月31日~4月3日召开的中国介入心脏病学(CIT)大会上,葛均波教授公布了"FOCUS30天结果,FOCUS实验是一项针对Firebird 2TM 支架的安全性和有效性进行的前瞻性多中心注册的真实世界研究,Firebird 2TM 支架在30天观察中显示出了良好的有效性和安全性。我们将继续期待该产品的长期有效性和安全性。|**|3
1|**|4月3日,Marco Wainstein教授在CIT大会上针对炎症、冠心病及斑块稳定性方面进行了详尽的演讲,指出动脉粥样硬化这一全身性疾病,系统治疗的重要性.内皮素-1、CRP、CD40等均与斑块的稳定性相关,并且他们的研究表明这些因素与置入支架术后再狭窄相关,提示我们冠心病的二级预防及患者的健康教育非常重要。|**|3
1|**|循证医学评论专家组成立――鉴于目前很多临床试验的结果经常被片面的、有倾向性地解读,在中华医学会心血管病学分会主任委员胡大一教授和候任主任委员霍勇教授的倡导下,中华医学会心血管病学分会组织专家,于2010年3月30日晚召开电话工作会议,讨论成立临床试验与研究循证医学评论专家组的相关事宜。|**|1
1|**|我国心血管领域著名专家、CTO介入治疗领域顶级专家、沈阳军区总医院韩雅玲教授和北京安贞医院吕树铮教授,联合国内9家医院和日本丰桥心脏病医院的32位专家共同编写了《攻克CTO》专著。有专业人士认为,其将作为我国临床治疗策略的参考指南,并将进一步加快临床介入诊疗技术的推广普及与提高的步伐。|**|0
1|**|CIT 2010大会上,Spencer B. King教授发布了报告“ACC/AHA关于STEMI及PCI的治疗指南”。http://sinaurl.cn/huwYA|**
-----------------------------
有不少同学问起数据是干嘛的,怎么用,这里统一解释一下:
这套活跃用户微博数据一般在做用户特征、用户标签与微博内容的关联度、情感标签分布的调查统计分析方面用得到,之后可以根据统计分析对相关标签推荐服务提出改进建议,也常常被用到各种情感预测研究的时候。
比如以下几篇论文主题,都可以采用此数据:
what?
谢谢楼主的分享
好贵,还不知道怎么用?
楼主,这个是做什么用的
请教楼主,可以解释一下这个资料是用来学习检索方式的,还是用来使用数据的?数据没看懂有什么用,请问可以解释一下吗?
页:
[1]