QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 11044|回复: 19
打印 上一主题 下一主题

我对华中A题的看法

[复制链接]
字体大小: 正常 放大
alexzhan 实名认证       

2

主题

3

听众

23

积分

升级  18.95%

该用户从未签到

自我介绍
我就是我
跳转到指定楼层
1#
发表于 2010-5-1 16:56 |只看该作者 |正序浏览
|招呼Ta 关注Ta
本来打算做苏北的题目,结果今天中午看到了华中A题。因为我对这方面比较熟悉,所以决定做这个题目,而且是我一个人来做。我组里另外的人做苏北。  看了一下午了,说说我的想法。
7 W" Z- d" `* ?# S* [; |9 L  这个题目虽然是数模题目,但是专业性还是比较强的。我数模做的题目不多,但是这方面的研究还可以。我做过数据挖掘的研究,也写过爬虫抓取网站内容。7 b2 b8 h( i" n4 v" k+ V/ X3 M; e
  本题末尾一句已经变动,其实如果不变动的话,歧义也不大。数据获取一定要到网站抓取,个人认为,还是写程序来获取比较好。以discuz7.2论坛模板为例(现在论坛大部分是用的开源的系统。phpwind,discuz等等,discuz用户最多),其实论坛模块都是比较固定的,url链接也是固定的,这就变成了垂直搜索,对于编写爬虫程序来说十分方便。5 h/ E" E: f2 }% i8 T3 l6 p$ S
  抓取过程中,跟帖数量是十分好确定的,精华贴数把url链接加上&filter=digest (还要相应做下变动),置顶时间是要看置顶持续时间,这个不好做,发贴数量直接抓取的到。然后对这些数据赋予一些权重,并加权,就可以确定言论领袖。
4 U5 N2 D& V1 j  话题用户的定位,看跟帖主题。谈论内同不好判断。
! V, r5 \* |$ O* u! Q6 T1 |  活跃用户要看在线时间以及参与话题数量,后者不好确定,自己想办法解决。+ V+ w) x+ {) Y2 F5 ~# V0 t  N" D
  关系圈的确定:在第二问的基础上做,也就是确定了话题用户之后,看用户经常讨论的话题的相同度或者相似度。
+ P& `, s+ s* @# l2 k; Q好了,先提供这些。我得赶快做了。想法肯定漏洞比较多,自己斟酌权衡。
zan
转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持5 反对反对0 微信微信

5

主题

9

听众

82

积分

升级  81.05%

  • TA的每日心情
    开心
    2015-10-28 22:24
  • 签到天数: 33 天

    [LV.5]常住居民I

    社区QQ达人

    群组2013认证赛A题讨论群组

    群组2013认证赛C题讨论群组

    群组华南理工大学

    回复

    使用道具 举报

    0

    主题

    4

    听众

    744

    积分

    升级  36%

  • TA的每日心情
    无聊
    2012-2-23 09:12
  • 签到天数: 108 天

    [LV.6]常住居民II

    回复

    使用道具 举报

    1

    主题

    2

    听众

    1025

    积分

    升级  2.5%

  • TA的每日心情
    奋斗
    2013-12-27 22:30
  • 签到天数: 218 天

    [LV.7]常住居民III

    回复

    使用道具 举报

    57

    主题

    5

    听众

    1031

    积分

    升级  3.1%

  • TA的每日心情
    郁闷
    2012-11-15 14:48
  • 签到天数: 120 天

    [LV.7]常住居民III

    自我介绍
    为人随和~~性格开朗,喜欢交友!!

    群组小草的客厅

    群组2011年第一期数学建模

    群组岩土力学与地下工程

    群组数学建模

    其实我一直觉得楼主的品味不错!呵呵!
      N& Q$ \) f2 A5 _  X% _我想我是一天也不能离开数学中国社区。
    8 n# Q" T* G3 e2 B( b
    回复

    使用道具 举报

    zhuwenwen 实名认证       

    0

    主题

    3

    听众

    31

    积分

    升级  27.37%

    该用户从未签到

    回复

    使用道具 举报

    zhuwenwen 实名认证       

    0

    主题

    3

    听众

    31

    积分

    升级  27.37%

    该用户从未签到

    回复

    使用道具 举报

    lovehaboy 实名认证       

    20

    主题

    5

    听众

    1123

    积分

  • TA的每日心情
    开心
    2012-3-11 16:11
  • 签到天数: 3 天

    [LV.2]偶尔看看I

    社区QQ达人 新人进步奖

    群组数模讨论——图论方面

    群组数学建模

    群组LINGO

    群组华中师范大学数学建模与应用协会

    群组南京邮电大学数模协会

    回复

    使用道具 举报

    yuanlili 实名认证       

    1

    主题

    7

    听众

    225

    积分

    升级  62.5%

    该用户从未签到

    自我介绍
    200 字节以内

    不支持自定义 Discuz! 代码

    群组Mathematica研究小组

    娘啊,数据库还要编程去获取啊,我以为这道题是让我们如何去识别用户,不是怎么去获取数据
    回复

    使用道具 举报

    5

    主题

    3

    听众

    212

    积分

    升级  56%

  • TA的每日心情
    开心
    2014-4-30 08:33
  • 签到天数: 17 天

    [LV.4]偶尔看看III

    自我介绍
    探索道路上前进的人

    新人进步奖

    群组学术交流A

    为什么你们都这么看重最后一句话?, _0 m8 T8 A3 @( B8 O" L9 @2 k
    数据获取是很重要,但是题目的意思应该是以识别为主的吧!
    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2026-4-17 03:01 , Processed in 0.641693 second(s), 105 queries .

    回顶部