- 在线时间
- 245 小时
- 最后登录
- 2017-4-12
- 注册时间
- 2014-12-13
- 听众数
- 41
- 收听数
- 0
- 能力
- 2147483637 分
- 体力
- 2147483647 点
- 威望
- 2147483646 点
- 阅读权限
- 255
- 积分
- 2147483647
- 相册
- 1
- 日志
- 0
- 记录
- 10
- 帖子
- 442
- 主题
- 343
- 精华
- 3
- 分享
- 0
- 好友
- 144
升级 0% TA的每日心情 | 擦汗 2015-7-24 10:40 |
---|
签到天数: 37 天 [LV.5]常住居民I
群组: MATLAB的工程数学应用 群组: SAS公益讲座 |
初级版 搜集数据
注册大量账号来抽奖
2011年,李德还在学校读书,微博抽奖活动多如牛毛。于是他写了个软件注册了几十万个新浪微博账号。(那时候还不要求实名制)。
然后他写了几个爬虫软件从搜狐微博上爬昵称用来更新新浪微博上的昵称,从大V的粉丝中爬他们的头像用来更新自己的微博头像,从笑话微博中爬微博内容来发到自己微博中。
然后用这几十万个微博账号去参与抽奖,一年获利了七万多元。读书那几年他承包了他们宿舍所有的水电费和他们班男生宵夜费用。
自己写程序招聘
创业公司对于招聘总是很头疼的。技术牛人熊节另辟蹊径。
他在为ThoughtWorks组建成都分公司团队的时候,发愁正统招聘方法太慢了。熊节觉得一个好的程序员应该读过那20本好书
——《重构》《精益创业》《敏捷软件开发》《测试驱动开发》等等。
于是,他花了几个晚上用自己高中自学的水货代码水平写了一个程序,去抓取豆瓣上读过这些技术书籍的人。然后不断递归,再抓到这些人都读过其它什么书,再继续抓读过那些书的人。
抓了几万人之后,他再用Hadoop来分析,筛选出了几十个技术大牛。把这些大牛的豆瓣账号扔给了公司女HR,让HR去一个个发豆邮勾搭。
进阶版 计算分析
用大数据技术找到爱情
美国波士顿数学家克里斯·麦金利注册一个婚恋网站后,认为他们的配对模式不合适,于是他自己写程序,只花了不到90天时间就在茫茫人海中找到了心仪的对象。
这位数学家开设了12个账户,利用计算机程序随意作答网站的配对问卷,从2万名用户中收集到600万条问题的答案,然后利用演算程序筛选出5000名住在美国的活跃用户,从中按性格分类又选出最符合择偶条件的两组女子。
用数据分析的方法教你如何获得一份美好的爱情
数据化爱情:男生追女生的超强数学建模分析
通过“大数据”科学的办法来坠入爱情吧
之后麦克金雷又创建了两个账号,诚实地回答这两类姑娘们最关注的500个问题。回答完问题后,他发现和自己匹配度在90%以上的超过10000人,最高匹配度达到了99%。
为了获得这些姑娘们的关注。麦克金雷编了一个新程序,自动访问与他匹配度高的对象,对方回访他的页面时,就会给他留言。然后再约出来见面,他最终成功在这些人中找到了另一半,这个姑娘和他的匹配度是91%。
高级版 改变社会
找到纽约最差的停车位
在纽约,停车难众所周知,而且纽约违章停车罚款很严格,纽约市的金融部门每年从罚单中收款约为6亿美元。
为了发现为什么有这么多的罚款,美国数据分析师本▪威零顿利用纽约市消防笼头的地图和政府公开的停车违规的罚单信息找出了纽约最容易吃到违章停车罚单的停车位。
他做出了一张前250个迟到最多违章停车罚单的消防栓位置图。
得出的结论是1、别在上东区停车,千万别停,因为不论在哪儿都会吃罚单。2、他找出了全纽约市最容易迟到违章停车罚单的两个消防栓的位置。都在上东区,每年能在罚单上创收5万5千多美金!
他认为这是很奇怪的一件事,5万5千多美金!为什么别人都会在那里犯错!所以他深入挖掘了一下原因,因为每一个消防栓有一个叫做扩展区域的地方可以用来走路,然后是一个停车位。所以司机开到这里来的时候认为“还有一段距离,这里没问题”,何况地上还有一个停车位。但纽约警察局不认可这个停车位,还是会给他们罚单。
他把这个情况反馈到自己的博客上,收到了交通部门很官方的回复,但是几周后,他发现这个停车位真的被重新画了。因为这个发现,将为很多市民们省下罚金。
|
zan
|