QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 675|回复: 0
打印 上一主题 下一主题

大数据——海量数据处理的基本方法总结

[复制链接]
字体大小: 正常 放大

1158

主题

15

听众

1万

积分

  • TA的每日心情
    开心
    2023-7-31 10:17
  • 签到天数: 198 天

    [LV.7]常住居民III

    自我介绍
    数学中国浅夏
    跳转到指定楼层
    1#
    发表于 2023-7-5 12:05 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
    海量数据处理概述

    [color=var(--md-editor-text-color-active)]所谓海量数据处理,就是数据量太大,无法在较短时间内迅速解决,无法一次性装入内存。本文在前人的基础上总结一下解决此类问题的办法。那么有什么解决办法呢?
    时间复杂度方面,我们可以采用巧妙的算法搭配合适的数据结构,如Bloom filter/Hash/bit-map/堆/数据库或倒排索引/trie树。空间复杂度方面,分而治之/hash映射。

    [color=var(--md-editor-text-color-active)]海量数据处理的基本方法总结起来分为以下几种:

    • 分而治之/hash映射 + hash统计 + 堆/快速/归并排序;
    • 双层桶划分;
    • Bloom filter/Bitmap;
    • Trie树/数据库/倒排索引;
    • 外排序;
    • 分布式处理之Hadoop/Mapreduce。


    海量数据处理概述.doc

    58.13 KB, 下载次数: 0, 下载积分: 体力 -2 点

    售价: 2 点体力  [记录]  [购买]

    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2024-4-29 01:32 , Processed in 0.336320 second(s), 54 queries .

    回顶部