数据分析师就业班在线直播课课程大纲 | ||
实际课程会根据课程安排作细节调整 | ||
【第一部分】EXCEL数据分析+My SQL数据库管理(10天60课时) | ||
EXCEL基础 | EXCEL基本操作 | 处理重复数据与不完整数据,处理格式错误数据 处理异常值和提取数据,数据转换,数据标准化,加权平均 |
函数基础 | 数学函数,文本函数,逻辑函数,查找定位函数,日期函数 统计函数,函数的嵌套使用 | |
基本图表 | 饼图,折线图,柱形图,条形图,散点图,气泡图,雷达图 面积图,组合图 | |
动态图表 | 控件基础,基本动态图表方法 | |
数据透视表 | 数据透视表基础,数据透视图基础,计算规则设定方法 切片器,数据透视表与切片器的组合应用 | |
EXCEL高级 | 杜邦分析仪制作 | 杜邦分析仪业务背景介绍及制作方法详解 |
Power Map | Power Map概述及使用方法,Power Map应用案例 | |
Power View | Power View概述及使用方法,Power View应用案例 | |
Power Query | Power Query概述,Power Query数据导入 Power Query功能介绍,横纵向合并数据,M公式介绍 | |
Power Pivot | Power Pivot概述,数据导入,功能介绍,搭建多维数据集 创建KPI,创建层次结构,Power Pivot使用案例 | |
My SQL基础 | 数据库简介 | My SQL与wordbench的安装与配置,数据库管理系统介绍 数据库管理系统主要功能及类型,My SQL简介 |
SQL语言 | 数据定义语言(DDL),数据操作语言(DML) 数据查询语言(DQL) | |
SELECT查询语句 | 单表查询,使用集合函数查询,连接查询,子查询 合并查询,使用正则表达式查询,时间函数查询 | |
存储过程 | 使用存储过程的意义Delimiter语句,调用存储过程 局部变量,用户变量,应用IN参数及OUT参数 流程控制,执行预处理语句 | |
My SQL案例 | 实际案例讲解和项目实战 | |
综合案例 | 实际案例讲解和项目实战 | |
【第二部分】统计理论+SPSS数据分析(10天60课时) | ||
统计基础 | 描述性统计 | 集中趋势,离散测度 |
统计量及其抽样分布 | 统计量,分布,样本均值的分布与中心极限定理 样本比例抽样分布,两个样本均值之差的抽样分布 关于样本方差的分布 | |
参数估计 | 一个总体参数的区间估计,两个总体参数的区间估计 估计量的求法,样本量的确定 | |
假设检验 | 假设检验,单样本T检验,配对样本T检验 两个独立样本T检验 | |
分类数据分析 | 分类数据与卡方统计量,拟合优度检验,列联分析 独立性检验,线性回归,列联分析相关测量 | |
SPSS案例 | SPSS基础 | 综合绩效案例讲解,SPSS软件综合特征,访问数据源 如何理解描述型数据 |
员工绩效管理 | 相关分析,方差分析,线性回归,模型构建流程 模型条件与调整 | |
信用行为特征 | Y的量化,哑变量变换,卡方分析,模型构建流程 Logistics模型在评分卡制作的应用 | |
降维在消费行为 中的应用 | X自变量的筛选,主成分分析的应用,主成分回归 缺省值填补 | |
用户行为画像 | 行列数据标准化,数据标签与统计量,细分与用户分组 客户细分评价与市场营销 | |
客户价值评分 | 客户价值理论,RFM指标量化,市场应用 数据离散化与客户价值细分,RFM模型有缺点 | |
购买行为组合与预测 | 商品或服务的组合问题,消费者的潜在行为与因子关系 回归分析的关系,常用解决类型的市场问题 | |
【第三部分】R基础编程+统计分析(6天36课时) | ||
R数据分析 | R基础知识 | 准备,数据对象,运算,读写 |
R基本语句结构 及循环 | 语句结构,创建循环函数 | |
R数据清洗 | 时间数据清洗 | |
文本对象处理 | 文本对象处理正则表达式 | |
R画图 | 基本绘图,图像格式Ggplot2,目前好用的扩展 | |
R统计分析 | 参数统计,假设检验 | |
【第四部分】R数据挖掘(15天90课时) | ||
R数据挖掘 | 数据挖掘模型 | 线性回归,逻辑回归,梯度下降,聚类,关联规则 主成分分析,因子分析,决策树,随机森林,神经网络 贝叶斯,支持向量机 |
【第五部分】数据分析应用案例及项目实战(10天60课时) | ||
行业案例 | 行业实际案例讲解和项目实战 | |
【第六部分】数据分析前言技术(15天90课时) | ||
Python基础 | Python基础知识 | Python语言特点,Python数据类,Python中的运算 Python数据结构,Python控制流语句 |
Python基础应用 | Python异常处理与调试,Python函数调用和定义及函数的参数 Python的类和面向对象编程,Python的文件及模块操作 | |
Python数据清洗 | Numpy基础 | Numpy的ndarray,数组的索引和切片,数组运算 常用的数组方法 |
Pandas基础应用 | Series数据结构,DataFrame数据结构,基本功能 汇总和计算统计描述,缺失值的处理 | |
Pandas数据规整 | 数据加载与输出,数据集的合并,数据集的重塑,数据结构 | |
Pandas分组运算 | GroupBy技术,数据聚合,分组级运算和转换 透视表和交叉表 | |
Python爬虫 | 网络爬虫 | 网络协议的简单介绍,网页数据结构介绍 使用BeautifulSoup4库解析网页,Selenium获取动态网页数据 |
Python机器人学习 | 文本挖掘原理和案例 | 新闻的文本分类 (TF-IDF准则,旅游新闻个性化推荐) |
预测分析核心算法 | 时间序列预测案例分析 | |
机器学习经典算法 | 垃圾短信或邮件识别与分类 | |
Python概率统计 | 概率图模型 | |
数据可视化 | Python数据可视化的方式 | |
Python金融分析 | 综合案例分析 | |
算法模型优化 | 交叉验证(CV) | |
模型精度评估和提升 | 机器学习的格点搜索与参数寻优 | |
特征选取的方法 | 分类预测 | |
最佳K-means分类数 | Python图片结构与分析(K-means聚类分析) | |
不平衡数据处理 | 分类预测 | |
XGBoost | 机器集成学习算法案例 | |
贝叶斯分析 | 朴素贝叶斯决策 | |
马尔科夫与蒙特卡罗 | Python随机模型模拟案例 | |
【第七部分】老师带着做项目(15天30课时) | ||
【第八部分】面试技巧答辩(6天30课时) |
数据分析师.jpg (39.21 KB, 下载次数: 760)
欢迎光临 数学建模社区-数学中国 (http://www.madio.net/) | Powered by Discuz! X2.5 |