网站首页 > 技术教程 正文
每次在写数据分析必学知识时,我都会提到,对于数据分析师来说,我们是必须学习统计学知识的,毕竟天天跟数据打交道,总不能连最基础的统计学知识都不会吧?
举个例子,数据分析,你如果连最起码的置信区间都不懂,你还怎么处理数据?如果统计学中最基本、核心的思想:用样本估计总体,你都没概念,就别说自己会数据分析了。
但多数人在学习统计学知识时会无比头疼,因为统计学的书籍里几乎都是复杂的推理公式,让人难以理解。其实,对于大部分数据分析师来说,我们并不需要掌握的那么细。
因此,我整理了一些你需要掌握的统计学知识,把统计学知识展开了说,让大家大致了解有哪几个模块知识,然后跟着这些模块知识去学习。
一、概率与概率分布
先要明确,统计学不研究统计,它研究的是不确定性!而不确定性事件唯一的量化标准就是概率,独立随机事件没法通过概率来预判何时发生,但却可以用概率来描述事件发生的可能性。
这一模块主要掌握
- 随机事件的概率
- 离散随机变量
- 连续随机变量的概率分布
二、数据的概括性度量
在数据人的实际工作中,你会经常遇到这种情况:业务人员/老板拿到一坨数据,丢在你面前,让你分析。这时,大多数人会不知所措,不知道从哪一步开始整理这些数据。这个时候,就需要通过概括性的度量指标,来帮我们从宏观上把握数据中的初步信息。
这一模块主要掌握
- 集中趋势的度量
- 离散程度的度量
- 分布形态的度量
三、回归分析
回归分析,因为它的易懂性,也因为它的实用性,但随着自己数据分析经验的积累,对回归分析的理解也越来越深,它不是简单的回归模型求解那么简单,它更是一种日常工作中解决问题的思路和方法论。
这一模块主要掌握
- 相关系数
- 回归分析
- 最小二乘法
- 显著性检验
四、统计量及其抽样分布
抽样,就是从研究的总体中抽取一部分个体作为我们真正的研究对象,称为样本,最后通过样本的结果来推测总体情况。
这一模块主要掌握
- 统计量的基本概念
- 常用统计量
- 正态分布
五、参数估计
参数估计,顾名思义就是对参数进行估计,那什么是参数呢?就是你假设分布的参数,也就是说你知道某个随机过程服从什么分布,但是不确定他的参数是什么,那怎么办?你采样,然后通过这些样本的值,去估计分布的参数就是参数估计。
这一章节,需要大家掌握几个核心概念:
- 参数
- 点估计
- 区间估计
我是“数据分析不是个事儿”,常年分享数据分析干货,不定期分享好用的职场技能工具,对数据分析感兴趣的话,可以点个关注。
- 上一篇: 一文读懂业务数据的分析思路
- 下一篇: 数据分析的意义以及方法总结
猜你喜欢
- 2024-12-04 统计—数据的分析
- 2024-12-04 数据分析方法
- 2024-12-04 写给产品经理:如何有效的做产品数据分析
- 2024-12-04 数据分析的意义以及方法总结
- 2024-12-04 一文读懂业务数据的分析思路
- 2024-12-04 来,带你一次性搞懂数据分析和数据挖掘
- 2024-12-04 数据分析是什么意思?
- 2024-12-04 什么是数据分析
你 发表评论:
欢迎- 08-06linux 和 windows文件格式互相转换
- 08-06谷歌 ChromeOS 已支持 7z、iso、tar 文件格式
- 08-06Linux下比较文件内容的6种方法
- 08-06文件格式及功能汇总
- 08-0610个Linux文件内容查看命令的实用示例
- 08-06Linux-如何区分不同文件类型
- 08-06Zabbix技术分享——监控windows进程资源使用情况
- 08-06Linux系统卡顿?学会ps命令这三招,轻松定位问题进程
- 最近发表
- 标签列表
-
- 下划线是什么 (87)
- 精美网站 (58)
- qq登录界面 (90)
- nginx 命令 (82)
- nginx .http (73)
- nginx lua (70)
- nginx 重定向 (68)
- Nginx超时 (65)
- nginx 监控 (57)
- odbc (59)
- rar密码破解工具 (62)
- annotation (71)
- 红黑树 (57)
- 智力题 (62)
- php空间申请 (61)
- 按键精灵 注册码 (69)
- 软件测试报告 (59)
- ntcreatefile (64)
- 闪动文字 (56)
- guid (66)
- abap (63)
- mpeg 2 (65)
- column (63)
- dreamweaver教程 (57)
- excel行列转换 (56)
本文暂时没有评论,来添加一个吧(●'◡'●)