统计基础知识
首先我们要知道,什么是统计?统计又是一门什么样的学科?
从百度百科里的解释来看:统计包括三个含义:统计工作、统计资料和统计科学。统计工作、统计资料、统计科学三者之间的关系是:统计工作的成果是统计资料,统计资料和统计科学的基础是统计工作,统计科学既是统计工作经验的理论概括,又是指导统计工作的原理、原则和方法。原始的统计工作即人们收集数据的原始形态已经有几千年的历史,而它作为一门科学,是从17世纪开始。英语中统计学家和统计员是同一个单词,但统计学并不是直接产生于统计工作的经验总结。每一门科学都有其建立、发展和客观条件,统计科学则是统计工作经验、社会经济理论、计量经济方法融合、提炼、发展而来的一种边缘性学科。
但千万不能认为统计就是汇总。
简单来理解,统计是一门通过“收集数据”,进而对所收集的数据进行“处理及分析”,最终达到“解释数据”并从数据中“得出结论”的学科。
统计学中,描述统计和推断统计是最重要的也是最基础的两种方法。
什么叫描述统计呢?描述统计就是直接对总体进行的描述,重点就是描述一组数据的特征。
例如下图,我们用折线图进行描述某一天不同时间气温变化:
再举个例子,对于公交分担率调查中的出行方式的描述统计,如下图:
什么叫推断统计呢?推断统计就是通过对样本的研究推断出总体特征结论的统计方法。特别在于现实社会的各种研究中,我们所获得的数据主要是样本数据,所以,推断统计在现代的统计学中的地位和作用越来越重要。
例如:我们要对整个南沙政务服务的满意度做研究分析,不可能对所有的办理过业务的人员都进行调查。我们就通过一定的比例样本进行调研分析得出总体的满意度。
再例如我们对某个品牌商品的使用满意度进行研究分析,也不可能对每一个购买者的特征进行调研分析。
对于以上的分析,就需要抽取样本,对样本进行测量研究分析信息特征,然后根据获得的结论对总体特征进行推断。这就是推断统计要解决的问题。
在推断统计中,可以细分为参数估计和假设检验,相关与回归分析,方差分析。
(1)、提到参数估计,指的一定是对于总体指标的估计。举个例子,例如调查某公司的灯泡总体平均寿命是多少,我们就要对总体进行抽样:
(2)、关于假设检验的原理,一种是小概率事件,另外一种就是反证法。什么叫小概率事件呢,最简单的理解就是买福利彩票中特等奖,这就是小概率事件。另一种就是凤凰男逆袭迎娶白富美走上人生颠峰,这也是小概率事件的代表。
关于反证法的思想就是先提出某种假设,再用适当的统计方法去确定假设成立的可能性大小,如可能性小,则认为假设不成立。
另外,在假设检验里,我们需要先对总体做一个假设检验,如果我们在对样本的研究中,有95%以上的把握证明原假设是假的,那么就可以否定原假设,在统计学里叫拒绝原假设。
(3)、什么时候用相关或回归分析呢?假如变量之间存在因果关系,我们就用回归分析确定他们之间的关系。例如我们要判断借1万块钱给隔壁老王,一个月后老王会不会按约定还钱呢?这个时候我们就可以用回归分析在不同维度下对老王的还款能力及是否会约定还款的诚信进行分析。
对于相关分析一般用于变量之间不区分原因和结果,属于平行关系,那这个时候要确定两个变量之间的关系,就采用相关分析。
例如我们在南沙政务满意度分析中,一级指标与二级指标的满意度之间就是平行关系而非因果关系,这两组指标之间不区分原因和结果。如下图:
(4)、方差分析也是研究变量之间关系的分析方法,具体来说它是为了找出影响事物变化最显著的那个因素。最典型也最容易理解的例如学生的考试成绩,影响学生的成绩的因素非常多,例如智力,性别,考场发挥等等各种因素。而找出对成绩影响变化最显著的因素就可以采用方差分析。
综上所述,参数估计和假设检验都是属于一元统计,目的是推断总体的某个变量,变量只涉及到一个。而回归分析、相关分析以及方差分析属于多元统计,目的是研究多个变量之间的关系,涉及到两个或两个以上的变量。
以上是统计方面的总体概念简述,之后会对以上概念进行更详细的理解分析。