知识点总结
本节主要包括随机抽样、用样本估计总体和变量间的相关关系等知识点。关键是理解和掌握变量间的相关关系等知识点。
一、抽样的方法
抽样一般分为简单随机抽样、系统抽样和分层抽样。
(一)简单随机抽样
随机抽样包括抽签法和随机数表法
1、抽签法
2、用随机数表法进行抽取
(二)系统抽样
(三)分层抽样
二、用样本估计总体
1、用样本估计总体的两个手段(用样本的频率分布估计总体的分布;用样本的数字特征估计总体的数字特征),需要从总体中抽取一个质量较高的样本,才能不会产生较大的估计偏差,且样本容量越大,估计的结果也就越精确,分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息。
2、频率分布是指一个样本数据在各个小范围内所占比例的大小。一般是用频率分布直方图反映样本频率分布。
3、样本的数字特征
众数:就是数据中出现次数最多的那个,比其他的都多,如果几个数据出现的次数都是最多,则它们都是众数;每个数据都只有一次,那么数据没有众数。所以众数可以不止一个或者没有。
中位数:就是这些数据排列好了以后中间的那个数字,那么如果有偶数个数据,那么就是中间两个数字的平均数,如果有奇数个数据,则中间那个就是数据的中位数。所以数据的中位数不一定在数据中。
平均数:这个就是把所有数据相加,除以个数,就是数据的平均数。
4、茎叶图
茎叶图又称“枝叶图”,它的思路是将数组中的数按位数进行比较,将数的大小基本不变或变化不大的位作为一个主干(茎),将变化大的位的数作为分枝(叶),列在主干的后面,这样就可以清楚地看到每个主干后面的几个数,每个数具体是多少。
当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出的叶子,因此通常把这样的图叫做茎叶图。
如上图,就是甲班和乙班10个同学的身高的茎叶图,你能读出它们吗?
三、变量间的相关关系
1、概念:自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫相关关系。
2、相关关系与函数关系的异同点。
相同点:两者均是指两个变量间的关系。
不同点:函数关系是一种确定关系,是一种因果系。如正方形的面积 和边长 的关系 就是一种函数关系。相关关系是一种非确定的关系,也不一定是因果关系。如产品的销售额与广告费的投入的关系。
3、散点图
表示具有相关关系的两个变量的一组数据的图形叫做散点图。
正相关:如果散点图中的点散布在从左小角到右上角的区域内,称为正相关。
负相关:如果散点图中的点散布在从左上角到右下角的区域内,称为负相关。
注:如果关于两个变量统计数据的散点图呈现发散状,则这两个变量之间不具有相关关系。