【www.fsgl168.com--教程】
一、 引言
1、 工作中的应用:例:暑期继续教育报名
2、 教育科研中的应用:例:教育调查数据处理
3、 加载“分析工具”P41
二、 Excel基本操作
1、公式输入
公式由由运算符号和运算量组成。
运算量:地址、常量、名字、函数、公式
运算符是对公式中的数据进行特定类型的运算。有算术运算符、比较运算符、文本运算符和引用运算符。
每个公式都必须以等号(=)开始。
2、引用
引用就是指引用某一地址指向的单元格的值。
相对单元格引用:(例如 A1)是基于包含公式和单元格引用的单元格的相对位置。
绝对单元格引用:(例如 $A$1)总是在指定位置引用单元格。
例0:
3、函数
Excel 2003包含许多预定义的公式,这些预定义的公式称为函数。它使用特定数值,按特定顺序进行计算。这特定数值称为参数,特定顺序称为语法。
Excel 2003的工作表函数有数据库函数、外部函数、工程函数、财务函数、信息函数、逻辑函数、查找和引用函数、统计函数、文本和数据函数、数学与三角函数、日期和时间函数等。
三、 数据统计
1、 频数统计:
对一组给定的数据和一组给定的分界点(或间隔),频数分布统计出每个间隔中出现多少个数据。Excel 用FREQUENCY统计频数分布。FREQUENCY函数的格式为:
FREQUENCY(数组,接受区间)
首先选定用于存放频数分布结果的相邻单元格区域,然后以数组公式的形式输入函数FREQUENCY。返回的结果比接受区间数要多一个。
例1:计算语文成绩的频数分布。P44
1.在单元格D3:D6分别输入60、70、80、90作为频数分布的分界点。
2.选定单元格区域E3:E7,放置统计结果。
3.输入频数分布公式:= FREQUENCY(B2:B11,D3:D6)。
按【CTRL】+【SHIFT】+【ENTER】组合键,得到结果如图D3:E7所示。
2、 描述统计量:
对已获得的数据进行整理、概括,显现其分布特征的统计方法,称为描述统计。
利用描述统计工具,为一组或多组输入数值提供一张描述统计表,它包括:平均值、标准误差(相对于平均值)、中位数、众数、标准差、方差、峰值、偏斜度、区域(全距)、最小值、最大值、总和、总个数、第k个最大值、第k个最小值和置信度等十多个统计量。
例2:计算语文和数学的描述统计量。P55
四、 统计图表
统计图是用来表达统计指标与被说明的事物之间数量关系的图形。
创建图表步骤:
1、 建立工作表:输入数据
2、 创建图表:制作图表
3、 编辑图表:修改图表类型、修改(添加)图表数据
4、 打印图表
例3:制作不同地区的小学教师职称统计图 P75
五、 数据库统计
1、 数据库的建立
2、 数据清单 P95
数据清单:就是工作表上包含相关数据的一系列数据行。
记录单:用于数据清单中记录的查看、查询、编辑、添加、删除等。
例4:
3、 数据排序 P97
数据排序:指按照某种规律改变工作表或数据清单中数据的排列顺序。
例4:
4、 数据筛选
筛选是查找和处理区域中数据子集的快捷方法。筛选区域仅显示满足条件的行,该条件由用户针对某列指定。
●自动筛选,包括按选定内容筛选,它适用于简单条件。P99
方法:数据/筛选/自动筛选
自动筛选选项
升序排列:按升序排列
降序排列:按降序排列
全部:显示所有行
前10个...:显示在由数据项或百分比指点的上限或下限范围内的所有数据行。
自定义使用当前列中的两个条件值,或者其他比较运算符,而不是“与” 运算符(默认运算符)
空白:只显示此列中含有空白单元格的数据行
非空白:只显示此列中含有数据的数据行
例4:
●高级筛选,适用于复杂条件。P101
高级筛选需要在工作表上单独设置一个放置筛选条件的条件区域。条件区域一般放在整个数据清单的下方。
条件区域的格式为:第一行为列标题(与数据清单列标题相同),第二行及以下各行为条件值,其中同一行条件间的关系为“与”关系,不同行的条件间的关系为“或”关系。
例5:把数学组的男教师且年龄30年及以上的记录筛选出来。
1.将列标志复制到单元格区域A25:G25,并在C26输入“男”,在D26输入“>=30”,在E26输入“数学”,建立条件区域A25:G26。
2.选择【数据】│【筛选】│【高级筛选】命令,显示“高级筛选”对话框。
3.在“方式”中,选定“将筛选结果复制到其他位置”;在“列表区域”输入A2:G21;在“条件区域”输入A25:G26;在“复制到”输入A28。
4.选中“不选重复的记录”复选框。
5.单击【确定】,筛选结果如图所示。
5、 分类汇总
分类汇总是将数据清单中字段相同的一些记录合并为一组,对于每组记录按列进行求和、计算平均值等汇总。
简单分类汇总:按照某一个字段为分类标准进行汇总。P109
多级分类汇总:按照多个字段为分类标准进行汇总。关键是正确的分类汇总排序.P111
例4:用分类汇总方法计算各教研组教师的平均年龄和教龄。
1. 对需要分类汇总的字段“教研组”进行排序。选中单元格E1,单击【降序排列】按钮。
2. 选定数据区域中的任一单元格,选择【数据】│【分类汇总】命令,显示“分类汇总”对话框。
3. 单击“分类字段”框的下拉箭头,选中“教研组”为分类字段;单击“汇总方式”框的下拉箭头,选中“平均值”汇总方式;在“选定汇总项”列表框中,选定“年龄”、“教龄”复选框。
4. 根据需要指定汇总结果显示的位置。
●替换当前分类汇总:表示按本次分类汇总要求汇总。
●每组数据分页:表示每一类按分页显示。
●汇总结果显示在数据下方:表示将分类汇总数放在本类的最后一行。
5. 本例选中第一、第二项。
6. 单击【确定】,得到如图所示的结果。
6、 数据透视表(图)
数据透视表:对大量数据快速汇总和建立交叉列表的交互式表格。P112
数据透视图:以图形形式表示数据透视表中的数据。P116
例6:
六、 假使检验
假设检验是利用样本信息,根据一定概率,对总体参数或分布的某一假设作出拒绝或保留的决断。
假设检验一般有两个相互对立的假设,即零假设和备择假设。零假设就是关于当前样本所属的总体与假设总体无区别的假设,它往往是研究者根据样本信息期待拒绝的假设,一般用表示。备择假设是与零假设相互排斥的假设,是关于当前样本所属的总体与假设总体相反的假设,是研究者根据样本信息期待证实的假设,一般用表示。
假设检验一般包括以下步骤:
1.依据实际问题作出零假设 和备择假设 。
2.选择合适的检验统计量,并计算统计量。
3.确定检验形式。
4.作出统计决断。
假设检验的形式有双侧检验与单侧检验。当我们对所研究的问题有一定的把握,或研究课题已有一定的资料为依据时,可以采用单侧检验;当我们对所研究的问题缺乏认识或没有把握时,应该采用双侧检验。
Excel在分析工具中提供以下假设检验工具:
t-检验:平均值的成对二样本分析
t-检验:双样本等方差假设
t-检验:双样本异方差假设
Z检验:双样本平均差检验
F-检验 双样本方差
另外提供了 检验函数:CHITEST函数
方法:工具/数据分析/选择假设检验工具/输入参数
参数:
输入选项:
●变量 1 的区域:在此输入需要分析的第一个数据区域的单元格引用。
●变量 2 的区域:在此输入需要分析的第二个数据区域的单元格引用。
●假设平均差:在此输入样本平均值的差值。0(零)值表示假设样本平均值相同。
●标志:如果输入区域的第一行或第一列中包含标志,请选中此复选框。
●α(置信度):在此输入检验的置信度。该值必须介于 0 到 1 之间。
输出选项:
●输出区域:在此输入对输出表左上角单元格的引用。
●新工作表组:单击此选项可在当前工作簿中插入新工作表,并由新工作表的 A1 单元格开始粘贴计算结果。
●新工作簿:单击此选项可创建一新工作簿,并在新工作簿的新工作表中粘贴计算结果。
例7:独立小样本平均数差异的t检验。P130
从高一年级随机抽取两个小组,在数学教学中实验组采用启发式,对照组采用讲授式,实验后统一测验结果如图6-8中B、C两列所示。问两种教学方法是否有显着性差异?(根据已有经验确知启发式优于讲授式)
计算统计量:
1.在单元格A1:B11和C1:C10分别输入原始数据。
2.单击【工具】│【数据分析】,选定“t-检验:双样本等方差假设”。
3.单击【确定】,显示“t-检验:双样本等方差假设”对话框。
4.在“输入变量1的区域”输入B1:B11。
5.在“输入变量2的区域”输入C1:C10。
6.在“假设平均差”方框中输入0,即两样本平均数相等。
7.选中“标志”复选框。
8.在置信度“α”方框内输入0.01。
9.选定“输出区域”并输入E1。单击【确定】。
七、 相关分析
两个变量之间不精确、不稳定的变化关系称为相关关系。研究两个或两个以上变量之间是否存在相关分析,如果存在相关关系,其相关的性质(方向)和程度如何,这个过程称为相关分析。
用来描述两个变量相互之间变化方向及密切程度的数字特征量称为相关系数,一般用表示。相关系数的数值范围是-1≤ ≤1。的正、负号表明两个变量之间的变化的方向;的绝对值的大小,表明两个变量之间的密切程度。
1、 积差相关:当两个变量都是正态连续变量,且两者之间呈线性相关,表示这两个变量之间的相关称为积差相关。
● CORREL相关系数 P151
格式:CORREL(数组1,数组2)
参数:数组1:第一组数值单元格区域。数组2:第二组数值单元格区域。
● PEARSON相关系数 P152
格式:PEARSON(数组1,数组2)
参数:数组1:为自变量集合。数组2:为因变量集合。
● 相关矩阵 P152
方法:工具/数据分析/相关系数
例8:计算数学、物理、化学的相关系数
2、 等级相关:指以等级次序排列或以等级次序表示的变量之间的相关。
斯皮尔曼等级相关、肯德尔和谐系数
3、 质与量的相关:指一个变量为质,另一个变量为量,这两个变量之间的相关。
二列相关、点二列相关
4、 偏相关(纯相关):是研究在消除第三变量(或其他多个变量)影响后的两变量间相关程度的方法。
八、 统计分析方法的选择
1、初步筛选
可根据研究中的实际条件,参照表1进行初步的筛选。
例1:我们在某校一个班级中开展一项识字的教改实验,期末进行一次测试,并对测试所得数据进行统计分析,从而了解该班学生的成绩及其分布。此时,我们要解决的问题是:描述数据的分布情况;变量的数量是1;变量的性质是等距或等比;可供选择的统计方法就是平均数和标准差。
例2:6名五年级学生的数学学习成绩(X)与参与课堂学习活动态度(Y)的关系如下表所示。问:五年级学生的数学学习成绩与参与课堂学习活动态度之间是否存在相关的联系?
此时,我们要解决的问题是:学生的数学成绩与参与课堂学习活动态度之间的关系;变量是两个,即:学生的成绩、参与课堂学习的态度;变量的性质是连续的;可选择的统计方法是积差相关。
例3:例2实际上是检验一下五年级学生的数学成绩与参与课堂学习活动态度之间是否存在相关,在此,我们要解决的问题是:检验差异的显着性;变量是两个;因变量是连续的;因此可选择的统计方法是t检验。
例4:如果例2中五年级学生的数学成绩与参与课堂学习活动的态度之间存在显着的相关性,那么是否可以根据五年级学生的数学成绩来预测学生参与课堂学习活动的态度?或者根据学生参与课堂学习活动的态度来预测学生的数学成绩?这里,我们要解决的问题是:统计预测;变量是两个;因变量是等距的;所以我们可以选用的统计方法是回归分析。
2、最终决策
(一)统计检验方法的选择决策
[注] IV=自变量;DV=因变量。
(二)相关技术的选择决策
九、 Excel使用小技巧
转置、分页标题显示(打印)
十、