摘要:在我们的生产生活当中,统计发挥着重要作用。对应分析是统计数据的描述性分析方法,是重要的统计分析方法之一。本文围绕统计分析内容和对应分析方法进行分析,以供参考。
关键词:统计分析 对应分析 应用
一、前言
统计分析方法可以通过软件进行操作,spss是一种较为常见的软件,能够提供各种统计分析方法。
二、统计分析内容的分类
人类对客观事物的认识是多种多样的,这些认识可以是企业生产的规模,可以是企业生产机器的稳定性,可以是一个地区的教学质量,可以是市场经济的规律,也可以是一个时期的经济形势或环境等等。撇开这些形形色色的形式内容,人们对客观事物的认识从目的来看可分为表面认识和本质认识两种。本文将这种从形式内容中抽象出来的对客观事物的认识称之为统计分析内容。表面认识就是对客观事物表面特征的认识;本质认识是从客观事物表面特征出发,最终得到超越客观事物表面特征的本质特征的认识。同样,与统计分析内容相对应的统计分析(方法)就可分为表面分析和本质分析两种。在统计分析方法的使用上,形式内容的认识与统计分析方法的关联不大,反而是在统计分析内容认识(对客观事物表面认识和本质认识)上,分析方法的使用差别较大,因此本文主要从统计分析方法的角度对统计分析内容加以细分。
1、表面认识
表面认识是一种以认识具体客观事物表面特征为目的的认识。对具体客观事物表面特征的认识,从定量和定性两个角度出发,还可以分为事物描述认识和事物评价认识两种。
(1)事物描述认识。事物描述认识是指只对具体客观事物作纯粹的描述,而不加任何主观意见的认识,如集中趋势描述。从认识内容的复杂性来看,事物描述认识又可分为简单描述认识和综合描述认识。简单描述认识是对具体客观事物的一种现象(变量)特征的认识,如认识一群企业的规模。综合描述认识则是结合具体客观事物的很多现象(变量)对具体客观事物的特征加以认识,如认识事物在两个定类变量中交互分布等。综合描述不是简单描述的组合,而是简单描述的提升。
(2)事物评价认识。事物评价认识是指对具体客观事物的某种特征给出人为意见或判断的认识。评价分析通常给出定性结果,如判断两种产品某种性能的差异是否存在。按评价内容来分,评价分析主要包括事物成绩评价分析和事物间差异评价分析两种。事物成绩评价按评价所依赖的现象多寡还可分为简单评价和综合评价。
2、本质认识
本质认识是一种以认识普遍客观事物本质为目的的认识。本质认识仍以特定样本事物的数据为依据,但认识的结果已经远远超出样本事物的范围。撇开具体事物后,人类对事物本质的认识,则主要体现为对普遍事物的现象(变量)自身规律的认识和对普遍事物的现象(变量)间关系规律的认识。这两种认识还可以给他们一个更简单的名字,就是单现象本质认识和多现象关系认识,这也可以看作是本质认识按现象复杂性的划分。
三、对应分析的基本思想
对两个定性变量进行相关的分析时,因定性变量的数据是离散的,所以将两个变量的多种状态数据转换为列联表的形式进行处理。经数据转换形成的列联表是一个nxp的矩阵(第一个变量为n种状态,第二个变量为p种状态),对应分析也就是围绕着这个矩阵进行的。考虑将这个矩阵的行、列分别做降维处理,减少变量的状态,因子分析则是较好的降维方法。
在因子分析中根据研究对象的不同可以分为r型因子分析和q型因子分析,即对指标作因子分析和对样品作因子分析。由于r型因子分析和q型因子分析是反映一个整体的不同侧面,因此可能他们之间存在内在的联系。对应分析就是将两者结合起来进行统计分析,从r型因子分出发,直接获得q型因子分析的结果,将指标和样品分析的结果同时反映到相同坐标轴的一张二维图形上,对问题进行较为直观的分析。
四、分析内容与spss分析方法的关系
统计分析内容和spss分析方法的关系,表现为目的与手段的关系。相同的分析内容可以使用不同的分析方法,不同的分析内容,可以使用相同的分析手段。用同一种分析方法完成的分析,其分析内容属表面分析还是本质分析取决于你的认识目的。如独立样本t检验分析方法,可以用来分析一个班(校)中男女成绩差异是否显著,也可以用来分析性别变量对成绩变量
的影响是否显著。前者属表面分析,后者属本质分析。因为前者着眼的是一个班(校)的学生的成绩特征,后者着眼的是性别和成绩两种现象的关系。正因为本质认识着眼的是普遍现象的特征,因此要求样本量应足够大,显著性水平应足够高。对于表面认识,因为它认识的是样本特征,因此样本量大小与认识目的无关,显著性水平要求也可低些。
从二维图中可以看到,消费结构中的8个项目和17个地区分为4类。1.医疗保健、衣着类:辽宁、吉林、黑龙江、甘肃、青海、宁夏、新疆;2.食品、居住类:安徽、江西、湖北、重庆、四川、贵州;3.交通和通信、杂项商品和服务、教育文件娱乐服务类:北京、湖南;4.家庭设备用品及服务类:上海、广州。从这4类中大体可以得出以下结论,我国目前的消费结构和地域有较大的关联。当然以上结论较为直白,要想得出更理想的结论,还需对数据运用其他方法进行挖掘。不过,以上结论大体上得出了较为满意的探索性结果,也由此可看到对应分析在统计数据分析应用中的魅力。
六、统计分析中运用对应分析应注意问题
事实上,虽然对应分析有不少的优点,但在一些方面尚有缺憾,在运用时也需注意以下几点问题。
1、对应分析不能用于相关关系的假设检验。它虽然可能揭示变量间的联系,但它不能说明两个变量之间存在的联系是否显著。因而,在运用前要xz一检验两变量的相关性。
2、在对应分析中所做图形为了直观通常是二维的,这种做法是一种降维的方法,将原始的高维数据按一定规则投影到二维图形上,投影后的分类大多数情况与原始数据大体一致,但也可能与原始高维数据的分类有较大的差异情况存在。
3、对极端值敏感。在分析过程中,极端值(野点子)对对应分析的结果影响较大。在进行分析之前,要将列联表中的数据审视,避免极端值的存在。比如,列联表数据应正值,若有为零的数据,可视情况将相邻的两个状态合并。
七、结束语
综上所述,在统计分析当中,通过合理方法的应用能够大大简便运算过程,提高数据的准确性,为生产生活提供指导。
参考文献:
[1]王玉荣.统计数据分析软件的应用概述[j].数据管理,2012,11(3):5—6
[2]李明星,浅析统计分析方法与对应分析法的应用[j]统计之家,2013,24(20):11—12