请选择 进入手机版 | 继续访问电脑版

HOT 1751 SPSS数据分析、问卷分析案例模板——学历的影响因素研究(含数据下载)

[复制链接]
1751 1
Introduction

本研究的侧重点为被调研对象的最高学历的影响因素。根据现有的研究结果,被调研对象的最高学历受到父母的职业、家庭的经济状况以及自身的学习状况的影响。因此,对于本次的1970BCS70调研,提出以下假设:
Ha:最高学历与出生时的父母职业有着显著的相关关系
Hb:最高学历与自身学习状况有着显著的相关关系
Hc:最高学历与家庭经济状况有着显著的相关关系

Variables and methodology

[size=12.0000pt]1、data used and variables selected

   本研究的目的是考察父母的职业、家庭的经济状况以及自身的学习状况是否与最高学历相关。因此,选择父母的职业,本研究选择出生时父亲的职业(b0fsoc)、母亲的职业(b0msoc)作为反映职业状况的自变量;对于自身的学习状况,本研究选择10岁时Edinburgh Reading Test score(b10read)、10岁时Friendly Maths Test score(b10maths)作为反映自身学习状况的自变量;对于家庭经济状况,本文选择16岁时的家庭是否遭遇过经济危机(bifinhd)作为反映家庭经济状况的自变量。此外,最高学历选择highest academic qualification (b34hq5)作为因变量,为了便于研究,将原始调研的最高学历类别重新编码为两类,A以下和A以上。

Ha:最高学历与出生时的父母职业有着显著的相关关系

Ha1:出生时父亲的职业(b0fsoc)与被调研者的最高学历有相关关系(b34hq5)
Ha2:母亲的职业(b0msoc)与被调研者的最高学历有相关关系(b34hq5)

Hb:最高学历与自身学习状况有着显著的相关关系

Hb1:10岁时Edinburgh Reading Test score(b10read)与被调研者的最高学历有相关关系(b34hq5)
Hb2:10岁时Friendly Maths Test score(b10maths)与被调研者的最高学历(b34hq5)有相关关系

Hc:最高学历与家庭经济状况有着显著的相关关系

Hc:16岁时的家庭是否遭遇过经济危机(bifinhd)与被调研者的最高学历(b34hq5)有相关关系


[size=12.0000pt]2、Methodology
  对于本研究选择的六个变量,四个是分类变量,两个是连续数值型变量,对分类变量的描述性统计分析选用频率(frequency)分析及饼图(pie chart)等分析方法,并找到该变量的众数(mode);对于数值型变量,选择均值(mean)、标准差(Standard Deviation)、偏度(skewness)、峰度(kurtosis)以及直方图(Histogram)的等分析方法。
   对于假设Ha,最高学历和职业均为分类变量,因此研究二者之间的相关性选用卡方检验。对于假设Hb,尽管最高学历为二分类变量,而Edinburgh Reading Test score、Friendly Maths Test score是连续数值型变量,因此研究二者之间的相关性选用Pearson相关性分析。对于假设Hc,最高学历和家庭是否有经济危机均为分类变量,因此研究二者之间的相关性选用卡方检验。
   找到了与最高学历存在相关关系的因素之后,还需要研究这些因素对最高学历共同影响的结果,因为一个现象的发生必定是多个因素共同作用的结果。此时选择的统计学方法是二元Logistic回归分析。


Data analysis and result

[size=12.0000pt]1、descriptive statistic

1.1 父亲职业、母亲职业的描述性统计分析

父亲职业、母亲职业的描述性统计分析结果如下:

bcs70 age 0: social class at birth: fathers occupation  (a0014)

Frequency
Percent
Valid Percent
Valid
not working
824
4.4
4.8
Other category
502
2.7
2.9
V
1106
5.9
6.5
IV
2473
13.2
14.5
III manual
7544
40.3
44.1
III non-man
1924
10.3
11.3
II
1906
10.2
11.1
I
820
4.4
4.8
Total
17099
91.3
100.0

   从上表可以清晰看出,对于出生时的父亲的职业,占比最高的是III manual,占比达到40.3%;因此,父亲职业的众数(mode)为III manual。出生时父亲的职业分布状况如下图所示:




bcs70 age 0: social class at birth: mothers occupation (a0018)

Frequency
Percent
Valid Percent
Valid
not working
5104
27.2
32.5
Other category
108
.6
.7
V
211
1.1
1.3
IV
3276
17.5
20.9
III manual
841
4.5
5.4
III non-man
4682
25.0
29.8
I or II
1466
7.8
9.3
Total
15688
83.7
100.0

  从上表可以清晰看出,对于出生时的目前的职业,占比最高的是not working,占比达到27.2%;因此,母亲职业的众数(mode)为not working。出生时母亲的职业分布状况如下图所示:


1.2 Edinburgh Reading Test score、Friendly Maths Test score的描述性分析

Descriptives
[size=10.5000pt]
Statistic
Std. Error
bcs70 age 10: Edinburgh Reading Test score (i3003 to i3069)
Mean
40.25
.118
95% Confidence Interval for Mean
Lower Bound
40.02
[size=10.5000pt]
Upper Bound
40.48
[size=10.5000pt]
5% Trimmed Mean
40.63
[size=10.5000pt]
Median
41.00
[size=10.5000pt]
Variance
160.431
[size=10.5000pt]
Std. Deviation
12.666
[size=10.5000pt]
Minimum
0
[size=10.5000pt]
Maximum
65
[size=10.5000pt]
Range
65
[size=10.5000pt]
Interquartile Range
20
[size=10.5000pt]
Skewness
-.384
.023
Kurtosis
-.595
.045
bcs70 age 10: Friendly Maths Test score (i2504 to i2575)
Mean
43.96
.114
95% Confidence Interval for Mean
Lower Bound
43.74
[size=10.5000pt]
Upper Bound
44.18
[size=10.5000pt]
5% Trimmed Mean
44.22
[size=10.5000pt]
Median
44.00
[size=10.5000pt]
Variance
151.855
[size=10.5000pt]
Std. Deviation
12.323
[size=10.5000pt]
Minimum
1
[size=10.5000pt]
Maximum
72
[size=10.5000pt]
Range
71
[size=10.5000pt]
Interquartile Range
17
[size=10.5000pt]
Skewness
-.272
.023
Kurtosis
-.227
.045




   从以上的表格和图形可以清晰看出,Edinburgh Reading Test score的偏度为-0.384,并且在直方图中,右边高于正态曲线,由此可以知道,Edinburgh Reading Test score呈现出轻微的右偏态;Friendly Maths Test score的偏度为-0.272,偏度比较小,并且结合Friendly Maths Test score的直方图与正态曲线比较吻合,由此可以判断Friendly Maths Test score服从正态分布。

1.3 家庭经济状况及最高学历描述性分析


b34hq5new

Frequency
Valid Percent
Valid
before A-level
5529
57.2
after A-level
4095
42.4
Total
9665
100.0

从上图可以清晰看出,A前的人数占比为57.2%,由此可以知道,A前为众数,具体状况可以看以下的饼图:



bcs70 age 16: family troubled by financial hardship in last year (oe4.1)

Frequency
Valid Percent
Valid
no
7875
84.8
yes
1409
15.2
Total
9284
100.0

从上图可以清晰看出,no的人数占比为84.8%,由此可以知道,no为众数,具体状况可以看以下的饼图:




2、假设检验

   为了更加准确得出假设检验的结果,因此仅仅筛选出准确调研到最高学历的8854名个案的数据。

2.1 Ha假设检验

   对于假设 Ha:最高学历与出生时的父母职业有着显著的相关关系,首先检验Ha1:出生时父亲的职业(b0fsoc)与被调研者的最高学历有相关关系(b34hq5)结果如下:

Crosstab
Count

b34hq5new
Total
before A-level
after A-level
bcs70 age 0: social class at birth: fathers occupation  (a0014)
not working
202
85
287
Other category
127
121
248
V
350
86
436
IV
829
344
1173
III manual
2524
1426
3950
III non-man
547
615
1162
II
432
677
1109
I
88
401
489
Total
5099
3755
8854


Chi-Square Tests

Value
df
Asymp. Sig. (2-sided)
Pearson Chi-Square
785.992a
7
.000
Likelihood Ratio
807.320
7
.000
Linear-by-Linear Association
511.712
1
.000
N of Valid Cases
8854
a. 0 cells (0.0%) have expected count less than 5. The minimum expected count is 105.18.

   从以上的卡方检验结果可以清晰看出,Pearson Chi-Square=785.992,P=0.000<0.05,由此可以知道,A前和A后学历的被调研对象出生时父亲的职业存在显著差异。更进一步,由于职业和学历均为分类变量,因此研究二者之间的相关关系选用列联系数(Contingency Coefficient),计算的结果如下:

Symmetric Measures

Value
Approx. Sig.
Nominal by Nominal
Contingency Coefficient
.286
.000
N of Valid Cases
8854




从上表可以清晰看出,出生时父亲职业与最高学历之间的列联系数大小为0.286,并且通过了显著性水平为0.05的检验,P=0.000<0.05,由此可以最终确定,最高学历与父亲职业之间存在着显著的相关关系。


接下来进行假设Ha2的验证,验证的结果如下:

Crosstab
Count  

b34hq5new
Total
before A-level
after A-level
bcs70 age 0: social class at birth: mothers occupation (a0018)
not working
1588
1048
2636
Other category
18
32
50
V
51
19
70
IV
1138
454
1592
III manual
270
152
422
III non-man
1356
1204
2560
I or II
255
585
840
Total
4676
3494
8170

Chi-Square Tests

Value
df
Asymp. Sig. (2-sided)
Pearson Chi-Square
432.765a
6
.000
Likelihood Ratio
438.295
6
.000
Linear-by-Linear Association
115.990
1
.000
N of Valid Cases
8170


a. 0 cells (0.0%) have expected count less than 5. The minimum expected count is 21.38.

从以上的卡方检验结果可以清晰看出,Pearson Chi-Square=432.765,P=0.000<0.05,由此可以知道,A前和A后学历的被调研对象在出生时母亲的职业存在显著差异。更进一步,由于出生时母亲职业和学历均为分类变量,因此研究二者之间的相关关系选用列联系数(Contingency Coefficient),计算的结果如下:

Symmetric Measures

Value
Approx. Sig.
Nominal by Nominal
Contingency Coefficient
.224
.000
N of Valid Cases
8170



从上表可以清晰看出,出生时母亲职业与最高学历之间的列联系数大小为0.224,并且通过了显著性水平为0.05的检验,P=0.000<0.05,由此可以最终确定,最高学历与出生时母亲职业之间存在着显著的相关关系。



2.2 Hb假设检验

对于假设 Hb结果如下:


Correlations
b34hq5new
bcs70 age 10: Edinburgh Reading Test score (i3003 to i3069)
bcs70 age 10: Friendly Maths Test score (i2504 to i2575)
b34hq5new
Pearson Correlation
1
.404**
.404**
Sig. (2-tailed)
.000
.000
N
9624
7196
7199
**. Correlation is significant at the 0.01 level (2-tailed).


从上表的pearson相关性分析结果可以清晰看出,Edinburgh Reading Test score、Friendly Maths Test score与最高学历之间存在着显著的相关关系,显著性水平P全部小于0.05,更进一步Edinburgh Reading Test score、Friendly Maths Test score与最高学历之间的相关系数均为0.404>0,由此可以知道,最高学历与Edinburgh Reading Test score、Friendly Maths Test score之间呈显著出显著的正向相关关系,即Edinburgh Reading Test score、Friendly Maths Test score越高,最高学历越高。

2.3 Hc假设检验

假设Hc检验的结果如下:


bcs70 age 16: family troubled by financial hardship in last year (oe4.1) * b34hq5new Crosstabulation
Count  

b34hq5new
Total
before A-level
after A-level
bcs70 age 16: family troubled by financial hardship in last year (oe4.1)
no
2972
2547
5519
yes
570
254
824
Total
3542
2801
6343


Chi-Square Tests

Value
df
Asymp. Sig. (2-sided)
Exact Sig. (2-sided)
Exact Sig. (1-sided)
Pearson Chi-Square
68.279a
1
.000


Continuity Correctionb
67.659
1
.000


Likelihood Ratio
70.342
1
.000


Fisher's Exact Test



.000
.000
Linear-by-Linear Association
68.269
1
.000


N of Valid Cases
6343




a. 0 cells (0.0%) have expected count less than 5. The minimum expected count is 363.87.
b. Computed only for a 2x2 table

从以上的卡方检验结果可以清晰看出,Pearson Chi-Square=68.279,P=0.000<0.05,由此可以知道,A前和A后学历的被调研对象在是否经济家庭经济危机上存在显著差异。更进一步,由于是否经济家庭经济危机和学历均为分类变量,因此研究二者之间的相关关系选用列联系数(Contingency Coefficient),计算的结果如下:

Symmetric Measures

Value
Approx. Sig.
Nominal by Nominal
Contingency Coefficient
.103
.000
N of Valid Cases
6343


从上表可以清晰看出,是否经历家庭危机与最高学历之间的列联系数大小为0.103,并且通过了显著性水平为0.05的检验,P=0.000<0.05,由此可以最终确定,最高学历与是否经历家庭经济危机之间存在着显著的相关关系。

[size=12.0000pt]3、最高学历的影响因素分析

上一部分得出最高学历与出生时父亲、母亲、家庭经济危机、自身学习成绩之间全部存在着显著的相关关系。然而,最高学历必定是这几个因素共同作用的结果,因此本部分还需要继续进行最高学历的影响因素分析,分析的结果如下:

Categorical Variables Codings

Frequency
Parameter coding
(1)
(2)
(3)
(4)
(5)
(6)
(7)
bcs70 age 0: social class at birth: fathers occupation  (a0014)
not working
142
1.000
.000
.000
.000
.000
.000
.000
Other category
110
.000
1.000
.000
.000
.000
.000
.000
V
217
.000
.000
1.000
.000
.000
.000
.000
IV
562
.000
.000
.000
1.000
.000
.000
.000
III manual
2023
.000
.000
.000
.000
1.000
.000
.000
III non-man
647
.000
.000
.000
.000
.000
1.000
.000
II
591
.000
.000
.000
.000
.000
.000
1.000
I
237
.000
.000
.000
.000
.000
.000
.000
bcs70 age 0: social class at birth: mothers occupation (a0018)
not working
1411
1.000
.000
.000
.000
.000
.000

Other category
23
.000
1.000
.000
.000
.000
.000

V
39
.000
.000
1.000
.000
.000
.000

IV
894
.000
.000
.000
1.000
.000
.000

III manual
223
.000
.000
.000
.000
1.000
.000

III non-man
1460
.000
.000
.000
.000
.000
1.000

I or II
479
.000
.000
.000
.000
.000
.000




Variables in the Equation

B
S.E.
Wald
df
Sig.
Exp(B)
Step 1a
b10maths
.050
.004
127.609
1
.000
1.051
b10read
.041
.004
91.533
1
.000
1.042
b0msoc


36.518
6
.000

b0msoc(1)
-.606
.128
22.272
1
.000
.545
b0msoc(2)
.326
.530
.379
1
.538
1.386
b0msoc(3)
-.864
.413
4.372
1
.037
.421
b0msoc(4)
-.793
.142
31.158
1
.000
.453
b0msoc(5)
-.496
.190
6.836
1
.009
.609
b0msoc(6)
-.499
.127
15.363
1
.000
.607
b0fsoc


103.931
7
.000

b0fsoc(1)
-1.666
.285
34.143
1
.000
.189
b0fsoc(2)
-.951
.288
10.932
1
.001
.386
b0fsoc(3)
-2.046
.268
58.108
1
.000
.129
b0fsoc(4)
-1.619
.216
56.305
1
.000
.198
b0fsoc(5)
-1.399
.197
50.524
1
.000
.247
b0fsoc(6)
-1.073
.208
26.579
1
.000
.342
b0fsoc(7)
-.865
.210
16.871
1
.000
.421
b16finhd
-.367
.110
11.083
1
.001
.693
Constant
-2.533
.283
80.364
1
.000
.079
a. Variable(s) entered on step 1: b10maths, b10read, b0msoc, b0fsoc, b16finhd.

   从以上的回归分析结果可以清晰看出,b10maths、b10read、b16finhd能够显著影响最高学历,P值全部小于0.05;b10maths、b10read这两个个自变量的回归系数全部大于0,由此可以知道,b10maths、b10read越大,学历越高;b16finhd的回归系数为负数,说明那个经济家庭经济危机被调研对象最高学历显著低于没有经历家庭经济危机的被调研对象。此外,对于出生时父亲职业、母亲职业,仅仅只有Other category职业的母亲与I or II职业的母亲的被调研对象在最高学历上无差异,其余的出生时的母亲职业与父亲职业在最高学历上全部存在显著差异。

Conclusion

    从以上的分析可以最终得出,最高学历收到b10maths、b10read的正向影响,即b10maths、b10read的得分越高,学历就越高;同时,家庭经济状况也能够显著影响最高学历,16岁时经理过经济危机的被调研对象的最高学历显著低于没有经历过家庭经济危机的被调研对象;最后,出生时父亲、母亲的职业也能够非常显著地影响被调研对象的最高学历。


谦瑞数据www.databbs.net

为您提供一站式数据分析服务。

详询客服QQ(微信同号)370666643

关注谦瑞数据、杏花开医学统计微信公众号,赠送一大波数据分析实战视频教程哦!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册  

x

当他人从你分享的链接访问本页面时,你将获得奖励

举报 使用道具

回复

精彩评论1

玛瑙色时光 未绑定微信  金牌会员  发表于 2018-12-9 21:38:39 | 显示全部楼层
学习了!顶一下!照这个思路写自己的论文了!

举报 使用道具

回复 支持 反对
您需要登录后才可以回帖 登录 | 立即注册  

本版积分规则

悬赏提问(必答)

搜索

快速提问

悬赏提问(必答)

 
 
在线咨询
提供一站式
数据分析服务
客服QQ/微信号
370666643
微信扫一扫添加客服
快速回复 返回顶部 返回列表