利用Python进行调查问卷的信度检验和效度检验，并对量表进行因子分析

本文介绍: Py th on 语言实现问卷量表的信度检验，效度检验以及因子分析

关于问卷是否需要进行问卷信效度检验，前提时你的问卷含有量表题，量表题有两种量表：李克特量表和瑟斯顿量表，并且只有量表题才参与信效度检验。所以，信效度检验前需要对量表每一个选项的得分数据放到独立的一列数据中。如下图所示（Ex cel表）
Alt

我们说量表的信度是指量表测量结果的一致性、稳定性、也称为量表的可靠性。如果在相同条件下，运用某量表对某一个概念在不同时间上重复多次进行测量，其测量的结果保持不变，就表明该量表是可信的或具有可靠性。在SPSS中对信度的检验也叫可靠性检验，一般对预调查数据进行，用信度检验Cronb a ch’s a 系数来衡量，一般认为Cronb a ch’s a 系数大于等于0.6表面信度检验没有问题。这里我通过Py th on语言的方法去实现计算。

import pandas as pd
import pingouin as pg
zd_df = pd.read_excel('预调查量表题数据.xlsx',header = 0)

#Cronbach’s 系数
result = pg.cronbach_alpha(data = zd_df)
print(result)

量表的效度是指量表准确地反映客观事物属性和特征的程度，也称为有效性。市场调查中效度可以理解为调查结果准确地反映调查中所要说明问题的程度。如果一个量表即具有较高的信度，也具有较高的效度，则这个量表就具有较高的内在质量。
在检验中，我们通常通过两个方法来衡量效度分别为为Bart let t’s球状检验和KMO检验

检验总体变量的相关矩阵是否是单位阵；检验各个变量是否各自独立。如果不是单位矩阵，说明原变量之间存在相关性，可以进行因子分析；反之，原变量之间不存在相关性，数据不适合进行主成分分析。

chi_square_value, p_value = calculate_bartlett_sphericity(zd_df)
print("bartlett球状检验参数：n卡方值为：{}，p值为：{}".format(chi_square_value, p_value))

kmo_all, kmo_model = calculate_kmo(zd_df)
print("KMO检验参数：n", kmo_model)

import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
import matplotlib as mpl
from factor_analyzer import FactorAnalyzer
from factor_analyzer.factor_analyzer import calculate_kmo
from factor_analyzer.factor_analyzer import calculate_bartlett_sphericity
import scipy.cluster.hierarchy as shc



Load_Matrix = FactorAnalyzer(rotation=None, n_factors=len(zd_df.T), method='principal')
Load_Matrix.fit(zd_df)
f_contribution_var = Load_Matrix.get_factor_variance()
matrices_var = pd.DataFrame()
matrices_var["旋转前特征值"] = f_contribution_var[0]
matrices_var["旋转前方差贡献率"] = f_contribution_var[1]
matrices_var["旋转前方差累计贡献率"] = f_contribution_var[2]
matrices_var

#同样的数据绘制散点图和折线图
plt.scatter(range(1, zd_df.shape[1] + 1), featValue)
plt.plot(range(1, zd_df.shape[1] + 1), featValue)
 
plt.title("Scree Plot")
plt.xlabel("Factors")
plt.ylabel("Eigenvalue")
 
mpl.rcParams['font.sans-serif'] = ['SimHei']  # 指定默认字体
mpl.rcParams['axes.unicode_minus'] = False  # 解决保存图像是负号'-'显示为方块的问题
plt.grid()  # 显示网格
plt.show()  # 显示图形

#因子旋转
#选择方式：varimax 方差最大化
#选择固定因子为4
fa_four = FactorAnalyzer(3,rotation='varimax')
fa_four.fit(zd_df)
#查看每个变量的公因子方差数据
pd.DataFrame(fa_four.get_communalities(), index=zd_df.columns)
print("每个变量的公因子方差数据:n", pd.DataFrame(fa_four.get_communalities(), index=zd_df.columns))
 
#查看旋转后的特征值
pd.DataFrame(fa_four.get_eigenvalues())
print("旋转后的特征值:n", pd.DataFrame(fa_four.get_eigenvalues()))
 
#查看成分矩阵
#变量个数*因子个数
pd.DataFrame(fa_four.loadings_, index=zd_df.columns)
print("成分矩阵:n", pd.DataFrame(fa_four.loadings_, index=zd_df.columns))
 
#查看因子方差
fa_four.get_factor_variance()
print("因子方差：n", fa_four.get_factor_variance())

#隐藏变量可视化
df1 = pd.DataFrame(np.abs(fa_four.loadings_), index=zd_df.columns)
print("隐藏变量可视化：n", df1)

#绘图
plt.figure(figsize=(9, 9))
ax = sns.heatmap(df1, annot=True, cmap="BuPu")
#设置y轴字体大小
ax.yaxis.set_tick_params(labelsize=15)
plt.title("Factor Analysis", fontsize="xx-large")
# 设置y轴标签
plt.ylabel("Sepal Width", fontsize="xx-large")
# 显示图片
plt.show()

#由于采用较为合适的4个因子，可以将原始数据转换成4个新的特征
df2 = pd.DataFrame(fa_four.transform(zd_df))
print("转换后数据：n", df2)

显示所有内容

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

因子分析方差检验

Py th on 语言 实现信度、效度检验及探索性因子分析

信效度检验

1.信度检验

1.1 引入需要读入 文件的pandas库和计算Cronbach’s a 系数的ping ouin库，并读入 文件

1.2 计算Cronb ac h’s 系数

2.效度检验

2.1 Bart let t’s球状检验

2.2 KMO检验

因子 分析

1.导入所需要的库包

2.探索因子个数

2.1.矩阵旋转前特征值、旋转前方差贡献率、旋转前方差累计贡献率

2.2.画出碎石图,可视化将特征值和因子个数的变化绘制成图形。

2.3 建立因子分析模型 采用 方差 最大化因子旋转方式,并查看 每个变量的公因子方差、旋转后的特征值、成分矩阵和因子方差

2.4 可视化：热力图

发表回复取消回复

Python语言实现信度、效度检验及探索性因子分析

信效度检验

1.信度检验

1.1 引入需要读入文件的pandas库和计算Cronbach’s a 系数的pingouin库，并读入文件

1.2 计算Cronbach’s 系数

2.效度检验

2.1 Bartlett’s球状检验

2.2 KMO检验

1.导入所需要的库包

2.探索因子个数

2.1.矩阵旋转前特征值、旋转前方差贡献率、旋转前方差累计贡献率

2.2.画出碎石图,可视化 将特征值和因子个数的变化绘制成图形。

2.3 建立因子分析模型 采用方差最大化因子旋转方式,并查看每个变量的公因子方差、旋转后的特征值、成分矩阵和因子方差

2.4 可视化：热力图

相关文章

发表回复 取消回复

Py th on 语言实现信度、效度检验及探索性因子分析

1.1 引入需要读入文件的pandas库和计算Cronbach’s a 系数的ping ouin库，并读入文件

1.2 计算Cronb ac h’s 系数

2.1 Bart let t’s球状检验

2.2.画出碎石图,可视化将特征值和因子个数的变化绘制成图形。

2.3 建立因子分析模型采用方差最大化因子旋转方式,并查看每个变量的公因子方差、旋转后的特征值、成分矩阵和因子方差

发表回复取消回复