Modelado de la ecuación estructural

El modelado de la ecuación estructural (SEM) es una técnica estadística para probar y estimar relaciones causales usando una combinación de datos estadísticos y asunciones causales cualitativas. Esta definición de SEM fue articulada por el genetista Sewall Wright (1921), el economista Trygve Haavelmo (1943) y el científico cognoscitivo Herbert Simon (1953), y formalmente definida por la Perla de Judea (2000) utilización de un cálculo de counterfactuals.

Structural Equation Models (SEM) permiten tanto el modelado confirmatorio como exploratorio, suponiendo que convienen tanto a pruebas de la teoría como desarrollo de la teoría. El modelado confirmatorio por lo general comienza con una hipótesis que se representa en un modelo causal. Los conceptos usados en el modelo deben ser entonces operationalized para permitir probar de las relaciones entre los conceptos en el modelo. El modelo se prueba contra los datos de medida obtenidos para determinar cómo bien el modelo encaja los datos. Las asunciones causales introducidas en el modelo a menudo tienen implicaciones falsifiable que se pueden probar contra los datos.

Con una teoría inicial SEM se puede usar inductivamente especificando un modelo correspondiente y usando datos para estimar los valores de parámetros libres. A menudo la hipótesis inicial requiere el ajuste en la luz de pruebas modelas. Cuando SEM se usa puramente para la exploración, esto está por lo general en el contexto del análisis del factor exploratorio como en el diseño de psychometric.

Entre las fuerzas de SEM es la capacidad de construir variables latentes: las variables que no se miden directamente, pero se estiman en el modelo de varias variables mesuradas cada una de las cuales se predice para 'dar un toque en' las variables latentes. Esto permite que el modelador capture explícitamente la inconstancia de medida en el modelo, que en la teoría permite que las relaciones estructurales entre variables latentes exactamente se estimen. Análisis del factor, análisis del camino y regresión todos representan casos especiales de SEM.

En SEM, las asunciones causales cualitativas son representadas por las variables ausentes en cada ecuación, así como covariancias desaparecidas entre algunos errores residuales. Estas asunciones son verificables en estudios experimentales y se deben confirmar críticamente en estudios de observación.

Pasos en realización de análisis de SEM

Especificación modela

Cuando SEM se usa como una técnica confirmatoria, el modelo se debe especificar correctamente basado en el tipo de análisis que el investigador intenta confirmar. Construyendo el modelo correcto, el investigador usa dos diferentes tipos de variables, a saber exogenous y variables endógenas. La distinción entre estos dos tipos de variables es si la variable retrocede en otra variable o no. Como en la regresión la variable dependiente (DV) retrocede en la variable independiente (IV), significando que el DV está siendo predito por los IV. En la terminología SEM, otras variables retroceden en variables exogenous. Las variables de Exogenous se pueden reconocer en una versión gráfica del modelo, como las variables que envían saetillas, denotando qué variable predice. Una variable que retrocede en una variable siempre es una variable endógena, aun si esta misma variable también se usa como una variable para retrocederse en. Las variables endógenas se reconocen como los receptores de una saetilla en el modelo.

Es

importante notar que SEM es más general que la regresión. En particular una variable puede servir de la variable independiente como como dependiente.

Dos componentes principales de modelos se distinguen en SEM: el potencial de exposición del modelo estructural dependencias causales entre variables endógenas y exogenous y el modelo de medida exposición de las relaciones entre variables latentes y sus indicadores. Los modelos de análisis del factor exploratorios y Confirmatorios, por ejemplo, sólo contienen la parte de medida, mientras los diagramas del camino se pueden ver como un SEM que sólo tiene la parte estructural.

En la especificación de caminos en un modelo, el modelador puede postular dos tipos de relaciones: (1) los caminos libres, en los cuales supuso causal (de hecho contraactual) relaciones entre variables se prueban, y por lo tanto se dejan 'libres' de variar, y (2) relaciones entre variables que ya tienen una relación estimada, por lo general basada en estudios anteriores, que 'se fijan' en el modelo.

Un modelador a menudo especificará un juego de modelos teóricamente plausibles a fin de tasar si el modelo propuesto es el mejor del juego de modelos posibles. No sólo el modelador debe explicar las razones teóricas de construir el modelo como es, pero el modelador también debe tener en cuenta el número de funciones de datos y el número de parámetros que el modelo debe estimar para identificar el modelo. Un modelo identificado es un modelo donde un valor del parámetro específico únicamente identifica el modelo, y ninguna otra formulación equivalente puede dar un valor del parámetro diferente. Una función de datos es una variable con tanteos observados, como una variable que contiene tanteos en una pregunta o los demandados del número de veces compran un coche. El parámetro es el valor de interés, que podría ser un coeficiente de la regresión entre el exogenous y la variable endógena o la carga del factor (coeficiente de la regresión entre un indicador y su factor). Si hay menos funciones de datos que el número de parámetros estimados, el modelo que resulta es "no identificado", ya que hay demasiado pocos puntos de referencia para explicar todo el desacuerdo en el modelo. La solución es reprimir uno de los caminos al cero, el que significa que ya no es la parte del modelo.

Valoración de parámetros libres

La valoración del parámetro se hace comparando la covariancia actual matrices representación de las relaciones entre variables y la covariancia estimada matrices del mejor modelo de prueba. Esto se obtiene a través de la maximización numérica de un criterio adecuado conforme a la valoración de probabilidad máxima, cargó la menor parte de cuadrados o métodos asintóticamente sin distribuciones. Esto a menudo se lleva a cabo usando un programa de análisis SEM especializado del cual varios existen.

Evaluación de adecuado

La evaluación del adecuado es una tarea básica en el modelado de SEM: formación de la base para aceptar o rechazar modelos y, más por lo general, aceptando un modelo competidor sobre el otro. La salida de programas SEM incluye matrices de las relaciones estimadas entre variables en el modelo. La evaluación del adecuado esencialmente cuenta qué similar los datos preditos son a matrices que contiene las relaciones en los datos actuales.

Las pruebas estadísticas formales y los índices adecuados se han desarrollado con estos objetivos. Los parámetros individuales del modelo también se pueden examinar dentro del modelo estimado a fin de ver cómo bien el modelo propuesto encaja la teoría de conducción. Mayoría, aunque no todos, los métodos de la valoración hagan tales pruebas del modelo posibles.

Por supuesto como en todas las pruebas de la hipótesis estadísticas, las pruebas del modelo SEM están basadas poniendo por caso que los datos relevantes correctos y completos se hayan modelado. En la literatura SEM, la discusión del adecuado ha llevado a una variedad de recomendaciones diferentes en la aplicación precisa de varios índices adecuados y pruebas de la hipótesis.

Las medidas del adecuado se diferencian de varios modos. Los enfoques tradicionales al modelado comienzan de una hipótesis nula, provechosa más modelos tacaños (es decir aquellos con menos parámetros libres), a otros como AIC que se concentran cómo poco los valores empotrados se desvían de un modelo saturado (es decir cómo bien reproducen los valores mesurados), teniendo el número en cuenta de parámetros libres usados. Como las medidas diferentes de la captura adecuada los elementos diferentes del ataque del modelo, es adecuado relatar una selección de medidas adecuadas diferentes.

Algunas medidas más comúnmente usadas del adecuado incluyen:

Para cada medida del adecuado, una decisión en cuanto a lo que representa un bastante bien adecuado entre el modelo y los datos debe reflejar otros factores contextuales como el tamaño de la muestra (las muestras muy grandes hacen la prueba Chi-cuadriculada demasiado sensible, por ejemplo), la proporción de indicadores a factores y la complejidad total del modelo.

Modificación modela

El modelo tendría que modificarse a fin de mejorar el adecuado, así estimando las relaciones más probables entre variables. Muchos programas proporcionan índices de modificación que relatan la mejora del adecuado que resulta de añadir un camino adicional al modelo. Las modificaciones que mejoran el modelo adecuado se señalan entonces como cambios potenciales que se pueden hacer al modelo. Además de mejoras del modelo adecuado, es importante que las modificaciones también tengan el sentido teórico.

Tamaño de la muestra

Donde SEM propuesto es la base para una hipótesis de investigación, reglas básicas ad hoc que requieren que la elección de 10 observaciones por indicador en el ajuste de un con destino inferior a la suficiencia de tamaños de la muestras haya sido ampliamente usada desde su articulación original por Nunnally (1967). Siendo lineales en construcciones modelas, éstos son fáciles a calcular, pero se han encontrado causar tamaños de la muestras que son demasiado pequeños. Un estudio encontró que los tamaños de la muestras en una corriente particular de sólo el 50% hecho un promedio de la literatura SEM de las medidas mínimas tenían que sacar las conclusiones los estudios afirmados. En general, el 80% de los artículos de investigación en el estudio sacó conclusiones de muestras insuficientes. Las complejidades que aumentan demandas de información en el aumento de la valoración modelo estructural con el número de combinaciones potenciales de variables latentes; mientras la información suministró para aumentos de la valoración del número de tiempos de parámetros mesurados el número de observaciones en el tamaño de la muestra – ambos son no lineales. El tamaño de la muestra en SEM se puede calcular a través de dos métodos: el primer como una función de la proporción de variables del indicador a variables latentes y el segundo como una función de efecto mínimo, poder y significado. El software y los métodos para calcular a ambos han sido desarrollados por Westland (2010).

Interpretación y comunicación

El juego de modelos se interpreta entonces de modo que las reclamaciones sobre las construcciones se puedan hacer, basadas en el mejor modelo de prueba.

La precaución siempre se debería tomar haciendo reclamaciones de la causalidad aun cuando la experimentación o los estudios pedidos por el tiempo se han hecho. Se debe entender que el término modelo causal significa: "un modelo que comunica asunciones causales," no necesariamente un modelo que produce conclusiones causales validadas. El recogimiento de datos a puntos del tiempo múltiples y la utilización de un cuasi diseño experimental o experimental pueden ayudar a excluir ciertas hipótesis rivales pero hasta un experimento aleatorio no puede excluir todas tales amenazas para la inferencia causal. El buen ajuste por un modelo consecuente con una hipótesis causal invariablemente implica el igualmente buen ajuste por otro modelo consecuente con una hipótesis causal contraria. Ningún diseño de investigación, no importa cómo inteligente, puede ayudar a distinguir tales hipótesis rivales, excepto experimentos de interventional.

Como en cualquier ciencia, réplica subsecuente y quizás la modificación provendrá del descubrimiento inicial.

Usos avanzados

Véase también

Adelante lectura

Software SEM-específico

Enlaces externos



Buscar