La prueba de independencia de chi-cuadrado evalúa las conexiones entre variables categóricas. Como cualquier prueba de hipótesis analítica, la prueba de chi-cuadrado tiene tanto una hipótesis nula como una teoría alternativa.
Teoría nula: No existen relaciones entre las variables categóricas. Si reconoce el valor de una variable, no le ayuda a predecir el valor de una variable adicional.
Hipótesis alternativa: Hay conexiones entre las variables específicas. Reconocer el valor de una variable le ayuda a predecir el valor de otra variable.
La prueba Chi-cuadrado de autosuficiencia funciona contrastando la distribución que observa con la circulación que espera si no hay asociación entre las variables categóricas. La palabra “anticipado” equivale a lo que cabría esperar si la teoría nula se cumple en el contexto de Chi-cuadrado. Si su circulación observada es lo suficientemente diferente de la distribución anticipada (sin asociación), puede rechazar la teoría del vacío e inferir que las variables se relacionan.
Para una prueba de chi-cuadrado, un valor p que es menor o igual a su grado de valor indica que hay suficiente prueba en conclusión de que la circulación observada no es similar a la distribución anticipada. Puede terminar que existe una relación entre las variables categóricas.
La prueba se aplica cuando tiene dos variables específicas de una población solitaria. Se utiliza para determinar si existe una organización sustancial entre ambas variables.
Por ejemplo, en una encuesta electoral, los ciudadanos pueden clasificarse por sexo (hombre o mujer) y elección de elección (demócrata, político republicano o independiente). Podríamos emplear una prueba de chi-cuadrado para la independencia para averiguar si el sexo está relacionado con la decisión de preferencia. El número de ejemplo al final de la lección considera este ejemplo.
Índice de contenidos
Cuándo hacer uso de la prueba de independencia de chi-cuadrado
El procedimiento de prueba definido en esta lección es apropiado cuando se cumplen las condiciones de la lista siguiente:
La técnica de degustación es sencilla por muestreo aleatorio.
Las variables objeto del estudio de investigación son específicas.
Si los datos de muestra se presentan en una tabla de respaldo, la frecuencia esperada de cada celda es al menos 5.
Esta estrategia contiene cuatro pasos:
(1) enuncie las hipótesis,
(2) desarrollar un plan de evaluación,
(3) examinar la información de la muestra, y
(4) interpretar los resultados.
Exprese las hipótesis
Suponga que la variable A tiene r niveles, así como la variable B tiene c grados. La teoría del vacío establece que conocer el estado de la Variable A no ayuda a predecir el grado de la Variable B. Es decir, las variables son independientes.
Ho: Tanto la variable A como la variable B son independientes.
Decir ah: La variable A, así como la variable B, no son independientes.
La hipótesis diferente es que reconocer el grado de la Variable A puede ayudarlo a anticipar el nivel de la Variable B.
Nota: La ayuda para las diferentes teorías recomienda que las variables estén relacionadas, pero la relación no siempre es causal, en el sentido de que la variable “desencadena” las distintas otras.
Formular una estrategia de evaluación
La estrategia de análisis explica precisamente cómo utilizar información de ejemplo para aceptar o negar la teoría nula. El plan debe especificar la lista de elementos a continuación.
Grado de significación. A menudo, los científicos eligen grados de significancia iguales a 0.01, 0.05 o 0.10; pero puede usar cualquier valor entre 0 y 1.
Método de prueba. Utilice la prueba de chi-cuadrado de libertad para averiguar si existe una relación significativa entre dos variables categóricas.
Prueba de independencia de chi-cuadrado: analizar datos de muestra
Utilizando datos de ejemplo, localizando los grados de libertad, las frecuencias esperadas, la figura de prueba y el valor P relacionado con la figura de prueba. El enfoque explicado en esta área se muestra en el número de ejemplo al final de esta lección.
Grados de libertad. Los niveles de flexibilidad (DF) son iguales a:
DF = (r – 1) * (c – 1).
R es el número de grados de una variable categórica y c es el número de grados de las otras variables categóricas.
Regularidades esperadas. Los recuentos de regularidad esperados se calculan por separado para cada grado de una variable específica en cada grado de las otras variables categóricas. Computadora * c frecuencias anticipadas, de acuerdo con la siguiente fórmula.
Sala de emergencias, c = (nr * nc) / n.
Donde Er, c es la frecuencia anticipada para el nivel r de la Variable An y también el grado c de la Variable B, nr es la variedad completa de observaciones de muestra en el grado r de la Variable A. NC es el número completo de monitoreo de muestra en el nivel c de La variable B, así como la n, es la dimensión muestral total.
Figura de prueba. La cifra de prueba es una variable aleatoria de chi-cuadrado (Χ2) especificada por la siguiente fórmula.
Χ2 = Σ [( Or, c – Emergency room, c) 2/ Er, c]
Donde O, c es el recuento de frecuencias observadas en el grado r de la Variable An y el nivel c de la Variable B y Er, c es la materia de regularidad predicha en el nivel r de la Variable An, e incluso el grado c de la Variable B.
Valor p. El valor P es la posibilidad de observar una estadística de ejemplo tan grave como el hecho de la prueba. Teniendo en cuenta que la estadística de prueba es un chi-cuadrado, use la Calculadora de circulación de chi-cuadrado para evaluar la posibilidad relacionada con la figura de prueba.
Interpretar resultados
Si la búsqueda de muestras es poco probable, la hipótesis nula ofrece al científico que rechaza la hipótesis nula. Comúnmente, esto incluye contrastar el valor P con el nivel de importancia y negar la hipótesis nula cuando el valor P es menor que el nivel de relevancia.