Comprensi贸n de la prueba de independencia de chi-cuadrado

<p style=”text-align: justify;”>La prueba de independencia de chi-cuadrado eval煤a las conexiones entre variables categ贸ricas. Como cualquier prueba de hip贸tesis anal铆tica, la prueba de chi-cuadrado tiene tanto una hip贸tesis nula como una teor铆a alternativa.

Teor铆a nula: No existen relaciones entre las variables categ贸ricas. Si reconoce el valor de una variable, no le ayuda a predecir el valor de una variable adicional.

Hip贸tesis alternativa: Hay conexiones entre las variables espec铆ficas. Reconocer el valor de una variable le ayuda a predecir el valor de otra variable.

La prueba Chi-cuadrado de autosuficiencia funciona contrastando la distribuci贸n que observa con la circulaci贸n que espera si no hay asociaci贸n entre las variables categ贸ricas. La palabra “anticipado” equivale a lo que cabr铆a esperar si la teor铆a nula se cumple en el contexto de Chi-cuadrado. Si su circulaci贸n observada es lo suficientemente diferente de la distribuci贸n anticipada (sin asociaci贸n), puede rechazar la teor铆a del vac铆o e inferir que las variables se relacionan.

Para una prueba de chi-cuadrado, un valor p que es menor o igual a su grado de valor indica que hay suficiente prueba en conclusi贸n de que la circulaci贸n observada no es similar a la distribuci贸n anticipada. Puede terminar que existe una relaci贸n entre las variables categ贸ricas.

La prueba se aplica cuando tiene dos variables espec铆ficas de una poblaci贸n solitaria. Se utiliza para determinar si existe una organizaci贸n sustancial entre ambas variables.

Por ejemplo, en una encuesta electoral, los ciudadanos pueden clasificarse por sexo (hombre o mujer) y elecci贸n de elecci贸n (dem贸crata, pol铆tico republicano o independiente). Podr铆amos emplear una prueba de chi-cuadrado para la independencia para averiguar si el sexo est谩 relacionado con la decisi贸n de preferencia. El n煤mero de ejemplo al final de la lecci贸n considera este ejemplo.

Índice de contenidos

Cu谩ndo hacer uso de la prueba de independencia de chi-cuadrado

El procedimiento de prueba definido en esta lecci贸n es apropiado cuando se cumplen las condiciones de la lista siguiente:

La t茅cnica de degustaci贸n es sencilla por muestreo aleatorio.

Las variables objeto del estudio de investigaci贸n son espec铆ficas.

Si los datos de muestra se presentan en una tabla de respaldo, la frecuencia esperada de cada celda es al menos 5.

Esta estrategia contiene cuatro pasos:

(1) enuncie las hip贸tesis,

(2) desarrollar un plan de evaluaci贸n,

(3) examinar la informaci贸n de la muestra, y

(4) interpretar los resultados.

Exprese las hip贸tesis

Suponga que la variable A tiene r niveles, as铆 como la variable B tiene c grados. La teor铆a del vac铆o establece que conocer el estado de la Variable A no ayuda a predecir el grado de la Variable B. Es decir, las variables son independientes.

Ho: Tanto la variable A como la variable B son independientes.

Decir ah: La variable A, as铆 como la variable B, no son independientes.

La hip贸tesis diferente es que reconocer el grado de la Variable A puede ayudarlo a anticipar el nivel de la Variable B.

Nota: La ayuda para las diferentes teor铆as recomienda que las variables est茅n relacionadas, pero la relaci贸n no siempre es causal, en el sentido de que la variable 鈥渄esencadena鈥 las distintas otras.

Formular una estrategia de evaluaci贸n

La estrategia de an谩lisis explica precisamente c贸mo utilizar informaci贸n de ejemplo para aceptar o negar la teor铆a nula. El plan debe especificar la lista de elementos a continuaci贸n.

Grado de significaci贸n. A menudo, los cient铆ficos eligen grados de significancia iguales a 0.01, 0.05 o 0.10; pero puede usar cualquier valor entre 0 y 1.

M茅todo de prueba. Utilice la prueba de chi-cuadrado de libertad para averiguar si existe una relaci贸n significativa entre dos variables categ贸ricas.

Prueba de independencia de chi-cuadrado: analizar datos de muestra

Utilizando datos de ejemplo, localizando los grados de libertad, las frecuencias esperadas, la figura de prueba y el valor P relacionado con la figura de prueba. El enfoque explicado en esta 谩rea se muestra en el n煤mero de ejemplo al final de esta lecci贸n.

Grados de libertad. Los niveles de flexibilidad (DF) son iguales a:

DF = (r – 1) * (c – 1).

R es el n煤mero de grados de una variable categ贸rica y c es el n煤mero de grados de las otras variables categ贸ricas.

Regularidades esperadas. Los recuentos de regularidad esperados se calculan por separado para cada grado de una variable espec铆fica en cada grado de las otras variables categ贸ricas. Computadora * c frecuencias anticipadas, de acuerdo con la siguiente f贸rmula.

Sala de emergencias, c = (nr * nc) / n.

Donde Er, c es la frecuencia anticipada para el nivel r de la Variable An y tambi茅n el grado c de la Variable B, nr es la variedad completa de observaciones de muestra en el grado r de la Variable A. NC es el n煤mero completo de monitoreo de muestra en el nivel c de La variable B, as铆 como la n, es la dimensi贸n muestral total.

Figura de prueba. La cifra de prueba es una variable aleatoria de chi-cuadrado (围2) especificada por la siguiente f贸rmula.

围2 = 危 [( Or, c 鈥 Emergency room, c) 2/ Er, c]

Donde O, c es el recuento de frecuencias observadas en el grado r de la Variable An y el nivel c de la Variable B y Er, c es la materia de regularidad predicha en el nivel r de la Variable An, e incluso el grado c de la Variable B.

Valor p. El valor P es la posibilidad de observar una estad铆stica de ejemplo tan grave como el hecho de la prueba. Teniendo en cuenta que la estad铆stica de prueba es un chi-cuadrado, use la Calculadora de circulaci贸n de chi-cuadrado para evaluar la posibilidad relacionada con la figura de prueba.

Interpretar resultados

Si la b煤squeda de muestras es poco probable, la hip贸tesis nula ofrece al cient铆fico que rechaza la hip贸tesis nula. Com煤nmente, esto incluye contrastar el valor P con el nivel de importancia y negar la hip贸tesis nula cuando el valor P es menor que el nivel de relevancia.

Dejar un comentario