R ajustada al cuadrado: aprendamos m谩s al respecto

<p style=”text-align: justify;”>Numerosas regresiones pueden ser un an谩lisis seductor y lleno de tentaciones. Es f谩cil agregar m谩s variables a medida que las piensa, o incluso si la informaci贸n es 煤til. Algunos de los predictores ser谩n significativos. Posiblemente haya una relaci贸n, 驴o es solo una coincidencia? Puede agregar polinomios de orden superior para doblar y girar esa l铆nea ajustada como desee. Sin embargo, 驴es adecuado para patrones simples o simplemente para conectar los puntos? Mientras tanto, el valor de la R cuadrado (R2) aumenta, te provoca y te incita a incluir a煤n m谩s variables. Aprendamos m谩s sobre r cuadrado ajustado.

Anteriormente, mostr茅 c贸mo R-cuadrado podr铆a desinformar cuando se eval煤a la bondad del ajuste para la evaluaci贸n de regresi贸n lineal. En este art铆culo, veremos por qu茅 debe hacer frente a la necesidad de agregar muchos predictores a una versi贸n de regresi贸n y c贸mo el R-cuadrado ajustado y el R-cuadrado anticipado podr铆an ayudar.

Índice de contenidos

Algunos problemas con r al cuadrado

En mi 煤ltima publicaci贸n, demostr茅 c贸mo R-cuadrado no pod铆a identificar si las cotizaciones y predicciones de precios del coeficiente est谩n sesgadas, por lo que debe examinar las historias residuales. No obstante, R-cuadrado tiene problemas adicionales que la R-cuadrada ajustada y la R-cuadrada anticipada est谩n dise帽adas para tratar.

Problema 1: Siempre que agrega un pronosticador a un dise帽o, la R al cuadrado aumenta, incluso si es solo como resultado de la casualidad. Nunca disminuye. En consecuencia, un dise帽o con incluso m谩s t茅rminos puede parecer que se ajusta mejor simplemente porque tiene m谩s t茅rminos.

Problema 2: Si un modelo tiene demasiados pronosticadores y polinomios de orden m谩s significativo, comienza a dise帽ar el ruido aleatorio de la informaci贸n. Este problema se conoce como sobreajuste del dise帽o, y tambi茅n genera valores de R cuadrado enga帽osamente altos y una capacidad disminuida para hacer pron贸sticos.

R ajustado al cuadrado

El R-cuadrado ajustado analiza el poder explicativo de los modelos de regresi贸n, que contienen diversas variedades de pronosticadores.

Tiene la intenci贸n de comparar un dise帽o de cinco predictores con un R cuadrado mayor con un plan de un predictor. 驴El modelo de cinco pronosticadores tiene un R cuadrado m谩s alto porque es mucho mejor? 驴O el R cuadrado es mayor ya que tiene m谩s pronosticadores? 隆Simplemente contrasta los valores ajustados de R cuadrado para descubrir!

El r cuadrado ajustado es una variaci贸n modificada de R cuadrado que se ha cambiado para el n煤mero de pronosticadores en la versi贸n. La R-cuadrada ajustada aumenta solo si el t茅rmino nuevo mejora el modelo m谩s de lo que seguramente se anticipar铆a por casualidad. Se reduce cuando un pronosticador mejora la versi贸n menos de lo esperado por casualidad. El R-cuadrado ajustado puede ser negativo, pero normalmente no lo es. Siempre es menor que el R cuadrado.

En el resultado optimizado de Regresi贸n de mejores subconjuntos que se muestra a continuaci贸n, puede ver d贸nde el R-cuadrado ajustado es 贸ptimo y luego disminuye. Mientras tanto, el R-cuadrado sigue aumentando.

Puede tener la intenci贸n de incluir solo tres predictores en esta versi贸n. En mi 煤ltimo sitio de blog, vimos c贸mo una versi贸n subespecificada (b谩sica) podr铆a producir estimaciones sesgadas. Posteriormente, no pretendes constar en el dise帽o de m谩s t茅rminos de los imprescindibles. (Lea una instancia del uso de la regresi贸n de mejores subconjuntos de Minitab).

Por 煤ltimo, el uso variado de la R-cuadrada ajustada proporciona una cotizaci贸n justa de la R-cuadrada de la poblaci贸n.

Acerca del R-cuadrado predicho

El R-cuadrado pronosticado indica qu茅 tan bien un modelo de regresi贸n predice retroalimentaciones para un monitoreo completamente nuevo. Esta cifra le ayuda a establecer cu谩ndo la versi贸n se ajusta a la informaci贸n original pero es mucho menor con la capacidad de ofrecer pron贸sticos v谩lidos para un monitoreo completamente nuevo. (Vea un ejemplo de uso de regresi贸n para hacer pron贸sticos).

La computadora de Minitab predijo r cuadrado eliminando sistem谩ticamente cada monitoreo del conjunto de informaci贸n, aproximando la ecuaci贸n de regresi贸n e identificando qu茅 tan bien la versi贸n indica la observaci贸n eliminada. Al igual que el R-cuadrado ajustado, el R-cuadrado predicho tambi茅n puede ser desfavorable, ya que siempre es menor que el R-cuadrado.

Incluso si no se prepara para hacer uso del dise帽o para las predicciones, el R-cuadrado predicho todav铆a ofrece detalles cr铆ticos.

Un beneficio clave de la r cuadrada anticipada es que puede evitar que se sobreajuste un dise帽o. Como se mencion贸 anteriormente, un dise帽o de sobreajuste consta de demasiados pronosticadores y tambi茅n comienza a dise帽ar el ruido aleatorio.

Debido a que es imposible anticipar el ruido aleatorio, el R-cuadrado predicho debe bajar para una versi贸n de sobreajuste. Si anticip贸 un R cuadrado mucho m谩s bajo que el R cuadrado de rutina, probablemente tenga demasiados t茅rminos en el modelo.

Ultimas palabras

Todos los datos tienen una cantidad completamente natural de irregularidades que es inexplicable. Lamentablemente, R-squared no aprecia este techo natural. Ir tras un valor alto de R cuadrado puede presionarnos para que consista en muchos predictores en un intento de describir lo inexplicable.

En estos casos, puede lograr un valor de R cuadrado m谩s alto, sin embargo, a costa de resultados enga帽osos, menor precisi贸n y menor capacidad para hacer predicciones.

La informaci贸n de suministro de R cuadrado ajustada y R cuadrada pronosticada le ayuda a evaluar la cantidad de predictores en su versi贸n:

Utilice el cuadrado R ajustado para contrastar versiones con diferentes n煤meros de pronosticadores.

Utilice el R-cuadrado anticipado para determinar qu茅 tan bien el dise帽o predice nuevas observaciones. Y si el modelo es complejo.

La evaluaci贸n de regresi贸n es s贸lida, 隆pero no desea atraer energ铆a y utilizarla imprudentemente!

Dejar un comentario