Reto de Regresión Lineal con Python

En este reto compararemos la perdida (loss) de dos regresiones lineales diferentes usando Python. Asi que empecemos!

Tenemos tres puntos, (1, 5), (2, 1), y (3, 3). Estamos tratando de encontrar una línea recta que produzca las pérdidas (loss) más bajas.

Le hemos proporcionado la lista de los valores x, y los valores de y, para estos puntos.

x = [1, 2, 3]
y = [5, 1, 3]

m1 = 1
b1 = 0

1- Hallar los valores de y que la línea con m1 y b1 predeciría para los valores de x dados. Utilice la formula de la linea recta usando Python (le recomendamos usar un list comprenhension). Guárdelos en una lista llamada y_predicted1.

Ecuación de la línea recta:

Screenshot%20from%202020-12-19%2011-39-58.png

2- Usando la misma ecuación de la linea recta, y creándola por medio de un list comprenhension, hallar los valores de y que la línea m2 y b2 (dados a continuación) predeciría para los valores de x dados. Guárdelos en una lista llamada y_predicted2.

m2 = 0.5
b2 = 1

3- Crea una variable llamada total_loss1 y póngala en cero. Luego, encuentre la suma de las distancias al cuadrado entre los valores actuales de y y los valores de y_predicted1, haciendo un ciclo for a través de la lista y. Imprima finalmente la sumatoria de las diferencias.

Pasos sugeridos:

-- Calcule de la diferencia entre y e y_predicted1

-- Eleve al cuadrado la diferencia

-- Súmalo a total_loss1

4- Crea una variable llamada total_loss2 y póngala en cero. Luego, encuentre la suma de las distancias al cuadrado entre los valores actuales de y y los valores de y_predicted2, haciendo un ciclo for a través de la lista y. Imprima finalmente la sumatoria de las diferencias.

Pasos sugeridos:

-- Calcule de la diferencia entre y e y_predicted2

-- Eleve al cuadrado la diferencia

-- Súmalo a total_loss2

5- Imprima en la siguiente celda total_loss1 y total_loss2. De estas dos líneas, ¿cual usarías para modelar los puntos de una regresión lineal? Cual es tu análisis al respecto?

6- Cree una variable llamada better_fit y asígnela a a1 si la línea 1 encaja mejor con los datos y a2 si la línea 2 encaja mejor con los datos.