Come calcolare il coefficiente di regressione

Uno degli strumenti più basilari per l'ingegneria o l'analisi scientifica è la regressione lineare. Questa tecnica inizia con un set di dati in due variabili. La variabile indipendente è solitamente chiamata "x" e la variabile dipendente è solitamente chiamata "y". L'obiettivo della tecnica è identificare la linea, y = mx + b, che approssima il set di dati. Questa linea di tendenza può mostrare, graficamente e numericamente, le relazioni tra le variabili dipendenti e indipendenti. Da questa analisi di regressione viene calcolato anche un valore per la correlazione.

Identifica e separa i valori x e y dei tuoi punti dati. Se stai utilizzando un foglio di calcolo, inseriscili nelle colonne adiacenti. Dovrebbe esserci lo stesso numero di valori x e y. In caso contrario, il calcolo sarà impreciso o la funzione del foglio di calcolo restituirà un errore. x = (6, 5, 11, 7, 5, 4, 4) y = (2, 3, 9, 1, 8, 7, 5)

Calcola il valore medio per i valori x e y dividendo la somma di tutti i valori per il numero totale di valori nell'insieme. Queste medie saranno indicate come "x_avg" e y_avg." x_avg = (6 + 5 + 11 + 7 + 5 + 4 + 4) / 7 = 6 y_avg = (2 + 3 + 9 + 1 + 8 + 7 + 5) / 7 = 5

Crea due nuovi set di dati sottraendo il valore x_avg da ogni valore x e il valore y_avg da ogni valore y. x1 = (6 - 6, 5 - 6, 11 - 6, 7 - 6... ) x1 = (0, -1, 5, 1, -1, -2, -2) y1 = (2 - 5, 3 - 5, 9 - 5, 1 - 5,... ) y1 = (-3, -2, 4, -4, 3, 2, 0)

Moltiplica ogni valore x1 per ogni valore y1, in ordine. x1y1 = (0 * -3, -1 * -2, 5 * 4,... ) x1y1 = (0, 2, 20, -4, -3, -4, 0)

Piazza ogni valore x1. x1^2 = (0^2, 1^2, -5^2,... ) x1^2 = (0, 1, 25, 1, 1, 4, 4)

Calcola le somme dei valori x1y1 e x1^2. somma_x1y1 = 0 + 2 + 20 - 4 - 3 - 4 + 0 = 11 somma_x1^2 = 0 + 1+ 25 + 1 + 1 + 4 + 4 = 36

Dividi "sum_x1y1" per "sum_x1^2" per ottenere il coefficiente di regressione. somma_x1y1 / somma_x1^2 = 11 / 36 = 0,306

Cose di cui avrai bisogno

  • Software per fogli di calcolo (opzionale)
  • Calcolatrice

Suggerimenti

  • Per coloro che preferiscono lavorare direttamente con l'equazione, è m = sum[(x_i - x_avg)(y_i - y_avg)] / sum[(x_i - x_avg)^2].

    Molti fogli di calcolo avranno una varietà di funzioni di regressione lineare. In Microsoft Excel, puoi utilizzare la funzione "Slope" per prendere la media delle colonne x e y e il foglio di calcolo eseguirà automaticamente tutti i calcoli rimanenti.

  • Condividere
instagram viewer