Bestimmung der Regressionsgeraden

Wenn zwischen den Merkmalen X und Y mit Hilfe des Korrelationskoeffizienten eine Abhängigkeit festgestellt wurde, dann besteht die nächste Aufgabe in der Ermittlung des funktionalen Zusammenhanges . Im einfachsten Falle der linearen Regression wird dabei vorausgesetzt, daß bei beliebigem, aber festem x-Wert die Zufallsgröße Y in der Grundgesamtheit normalverteilt ist mit dem Erwartungswert

E(Y) = a + bx (16.157)


und der von x unabhängigen Streuung . Die Beziehung (16.157) bedeutet, daß die Zufallsgröße Y im Mittel von dem festen x-Wert linear abhängt. Für die in der Regel unbekannten Parameter und der Grundgesamtheit werden mit Hilfe der Stichprobenwerte Näherungswerte nach der Fehlerquadratmethode bestimmt. Aus der Forderung
(16.158)

erhält man für und die Schätzwerte (Näherungswerte)

(16.159a)

mit

(16.159b)

und dem empirischen Korrelationskoeffizienten rxy gemäß (16.156b). Die Koeffizienten und nennt man Regressionskoeffizienten. Die Gerade heißt Regressionsgerade.