Premium
Alternatives to least squares in multiple linear regression to predict production traits
Author(s) -
Bergmann J. A. G.,
Hohenboken W. D.
Publication year - 1995
Publication title -
journal of animal breeding and genetics
Language(s) - English
Resource type - Journals
SCImago Journal Rank - 0.689
H-Index - 51
eISSN - 1439-0388
pISSN - 0931-2668
DOI - 10.1111/j.1439-0388.1995.tb00536.x
Subject(s) - multicollinearity , variance inflation factor , statistics , mathematics , linear regression , regression analysis , regression , principal component regression , ridge , least trimmed squares , partial least squares regression , simple linear regression , geography , cartography
Summary The objectives of this study were to describe and compare the efficacy of least‐squares, ridge‐and principal‐components‐regression methodology for analysis of data for which multicollinearity existed among regressor variables. A data set composed of calfhood traits (regressor variables) and first‐progeny weaning weight (the dependent variable) of 771 Angus females was used. The statistics variance‐inflation factors, eigenvalues, condition numbers and variance proportions were used in diagnosing multicollinearity. Although biased, the regression‐coefficient estimates produced by ridge and principal components regression had smaller variances than estimates obtained from least squares. Between the two alternatives to least squares, ridge regression produced better results than principal‐components regression. Ridge and least‐squares regression produced similar regression‐coefficient estimates, prediction sum of squares (PRESS‐like) statistics and, to a lesser extent, conceptual predictive criteria (C p ‐like) statistics. For prediction, the performance of least‐squares and ridge‐regression models was very similar. Zusammenfassung Alternativen zu Minimum‐Quadrat bei multipler linearer Regression zur Voraussage von Leistungsmerkmalen Die Untersuchung bezieht auf Beschreibung und Vergleich der Wirksamkeit von Minimum‐Quadrat, Ridge und Hauptkomponentenregressionsmethodik zur Analyse von Daten mit Multicollinearität zwischen Regressorvariablen. Das Datenmaterial aus Kälberleistungen (Regressorvariable) und Absatzgewicht der ersten Nachkommen (abhängige Variable) von 771 Anguskühen wurde verwendet. Die statistischen Größen Varianz inflationsfaktoren, Eigenwerte, Bedingungszahl und Varianzverhältnisse wurden zur Diagnose der Multicollinearität verwendet. Obwohl verzerrt, haben die Regressionskoeffizientenschätzungen aus Ridge‐und Hauptkomponentenregression geringere Varianzen als Minimum‐Quadratschätzungen. Von den zwei Alternativen hat Ridge‐Regression bessere Resultate als Hauptkomponentenregression ergeben. Ridge und Miniumum‐Quadratregression haben ähnliche Regressionskoeffizienten ergeben, Schätzungsquadratsumme (PRESS‐ähnlich), Statistik und, in einem geringeren Ausmaß, Schätzungskriterien (C p ‐ähnliche)‐statistik. Im Hinblich auf Voraussage war die Leistung der Minimum‐Quadrat‐und Ridge‐Regressions‐Modelle sehr änlich.