Premium
Effect and treatment of misclassified samples in linkage analysis *
Author(s) -
Simianer H.,
Wild V.
Publication year - 1995
Publication title -
journal of animal breeding and genetics
Language(s) - English
Resource type - Journals
SCImago Journal Rank - 0.689
H-Index - 51
eISSN - 1439-0388
pISSN - 0931-2668
DOI - 10.1111/j.1439-0388.1995.tb00565.x
Subject(s) - maximum likelihood , recombination , genotyping , statistics , linkage (software) , genetics , recombination rate , biology , mathematics , genotype , gene
Summary When field data are used for genome analyses in farm animals, misclassification can occur. This can be caused either by errors in the pedigree files, or by non‐intentional exchanges of milk or blood samples when collecting and processing material for genotyping. A statistical model is suggested, which takes the probability of misclassification Δ into account when estimating the recombination rate θ between two markers. These two parameters can be estimated jointly using a maximum‐likelihood approach. This approach is used to estimate the recombination rate between the two polymorphic milk‐protein systems κ‐casein and β‐casein, from genotype data of Austrian Simmental (SI) and Austrian Braunvieh (BV). If the possibility of misclassification is disregarded, the recombination rate between the two loci is estimated to be 0.18 and 0.06, respectively. However this contradicts the well‐known fact that these two loci are in very close linkage. With the full model, the estimated recombination rate was 0.054 in SI and 0.0 in BV, with both estimates not significantly different from zero. The corresponding estimated misclassification rates were 0.12 and 0.14, respectively, and were highly significant, if the possibility of misclassification in genetic studies is ignored, the recombination rate will be systematically overestimated and misleading conclusions may result. Zusammenfassung Auswirkungen von Fehlzuordnungen in der Kopplungsanalyse und deren korrekte Behandlung Wenn eine Genomanalyse auf Felddaten beruht muß mit der Möglichkeit von fehlerhaften Zuordnungen gerechnet werden. Fehlzuordnungen können sich aus Fehlern in den Abstammungsdateien oder aus unbeabsichtigten Vertauschungen von Milchoder Blutproben im Verlauf der Probennahme und Genotypisierung ergeben. Ein statistisches Modell wird vorgeschlagen, in dem die Wahrscheinlichkeit von Fehlzuordnungen Δ bei der Schätzung der Rekombinationsrate θ zwischen zwei Loci berücksichtigt wird. Beide Parameter können simultan mittels Maximum Likelihood geschätzt werden. Der Ansatz wurde verwendet, um aus Daten des Österreichischen Fleckviehs (FV) und des Österreichischen Braunviehs (BV) die Rekombinationsrate zwischen den beiden polymorphen Milchproteinsystemen κ‐Kasein und β‐Kasein zu schätzen. Ohne Berücksichtigung von Fehlzuordnung ergeben sich aus dem vorhandenen Material Rekombinationsraten von 0.18 bzw. 0.06. Dies widerspricht der bekannten Tatsache, daß die beiden Loci sehr eng gekoppelt sind. Mit dem vollen Modell war die geschätzte Rekombinationsrate 0.054 bei FV und 0.0 bei BV, in beiden Fällen waren die Werte nicht signifikant von Null verschieden. Die entsprechenden Fehlzuordnungsraten waren 0.12 und 0.14 und in beiden Fällen höchstsignifikant. Es wird gezeigt, daß die Vernachlässigung der Möglichkeit einer fehlerhaften Zuordnung zu einer systematischen überschätzung der Rekombinationsrate führt und sich dadurch vollkommen irreführende Schluß folgerungen ergeben können.