Open Access
Benchmarking between item based collaborative filtering algorithm and genomic best linear unbiased prediction (GBLUP) model in terms of prediction accuracy for wheat and maize//Estudio comparativo en términos de capacidad predictiva para datos de trigo y maíz entre el algoritmo de filtrado colaborativo y el modelo genómico mejor predictor lineal insesgado (GBLUP)
Author(s) -
Osval A. MontesinosLópez,
Emeterio Franco-Pérez,
Francisco Javier Luna-Vázquez,
Josafhat SalinasRuíz,
Sara Sandoval-Carrillo,
Marco Alberto Valenzo Jiménez,
Jaime Cuervas,
Pedro C. Santana-Mancilla
Publication year - 2020
Publication title -
biotecnia
Language(s) - Spanish
Resource type - Journals
ISSN - 1665-1456
DOI - 10.18633/biotecnia.v22i2.1255
Subject(s) - best linear unbiased prediction , benchmarking , genomic selection , computer science , univariate , algorithm , selection (genetic algorithm) , biology , multivariate statistics , machine learning , genetics , gene , genotype , marketing , business , single nucleotide polymorphism
Aim/background: in view of the growing demand for food, new methodologies are needed to improve the genomic selection (GS) methodology to obtain more productive plant varieties and there is empirical evidence that GS it is revolutionizing plant breeding for food production around the world. Methods: since the prediction models play a key role in GS, for this reason Montesinos-López et al. (2018) proposed the item based collaborative filtering (IBCF) algorithm for Genomic prediction. For this reason, in this paper we compare the IBCF algorithm with the most popular genomic prediction model called the Genomic Best Linear Unbiased Prediction (GBLUP). Results: We found that the GBLUP is superior than the IBCF model, but the IBCF is competitive to the GBLUP model since produced very similar predictions, but with the large advantage that it is extremely efficient in terms of time for implementation. Conclusions: we found that the GBLUP is better than the IBCF algorithm but the IBCF is more than 400 times more efficient than the GBLUP model in terms of time for implementation. Limitations: The main limitation of the study is that it was performed in univariate terms and it is possible that the IBCF will perform better with multivariate data.RESUMENObjetivo / antecedentes: en vista de la creciente demanda de alimentos, se necesitan nuevas metodologías para mejorar la selección genómica (GS) para obtener variedades de plantas más productivas y en menor tiempo y existe evidencia que la SG está revolucionando el mejoramiento de plantas que ayudará a incrementar la producción de alimentos a nivel mundial. Métodos: dado que los modelos de predicción juegan un papel clave en GS, Montesinos-López et al. (2018) propusieron el algoritmo de filtrado colaborativo (IBCF) para la predicción genómica. Por esta razón, en este artículo comparamos el algoritmo IBCF con el modelo de predicción genómica más popular denominado mejor predictor lineal insesgado Bayesiano (GBLUP). Resultados: Encontramos que el GBLUP es superior en capacidad predictiva al modelo IBCF, pero el IBCF es competitivo con el modelo GBLUP ya que produjo predicciones muy similares, pero con la ventaja de que es eficiente en términos de tiempo de implementación. Conclusiones: encontramos que el GBLUP es mejor que el algoritmo IBCF, pero el IBCF es 400 veces más eficiente que el modelo GBLUP en términos de tiempo de implementación. Limitaciones: la principal limitación del estudio es que se realizó en términos univariados y es posible que el IBCF se desempeñe mejor con datos multivariados.