A method for learning a sparse classifier in the presence of missing data for high-dimensional biological datasets | Zendy

Kristen Severson | Zendy; Brinda Monian | Zendy; J. Christopher Love | Zendy; Richard D. Braatz | Zendy

AI Assistant Blog Pricing

Home ZAIA Blog

Open Access

A method for learning a sparse classifier in the presence of missing data for high-dimensional biological datasets

Author(s) -

Kristen Severson,

Brinda Monian,

J. Christopher Love,

Richard D. Braatz

Publication year - 2017

Publication title -

bioinformatics

Language(s) - English

Resource type - Journals

SCImago Journal Rank - 3.599

H-Index - 390

eISSN - 1367-4811

pISSN - 1367-4803

DOI - 10.1093/bioinformatics/btx224

Subject(s) - missing data , computer science , imputation (statistics) , linear discriminant analysis , expectation–maximization algorithm , artificial intelligence , classifier (uml) , pattern recognition (psychology) , data mining , machine learning , maximum likelihood , mathematics , statistics

This work addresses two common issues in building classification models for biological or medical studies: learning a sparse model, where only a subset of a large number of possible predictors is used, and training in the presence of missing data. This work focuses on supervised generative binary classification models, specifically linear discriminant analysis (LDA). The parameters are determined using an expectation maximization algorithm to both address missing data and introduce priors to promote sparsity. The proposed algorithm, expectation-maximization sparse discriminant analysis (EM-SDA), produces a sparse LDA model for datasets with and without missing data.

The content you want is available to Zendy users.

Already have an account? Click here to sign in.

Having issues? You can contact us here

Accelerating Research