
Метод смешанного оценивания параметров линейной регрессии: особенности применения
Author(s) -
С. И. Носков
Publication year - 2021
Publication title -
vestnik voronežskogo gosudarstvennogo universiteta. seriâ sistemnyj analiz i informacionnye tehnologii
Language(s) - Russian
Resource type - Journals
ISSN - 1995-5499
DOI - 10.17308/sait.2021.1/3377
Subject(s) - political science
Работа основана на предложенном ранее автором методе смешанного оценивания неизвестных параметров линейного регрессионного уравнения. Этот метод предполагает одновременную минимизацию разных функций потерь на разных участках обрабатываемой выборки данных. Основным достоинством такого подхода является совмещение привлекательных свойств каждого задействованного метода оценивания параметров при обработке одной выборки. В статье рассматриваются способы формирования подвыборок исходной выборки для функций потерь, соответствующих городскому расстоянию и расстоянию Чебышева. Эти функции по-разному реагируют на плохо согласующиеся с выборкой в целом наблюдения — первая их, по существу, игнорирует, вторая, наоборот, к ним крайне чувствительна. Показано, что реализация метода смешанного оценивания для такой комбинированной функции потерь сводится к задаче линейного программирования. При разбиении исходной выборки на подвыборки использованы следующие свойства методов оценивания параметров линейного регрессионного уравнения: метод наименьших модулей обеспечивает равенство числа нулевых ошибок аппроксимации числу параметров; при использовании метода антиробастного оценивания число максимальных по модулю ошибок аппроксимации не меньше числа параметров плюс единица. Рассмотрен численный пример с десятью наблюдениями и тремя независимыми переменными. Сравниваются оценки параметров и значения некоторых частных критериев адкватности при использовании методов наименьших квадратов, модулей, антиробастного и смешанного оценивания. Исходная выборка разбивается при этом на две подвыборки, на одной из которых метод смешанного оценивания тяготеет к игнорированию аномальных наблюдений, а на другой, напротив, неявным образом придает им больший вес, позволяя совместить тем самым преимущества методов наименьших модулей и антиробастного оценивания при использовании на одних данных, в целом способствуя повышению адекватности в их обработке.