
A dual active set algorithm for optimal sparse convex regression
Author(s) -
Gudkov Aleksandr Aleksandrovich,
Sergei Mironov,
Sergei Sidorov,
Tyshkevich Sergey Viktorovich
Publication year - 2019
Publication title -
vestnik samarskogo gosudarstvennogo tehničeskogo universiteta. seriâ: fiziko-matematičeskie nauki/vestnik samarskogo gosudarstvennogo tehničeskogo universiteta. seriâ fiziko-matematičeskie nauki
Language(s) - Russian
Resource type - Journals
eISSN - 2310-7081
pISSN - 1991-8615
DOI - 10.14498/vsgtu1673
Subject(s) - dual (grammatical number) , set (abstract data type) , regular polygon , combinatorics , algorithm , mathematics , computer science , geometry , art , literature , programming language
В последнее время задачи статистики с ограничениями на форму данных привлекают повышенное внимание. Одной из таких задач является задача поиска оптимальной монотонной регрессии. Проблема построения монотонной регрессии (которая также называется изотонной регрессией) состоит в том, чтобы для данного вектора (не обязательно монотонного) найти неубывающий вектор с наименьшей ошибкой приближения к данному. Выпуклая регрессия есть развитие понятия монотонной регрессии для случая $2$-монотонности (т.е. выпуклости). Как изотонная, так и выпуклая регрессия находят применение во многих областях, включая непараметрическую математическую статистику и сглаживание эмпирических данных. В данной статье предлагается итерационный алгоритм построения разреженной выпуклой регрессии, т.е. для нахождения выпуклого вектора $z\in \mathbb{R}^n$ с наименьшей квадратичной ошибкой приближения к данному вектору $y\in \mathbb{R}^n$ (не обязательно являющемуся выпуклым). Задача может быть представлена в виде задачи выпуклого программирования с линейными ограничениями. Используя условия оптимальности Каруша-Куна-Таккера, доказано, что оптимальные точки должны лежать на кусочно-линейной функции. Доказано, что предложенный двойственный алгоритм на основе активного множества для построения оптимальной разреженной выпуклой регрессии имеет полиномиальную сложность и позволяет найти оптимальное решение (для которого выполнены условия Каруша-Куна-Таккера).