z-logo
open-access-imgOpen Access
Application of polynomial transforms for fast 2D convolutions
Author(s) -
И.А. Калиновский,
В.Г. Спицын
Publication year - 2016
Publication title -
vyčislitelʹnye metody i programmirovanie
Language(s) - English
Resource type - Journals
eISSN - 1726-3522
pISSN - 0507-5386
DOI - 10.26089/nummet.v17r318
Subject(s) - simd , convolution (computer science) , parallel computing , computer science , polynomial , fast fourier transform , kernel (algebra) , range (aeronautics) , computational science , algorithm , mathematics , artificial intelligence , discrete mathematics , materials science , mathematical analysis , artificial neural network , composite material
Рассмотрен быстрый алгоритм вычисления двумерных сверток, основанный на полиномиальных преобразованиях Нуссбаумера. Предложена его эффективная программная реализация с использованием набора SIMD-инструкций Intel AVX. Показано, что для ограниченного диапазона размеров ядер достигается 50% увеличение производительности вычислений по сравнению с прямым алгоритмом и методом быстрой свертки на основе быстрого преобразования Фурье, реализованных в библиотеке Intel IPP. A fast algorithm for computing 2D convolutions based on the Nussbaumer polynomial transforms is considered. Its efficient implementation is proposed with the use of Intel AVX SIMD instructions. It is shown that, for a limited range of convolution kernels, the performance increases by 50% in comparison with the direct algorithm and with the method of fast convolution based on the fast Fourier transform implemented in the Intel IPP library.

The content you want is available to Zendy users.

Already have an account? Click here to sign in.
Having issues? You can contact us here