
Parallelization technologies for solving three-dimensional boundary value problems on quasi-structured grids using the CPU+GPU hybrid computing environment
Author(s) -
И.А. Климонов,
В. Д. Корнеев,
В. М. Свешников
Publication year - 2016
Publication title -
vyčislitelʹnye metody i programmirovanie
Language(s) - English
Resource type - Journals
eISSN - 1726-3522
pISSN - 0507-5386
DOI - 10.26089/nummet.v17r107
Subject(s) - computer science , parallel computing , computational science , domain decomposition methods , central processing unit , graphics , acceleration , cuda , computer graphics (images) , finite element method , computer hardware , physics , classical mechanics , thermodynamics
При распараллеливании решения трехмерных краевых задач на квазиструктурированных сетках методом декомпозиции расчетной области на подобласти, сопрягаемые без наложения, наиболее трудоемкой вычислительной процедурой является решение краевых подзадач в подобластях. Использование параллелепипедальных квазиструктурированных сеток дает возможность применить для этих целейбыстросходящиеся методы переменных направлений. Распараллеливание итерационного процесса по подобластям проводится на CPU в системе MPI, а для решения подзадач в настоящей статье предлагается использовать графические ускорители GPU. Приводятся экспериментальные исследования применения графических ускорителей при решении подзадач методом Писмана-Речфорда. Даются экспериментальные оценки ускорения распараллеливания в гибридной вычислительной среде CPU+GPU по сравнению с расчетами только на CPU. When parallelizing the solution processes of solving three-dimensional boundary value problems on quasi-structured grids by the method of decomposition of the computational domain into subdomains without imposition, the most time consuming computational procedure is a solution of subproblems in subdomains. The application of parallelepiped quasi-structured grids makes it possible to use the rapidly convergent method of alternating directions. The parallelization of iterative processes on subdomains is performed on CPU using MPI. In order to solve the subproblems, we propose to use the graphics accelerators (GPU). Experimental results of using the graphics accelerators to solve the subproblems by Peaceman-Rachford method are discussed. The computational acceleration achieved on the CPU+GPU hybrid computing environment is experimentally estimated compared to using the CPU only.