z-logo
open-access-imgOpen Access
Дослідження продуктивності кластера Apache Spark на платформі Azure для методів машинного навчання
Author(s) -
Sergii Minukhin
Publication year - 2020
Publication title -
zbìrnik naukovih pracʹ harkìvsʹkogo unìversitetu povìtrânih sil
Language(s) - Ukrainian
Resource type - Journals
eISSN - 2518-1661
pISSN - 2073-7378
DOI - 10.30748/zhups.2020.63.11
Subject(s) - spark (programming language) , operating system , computer science , programming language
Розглянуто та досліджено питання підвищення продуктивності застосування моделей та методів задач машинного навчання з використанням Apache Spark Azure HDInsight. Для підвищення обгрунтованості отриманих результатів використано один з найбільш відомих бенмарків для тестування бібліотек машинного навчання Spark-Perf. Наведені кроки щодо встановлення, розгортання та налаштування Apache Spark на платформі Azure. Для оцінки ефективності розподілених обчислень використано метрики продуктивності щодо середнього часу навчання та тестування та їх відношення. Проведений порівняльний аналіз результатів розв’язку задач з бібліотеки MLlib для кластерів з гомогенною та гетерогенною архітектурою, які свідчать про високу ефективність їх використання.

The content you want is available to Zendy users.

Already have an account? Click here to sign in.
Having issues? You can contact us here