
ПОРІВНЯЛЬНИЙ АНАЛІЗ ПРОДУКТИВНОСТІ БАЗ ДАНИХ SQL ТА NOSQL
Author(s) -
T. S. Nikitina,
О. I. Morozova
Publication year - 2019
Publication title -
sistemi upravlìnnâ, navìgacìï ta zvʼâzku
Language(s) - Ukrainian
Resource type - Journals
ISSN - 2073-7394
DOI - 10.26906/sunz.2019.1.125
Subject(s) - nosql , sql , computer science , database , scalability
В роботі було проведено короткий аналіз функцій баз даних SQL та NoSQL, були приведені їх основні відмінності. На сьогоднішній день існують два найбільш поширених типу систем управління даними: реляційні бази даних та NoSQL. Існує величезне різноманіття моделей даних та API (Application Programming Interface) запитів для NoSQL. Зокрема для порівняння були обрані Apache Cassandra, DynamoDB, MongoDB. Модель даних та функціональність Apache Cassandra має схожість з іншими масштабованими сховищами. Оновлення та угруповання стовпців кешується в оперативній пам'яті, після чого скидаються на диск. Основною метою роботи було порівняння продуктивності реляційних SQL баз даних та NoSQL, на прикладі PostgreSQL, MySQL, Apach Cassandra, MongoDB, Amazon DynamoDB. Для тестування продуктивності було розроблено окремий програмний продукт. Основним предметом дослідження є продуктивність базових операцій цих систем. Результати про продуктивність кожної з них були отримані за допомогою розробленої системи тестування, адаптованої для потреб дослідження. Розроблена система тестування озволила тестувати швидкість виконання складних аналітичних операцій, робити додаткові налаштування, використовувати великий обсяг даних. Система була розширена для виконання тестування розширеного набору операцій над схемою даних, що містить зв'язки між таблицями. Ця система тестування містить набір готових навантажень, які покривають основні аспекти функціонування й підтримують створені користувачем навантаження. За допомогою системи тестування були отримано дані про продуктивність представлених систем управління базами даних для набору різних запитів. Для аналізу продуктивності вимірювався час відгуку систем на запит – час між початком запиту й одержанням відповіді. Порівнювалися два види показників – середній відгук по виконані операції й деталізований аналіз. Отримані дані були представлені у вигляді діаграм, і по ним був зроблений висновок про продуктивність баз даних SQL та NoSQL. Вибір баз даних повинен максимально ґрунтуватися на типі вирішуваних завдань й також повинен враховувати обсяги даних, час відгуку системи.