DEVELOPING A PARALLEL CLASSIFIER FOR MINING IN BIG DATA SETS | Zendy

Ahad Shamseen | Zendy; Morteza Mohammadi Zanjireh | Zendy; Mahdi Bahaghighat | Zendy; Qin Xin | Zendy

AI Assistant Blog Pricing

Home ZAIA Blog

Open Access

DEVELOPING A PARALLEL CLASSIFIER FOR MINING IN BIG DATA SETS

Author(s) -

Ahad Shamseen,

Morteza Mohammadi Zanjireh,

Mahdi Bahaghighat,

Qin Xin

Publication year - 2021

Publication title -

iium engineering journal

Language(s) - English

Resource type - Journals

SCImago Journal Rank - 0.141

H-Index - 6

eISSN - 2289-7860

pISSN - 1511-788X

DOI - 10.31436/iiumej.v22i2.1541

Subject(s) - computer science , artificial intelligence , decision tree , data mining , humanities , machine learning , philosophy

Data mining is the extraction of information and its roles from a vast amount of data. This topic is one of the most important topics these days. Nowadays, massive amounts of data are generated and stored each day. This data has useful information in different fields that attract programmers’ and engineers’ attention. One of the primary data mining classifying algorithms is the decision tree. Decision tree techniques have several advantages but also present drawbacks. One of its main drawbacks is its need to reside its data in the main memory. SPRINT is one of the decision tree builder classifiers that has proposed a fix for this problem. In this paper, our research developed a new parallel decision tree classifier by working on SPRINT results. Our experimental results show considerable improvements in terms of the runtime and memory requirements compared to the SPRINT classifier. Our proposed classifier algorithm could be implemented in serial and parallel environments and can deal with big data.ABSTRAK: Perlombongan data adalah pengekstrakan maklumat dan peranannya dari sejumlah besar data. Topik ini adalah salah satu topik yang paling penting pada masa ini. Pada masa ini, data yang banyak dihasilkan dan disimpan setiap hari. Data ini mempunyai maklumat berguna dalam pelbagai bidang yang menarik perhatian pengaturcara dan jurutera. Salah satu algoritma pengkelasan perlombongan data utama adalah pokok keputusan. Teknik pokok keputusan mempunyai beberapa kelebihan tetapi kekurangan. Salah satu kelemahan utamanya adalah keperluan menyimpan datanya dalam memori utama. SPRINT adalah salah satu pengelasan pembangun pokok keputusan yang telah mengemukakan untuk masalah ini. Dalam makalah ini, penyelidikan kami sedang mengembangkan pengkelasan pokok keputusan selari baru dengan mengusahakan hasil SPRINT. Hasil percubaan kami menunjukkan peningkatan yang besar dari segi jangka masa dan keperluan memori berbanding dengan pengelasan SPRINT. Algoritma pengklasifikasi yang dicadangkan kami dapat dilaksanakan dalam persekitaran bersiri dan selari dan dapat menangani data besar.

The content you want is available to Zendy users.

Already have an account? Click here to sign in.

Having issues? You can contact us here

Accelerating Research