Distributed clustering of ubiquitous data streams | Zendy

Rodrigues Pedro Pereira | Zendy; Gama João | Zendy

AI Assistant Blog Pricing

Home ZAIA Blog

Premium

Distributed clustering of ubiquitous data streams

Author(s) -

Rodrigues Pedro Pereira,

Gama João

Publication year - 2013

Publication title -

wiley interdisciplinary reviews: data mining and knowledge discovery

Language(s) - English

Resource type - Journals

SCImago Journal Rank - 1.506

H-Index - 47

eISSN - 1942-4795

pISSN - 1942-4787

DOI - 10.1002/widm.1109

Subject(s) - cluster analysis , computer science , data stream mining , streaming data , data stream clustering , data mining , knowledge extraction , big data , data stream , data science , distributed computing , cure data clustering algorithm , correlation clustering , machine learning , telecommunications

Nowadays information is generated and gathered from distributed streaming data sources, stressing communications and computing infrastructure, making it hard to transmit, compute, and store. Knowledge discovery from ubiquitous data streams has become a major goal for all sorts of applications, mostly based on unsupervised techniques such as clustering. Two subproblems exist: clustering streaming data observations and clustering streaming data sources . The former searches for dense regions of the data space, identifying hot spots where data sources tend to produce data, while the latter finds groups of sources that behave similarly over time. In order to better assess the current status of this topic, this article presents a thorough review on distributed algorithms addressing either of the subproblems. We characterize clustering algorithms for ubiquitous data streams, discussing advantages and disadvantages of distributed procedures. Overall, distributed stream clustering methods improve communication ratios, processing speed, and resources consumption, while achieving similar clustering validity as the centralized counterparts. WIREs Data Mining Knowl Discov 2014, 4:38–54. doi: 10.1002/widm.1109 This article is categorized under: Technologies > Machine Learning Technologies > Structure Discovery and Clustering

This content is not available in your region!

Continue researching here.

Having issues? You can contact us here

Accelerating Research