
Mining text streams
Author(s) -
Polykarpos Meladianos,
Πολύκαρπος Μελαδιανός
Publication year - 2021
Language(s) - Uncategorized
Resource type - Dissertations/theses
DOI - 10.12681/eadd/45605
Subject(s) - streams , computer science , information retrieval , natural language processing , artificial intelligence , data mining , computer network
Η Επεξεργασία Φυσικής Γλώσσας (NLP) και η Εξόρυξη Κειμένου (TM) είναι ερευνητικά πεδία που αποσκοπούν στην εξόρυξη πληροφορίας από κείμενο και στη μετατροπή της γλώσσα που χρησιμοποιούν οι άνθρωποι σε μια μορφή που ο υπολογιστής είναι σε θέση να κατανοήσει. Η ημι-δομημένη φύση του κειμένου καθιστά το έργο εξόρυξης πληροφοριών από πηγές κειμένου πολύ δύσκολο, το οποίο μετά από αρκετές δεκαετίες εξακολουθεί να είναι ένα ανοιχτό ερευνητικό πρόβλημα. Ορισμένες από τις πιο αξιοσημείωτες εφαρμογές εξόρυξης γνώσης είναι η ανάκτηση ad hoc πληροφοριών, η κατηγοριοποίηση κειμένου, η εξαγωγή λέξεων-κλειδιών και η περίληψη εγγράφων. Κατά την τελευταία δεκαετία η άνοδος των μέσων κοινωνικής δικτύωσης, των ιστότοπων καθώς και ποικίλων διαφορετικών εφαρμογών οδήγησε σε μαζικές ροές δεδομένων σε μορφή κειμένου που παράγονται συνεχώς με την πάροδο του χρόνου. Πολλές από τις παραδοσιακές τεχνικές εξόρυξης γνώσης δεν μπορούν να χειριστούν αποτελεσματικά αυτά τα ρεύματα σε πραγματικό χρόνο. Η έρευνά αυτή επικεντρώνεται στην εξόρυξη γνώσης από ροές κειμένου σε πραγματικό χρόνο.