Τι είναι η εξόρυξη δεδομένων (data mining);
Υπάρχει μία ποικιλία ορισμών σχετικά με την εξόρυξη δεδομένων (Data Mining). Ένας συνοπτικός ορισμός που συλλαμβάνει την ουσία της εξόρυξης δεδομένων είναι:
«Η εξαγωγή χρήσιμων πληροφοριών από μεγάλα σύνολα δεδομένων.» (Hand et al.,)
Data Mining – Ορισμός:
Το Data Mining αποτελεί την τέχνη της εξόρυξης χρήσιμων πληροφοριών από μεγάλες ποσότητες δεδομένων η οποία έχει όλο και μεγαλύτερη σημασία στον σημερινό κόσμο. Ορισμένες περιπτώσεις αναφέρονται παρακάτω:
- Το φίλτρο ανεπιθύμητης αλληλογραφίας στο e-mail στηρίζεται, τουλάχιστον εν μέρει, στους κανόνες που ένας αλγόριθμος Data Mining έχει μάθει από την εξέταση εκατομμυρίων μηνυμάτων e-mail που έχουν χαρακτηριστεί ως ανεπιθύμητα (spam).
- Οι μέθοδοι της εξόρυξης δεδομένων σε πραγματικό χρόνο μπορούν να “πουν” σε αυτούς που ασχολούνται με το ηλεκτρονικό εμπόριο ότι “οι πελάτες που αγόρασαν το x προϊόν ή υπηρεσία είναι επίσης πιθανό να αγοράσουν και το y προϊόν ή υπηρεσία”.
- Βοηθά τις τράπεζες στην έγκριση τραπεζικών προϊόντων η οποία είναι βασισμένη σε στοιχεία των αιτούντων
- Βοηθά τις φορολογικές αρχές να εντοπίζουν ποιες φορολογικές δηλώσεις είναι πιο πιθανό να είναι ψευδείς
- Ενισχύει τον κατάλογο των εμπόρων που στοχεύουν στους πελάτες που είναι πιο πιθανό να προχωρήσουν σε αγορά.
Το Data Mining δεν είναι μόνο για τους αριθμούς. Για παράδειγμα, οι τεχνικές της εξόρυξης κειμένου (text mining) βοηθούν τις μηχανές αναζήτησης όπως η Google, να εμφανίσει αποτελέσματα ή διαφημίσεις σύμφωνα με αυτό που έχετε αναζητήσει.
Η ποσότητα των δεδομένων που ρέει από, προς, και μέσω των επιχειρήσεων όλων των ειδών είναι τεράστια και αυξάνεται τόσο ραγδαία που είναι πέρα από τις δυνατότητες πολλών οργανισμών να τα αξιοποιήσουν.
Επιτυχημένες επιχειρήσεις είναι αυτές που χρησιμοποιούν αποτελεσματικά την αφθονία των δεδομένων στα οποία έχουν πρόσβαση για να κάνουν καλύτερες προβλέψεις, να πάρουν καλύτερες αποφάσεις και να ακολουθήσουν καλύτερες στρατηγικές. Οι επιτυχημένοι διαχειριστές πρέπει να γνωρίζουν τις δυνατότητες και τους περιορισμούς της εξόρυξης δεδομένων.
Αλλά σε ποιο επίπεδο; Μια επισκόπηση υψηλού επιπέδου παρέχει μια γενική ιδέα για το τι η εξόρυξη δεδομένων μπορεί να προσφέρει σε μία επιχείρηση, αλλά αποτυγχάνει να παράσχει την διαίσθηση που θα μπορούσε να επιτευχθεί με τη δημιουργία μοντέλων με πραγματικά δεδομένα.
Μία πολύ τεχνική προσέγγιση από την επιστήμη των υπολογιστών, της βάσης δεδομένων, ή από στατιστική άποψη μπορεί να κολλήσει στη λεπτομέρεια που έχει μικρή σχέση με τη λήψη αποφάσεων.
Είναι σημαντικό ότι οι διαχειριστές είναι σε θέση να μετατρέψουν τα λειτουργικά προβλήματα της επιχείρησης στο κατάλληλο στατιστικό πρόβλημα πριν “παραδοθεί” σε μια τεχνική ομάδα.
Αλλά είναι δύσκολο για τους διαχειριστές να το κάνουν αυτό με αυτοπεποίθηση εκτός αν έχουν πράγματι εμπειρία στην ανάπτυξη μοντέλων για μια ποικιλία πραγματικών προβλημάτων, χρησιμοποιώντας πραγματικά δεδομένα. (Daryl Pregibon Google Inc)
Που χρησιμοποιείται το Data Mining;
Η εξόρυξη δεδομένων χρησιμοποιείται σε διάφορους τομείς και εφαρμογές.
Ιατρική:
Τα τελευταία χρόνια, το Data Mining χρησιμοποιείται ευρέως στoυς τομείς της ιατρικής, όπως η βιοϊατρική , η γενετική και η φαρμακευτική.
Στον τομέα της γενετικής, ο σκοπός είναι να κατανοήσουμε την χαρτογράφηση της σχέσης μεταξύ της μεταβολής των ακολουθιών του ανθρώπινου DNA και την προδιάθεση στην αρρώστια.
Η εξόρυξη δεδομένων είναι ένα σημαντικό εργαλείο που μπορεί να βοηθήσει στην βελτίωση της διάγνωσης, της πρόληψης και της θεραπείας των ασθενειών.
Οικονομία:
Άλλος τομέας που εφαρμόζεται η εξόρυξη δεδομένων είναι η οικονομία. Τα οικονομικά δεδομένα κυρίως συλλέγονται από τράπεζες και από άλλους οικονομικούς οργανισμούς.
Τα δεδομένα αυτά συνήθως είναι αξιόπιστα, ολοκληρωμένα, έχουν υψηλή ποιότητα και απαιτούν συστηματική μέθοδο για την ανάλυση τους.
H συνεισφορά της εξόρυξης δεδομένων στην επιστήμη της οικονομίας συναντάται στην συλλογή και κατανόηση των δεδομένων, στην βελτίωση δεδομένων (data refinement), στην δημιουργία και εκτίμηση ενός μοντέλου και στην ανάπτυξη αυτού.
Η σωστή ανάλυση των οικονομικών δεδομένων μας διευκολύνει στο να παίρνουμε καλύτερες αποφάσεις ενεργώντας σύμφωνα με την ανάλυση της αγοράς
Τηλεπικοινωνίες:
Η τηλεπικοινωνιακή βιομηχανία αναπτύσσεται πολύ γρήγορα όπως και η τεχνολογία.
Αυτές τις μέρες οι τηλεπικοινωνιακές υπηρεσίες έχουν επεκταθεί από τοπικές και μεγάλης απόστασης τηλεπικοινωνίες, στην χρήση φαξ, συσκευές τηλε-ειδοποίησης, κινητό τηλέφωνο και ηλεκτρονικό ταχυδρομείο.
Εξαιτίας των εξελίξεων στις τηλεπικοινωνιακές τεχνολογίες και για να δουλέψουν αποτελεσματικά αυτές οι τεχνολογίες, οι τεχνικές του Data Mining ενσωματώνονται σε αυτές τις τεχνολογίες για να παράγουν αποδοτικά αποτελέσματα.
Η εξόρυξη δεδομένων βοηθάει στην διάκριση τηλεπικοινωνιακών προτύπων, καταπολέμησης παράνομων δραστηριοτήτων, και επίσης βοηθάει στην καλύτερη χρήση των πόρων και στη βελτίωση της ποιότητας των υπηρεσιών.(Wikipedia)
Άλλες πιθανές εξειδικευμένες χρήσεις της εξόρυξης δεδομένων
Παρά την ήδη αυξανόμενη εφαρμογή του Data Mining, υπάρχουν επιπλέον τομείς στους οποίους θα μπορούσε να χρησιμοποιηθεί όπως στις υπηρεσίες πληροφοριών για να καθορίσουν μέσα από μια μεγάλη ποσότητα παρακολουθούμενων τηλεπικοινωνιών τα δεδομένα που έχουν ενδιαφέρον, στρατιωτική χρήση με σκοπό να γίνει γνωστός ο ρόλος που διαδραματίζουν διάφοροι παράγοντες στην ακρίβεια των βομβών και στην ασφάλεια δικτυακών υπολογιστών όπου οι ειδικοί αναλυτές θα μπορούσαν να χρησιμοποιήσουν την εξόρυξη δεδομένων για να καθορίσουν αν ένα πακέτο δεδομένων δικτύου αποτελεί απειλή.
Περιηγηθείτε στις υπηρεσίες μας και ανακαλύψτε περισσότερα για το shared web hosting, τους dedicated servers αλλά και πολλά ακόμη.
Και, φυσικά, είμαστε διαθέσιμοι για οποιαδήποτε βελτίωση ή προσθήκη έχετε να μας προτείνετε. Μπορείτε να κάνετε submit για feature request από την φόρμα επικοινωνίας.