Διαφορά μεταξύ εξόρυξης δεδομένων και OLAP

Διαφορά μεταξύ εξόρυξης δεδομένων και OLAP
Διαφορά μεταξύ εξόρυξης δεδομένων και OLAP

Βίντεο: Διαφορά μεταξύ εξόρυξης δεδομένων και OLAP

Βίντεο: Διαφορά μεταξύ εξόρυξης δεδομένων και OLAP
Βίντεο: Πώς να διαλέξετε τα κατάλληλα γυαλία οράσεως/ηλίου 2024, Νοέμβριος
Anonim

Data Mining vs OLAP

Τόσο η εξόρυξη δεδομένων όσο και το OLAP είναι δύο από τις κοινές τεχνολογίες Business Intelligence (BI). Η επιχειρηματική ευφυΐα αναφέρεται σε μεθόδους που βασίζονται σε υπολογιστή για τον εντοπισμό και την εξαγωγή χρήσιμων πληροφοριών από επιχειρηματικά δεδομένα. Η εξόρυξη δεδομένων είναι το πεδίο της επιστήμης των υπολογιστών που ασχολείται με την εξαγωγή ενδιαφέροντων μοτίβων από μεγάλα σύνολα δεδομένων. Συνδυάζει πολλές μεθόδους από τεχνητή νοημοσύνη, στατιστικές και διαχείριση βάσεων δεδομένων. Το OLAP (διαδικτυακή αναλυτική επεξεργασία) όπως υποδηλώνει το όνομα είναι μια συλλογή τρόπων αναζήτησης πολυδιάστατων βάσεων δεδομένων.

Η εξόρυξη δεδομένων είναι επίσης γνωστή ως Ανακάλυψη γνώσης σε δεδομένα (KDD). Όπως προαναφέρθηκε, είναι ένα πεδίο της επιστήμης των υπολογιστών, το οποίο ασχολείται με την εξαγωγή άγνωστων και ενδιαφέρουσες προηγουμένως πληροφορίες από ακατέργαστα δεδομένα. Λόγω της εκθετικής αύξησης των δεδομένων, ειδικά σε τομείς όπως οι επιχειρήσεις, η εξόρυξη δεδομένων έχει γίνει πολύ σημαντικό εργαλείο για τη μετατροπή αυτού του μεγάλου πλούτου δεδομένων σε επιχειρηματική ευφυΐα, καθώς η χειροκίνητη εξαγωγή προτύπων έχει γίνει φαινομενικά αδύνατη τις τελευταίες δεκαετίες. Για παράδειγμα, αυτή τη στιγμή χρησιμοποιείται για διάφορες εφαρμογές όπως ανάλυση κοινωνικών δικτύων, ανίχνευση απάτης και μάρκετινγκ. Η εξόρυξη δεδομένων συνήθως ασχολείται με τις ακόλουθες τέσσερις εργασίες: ομαδοποίηση, ταξινόμηση, παλινδρόμηση και συσχέτιση. Η ομαδοποίηση είναι ο εντοπισμός παρόμοιων ομάδων από μη δομημένα δεδομένα. Η ταξινόμηση είναι κανόνες μάθησης που μπορούν να εφαρμοστούν σε νέα δεδομένα και συνήθως περιλαμβάνουν τα ακόλουθα βήματα: προεπεξεργασία δεδομένων, σχεδιασμός μοντελοποίησης, εκμάθηση/επιλογή χαρακτηριστικών και αξιολόγηση/επικύρωση. Η παλινδρόμηση είναι η εύρεση συναρτήσεων με ελάχιστο σφάλμα στη μοντελοποίηση δεδομένων. Και η ένωση αναζητά σχέσεις μεταξύ μεταβλητών. Η εξόρυξη δεδομένων χρησιμοποιείται συνήθως για να απαντήσει σε ερωτήσεις όπως ποια είναι τα κύρια προϊόντα που θα μπορούσαν να βοηθήσουν στην επίτευξη υψηλού κέρδους το επόμενο έτος στη Wal-Mart.

Το OLAP είναι μια κατηγορία συστημάτων, τα οποία παρέχουν απαντήσεις σε πολυδιάστατα ερωτήματα. Συνήθως το OLAP χρησιμοποιείται για μάρκετινγκ, προϋπολογισμό, προβλέψεις και παρόμοιες εφαρμογές. Είναι αυτονόητο ότι οι βάσεις δεδομένων που χρησιμοποιούνται για το OLAP έχουν διαμορφωθεί για σύνθετα και ad-hoc ερωτήματα με γνώμονα τη γρήγορη απόδοση. Συνήθως χρησιμοποιείται ένας πίνακας για την εμφάνιση της εξόδου ενός OLAP. Οι σειρές και οι στήλες σχηματίζονται από τις διαστάσεις του ερωτήματος. Συχνά χρησιμοποιούν μεθόδους συνάθροισης σε πολλούς πίνακες για να λάβουν περιλήψεις. Για παράδειγμα, μπορεί να χρησιμοποιηθεί για να μάθετε για τις φετινές πωλήσεις στη Wal-Mart σε σύγκριση με πέρυσι; Ποια είναι η πρόβλεψη για τις πωλήσεις το επόμενο τρίμηνο; Τι μπορεί να ειπωθεί για την τάση εξετάζοντας την ποσοστιαία μεταβολή;

Αν και είναι προφανές ότι η εξόρυξη δεδομένων και το OLAP είναι παρόμοια επειδή λειτουργούν με δεδομένα για να αποκτήσουν ευφυΐα, η κύρια διαφορά προέρχεται από τον τρόπο λειτουργίας τους στα δεδομένα. Τα εργαλεία OLAP παρέχουν πολυδιάστατη ανάλυση δεδομένων και παρέχουν περιλήψεις των δεδομένων, αλλά αντίθετα, η εξόρυξη δεδομένων εστιάζει σε αναλογίες, μοτίβα και επιρροές στο σύνολο δεδομένων. Αυτή είναι μια συμφωνία OLAP με τη συγκέντρωση, η οποία συνοψίζεται στη λειτουργία των δεδομένων μέσω «προσθήκης», αλλά η εξόρυξη δεδομένων αντιστοιχεί στη «διαίρεση». Μια άλλη αξιοσημείωτη διαφορά είναι ότι ενώ τα εργαλεία εξόρυξης δεδομένων μοντελοποιούν δεδομένα και επιστρέφουν κανόνες με δυνατότητα δράσης, η OLAP θα διεξάγει τεχνικές σύγκρισης και αντίθεσης κατά μήκος της επιχειρηματικής διάστασης σε πραγματικό χρόνο.

Συνιστάται: