Τύποι μοντέλων δεδομένων. Το διάγραμμα KMD είναι μια περιγραφή της δομής του μοντέλου δεδομένων από τη σκοπιά του διαχειριστή. Εταιρικές Βάσεις Δεδομένων

Φαίνεται ότι τώρα το θέμα της ανάπτυξης αποθήκης δεδομένων έχει διολισθήσει νέος γύροςανάπτυξη. Νέες τεχνολογίες, προσεγγίσεις και εργαλεία εμφανίζονται. Η μελέτη, η δοκιμή και η λογική εφαρμογή τους μας επιτρέπει να δημιουργήσουμε πραγματικά ενδιαφέροντα και χρήσιμες λύσεις. Και φέρτε τα στην εφαρμογή, απολαμβάνοντας το γεγονός ότι χρησιμοποιούνται οι εξελίξεις σας πραγματική δουλειάκαι είναι ευεργετικά.

Επίλογος

Κατά την προετοιμασία αυτού του άρθρου, προσπάθησα να εστιάσω κυρίως σε αρχιτέκτονες, αναλυτές και προγραμματιστές που εργάζονται άμεσα με αποθήκες δεδομένων. Αλλά αποδείχθηκε ότι αναπόφευκτα "πήρε το θέμα λίγο ευρύτερο" - και άλλες κατηγορίες αναγνωστών εμφανίστηκαν. Κάποια σημεία θα φαίνονται αμφιλεγόμενα, άλλα δεν είναι ξεκάθαρα, κάποια είναι προφανή. Οι άνθρωποι είναι διαφορετικοί - με διαφορετικές εμπειρίες, υπόβαθρο και θέσεις.
Για παράδειγμα, τυπικές ερωτήσεις από τους μάνατζερ είναι «πότε να ασχοληθείς με αρχιτέκτονες;», «πότε πρέπει να κάνεις αρχιτεκτονική;», «αρχιτεκτονική – δεν θα είναι πολύ ακριβό;» Μας ακούγονται αρκετά περίεργα (προγραμματιστές, σχεδιαστές), γιατί για εμάς η αρχιτεκτονική ενός συστήματος εμφανίζεται με τη γέννησή του - δεν έχει σημασία αν το συνειδητοποιούμε ή όχι. Και ακόμη κι αν δεν υπάρχει επίσημος ρόλος του αρχιτέκτονα στο έργο, ένας κανονικός προγραμματιστής πάντα «στρέφει τον εσωτερικό του αρχιτέκτονα».

Με σε μεγάλο βαθμό, δεν έχει σημασία ποιος ακριβώς παίζει τον ρόλο του αρχιτέκτονα - αυτό που έχει σημασία είναι ότι κάποιος θέτει τέτοιες ερωτήσεις και διερευνά τις απαντήσεις σε αυτές. Εάν ο αρχιτέκτονας προσδιορίζεται με σαφήνεια, αυτό σημαίνει μόνο ότι είναι ο πρωταρχικός υπεύθυνος για το σύστημα και την ανάπτυξή του.
Γιατί βρήκα το θέμα της «αντιθραυστικότητας» σχετικό με αυτό το θέμα;

«Το μοναδικό με την αντιευθραυστότητα είναι ότι μας επιτρέπει να δουλεύουμε με το άγνωστο, να κάνουμε κάτι σε συνθήκες όπου δεν καταλαβαίνουμε τι κάνουμε και να πετύχουμε»./Nassim N. Taleb/
Ως εκ τούτου, η κρίση και υψηλός βαθμόςΟι αβεβαιότητες δεν αποτελούν δικαιολογία για την έλλειψη αρχιτεκτονικής, αλλά παράγοντες που ενισχύουν την ανάγκη της.

Ετικέτες: Προσθήκη ετικετών

Το άρθρο περιγράφει τις κύριες αρχιτεκτονικές των αποθηκών δεδομένων και εξετάζει μερικές γενικές αρχέςτην κατασκευή τους. Οι μέθοδοι για την αναπαράσταση ιεραρχιών σε μια σχεσιακή δομή δεδομένων περιγράφονται λεπτομερώς.

Εισαγωγή

Στις αρχές της δεκαετίας του ογδόντα του περασμένου αιώνα, κατά την περίοδο της ταχείας ανάπτυξης των συστημάτων καταγραφής πληροφοριών, προέκυψε η κατανόηση της περιορισμένης δυνατότητας χρήσης τους για σκοπούς ανάλυσης δεδομένων και δημιουργίας συστημάτων υποστήριξης και λήψης αποφάσεων στη βάση τους. Τα συστήματα καταγραφής δημιουργήθηκαν για αυτοματισμό λειτουργίες ρουτίναςγια επιχειρηματική δραστηριότητα έκδοση τιμολογίων, σύνταξη συμβολαίων, έλεγχος της κατάστασης της αποθήκης κ.λπ., και οι κύριοι χρήστες τέτοιων συστημάτων ήταν το προσωπικό γραμμής. Οι κύριες απαιτήσεις για τέτοια συστήματα ήταν η διασφάλιση του συναλλακτικού χαρακτήρα των αλλαγών που έγιναν και η μεγιστοποίηση της ταχύτητας της εφαρμογής τους. Αυτές οι απαιτήσεις είναι που καθόρισαν την επιλογή του σχεσιακού ΣΔΒΔ και του μοντέλου αναπαράστασης δεδομένων «σχέση οντοτήτων» ως τα κύρια που χρησιμοποιήθηκαν. τεχνικές λύσειςκατά την κατασκευή συστημάτων καταγραφής.

Οι διευθυντές και οι αναλυτές, με τη σειρά τους, απαιτούσαν συστήματα που θα επέτρεπαν:

Είναι προφανές ότι τα συστήματα καταγραφής δεν πληρούσαν καμία από τις παραπάνω απαιτήσεις. Στο σύστημα εγγραφής, οι πληροφορίες είναι σχετικές μόνο κατά τη στιγμή της επικοινωνίας βάση δεδομένων, την επόμενη χρονική στιγμή για το ίδιο αίτημα μπορείτε να πάρετε ένα εντελώς διαφορετικό αποτέλεσμα. Η διεπαφή των συστημάτων καταχώρισης έχει σχεδιαστεί για να εκτελεί αυστηρά καθορισμένες λειτουργίες και η δυνατότητα λήψης αποτελεσμάτων για ένα ad-hoc αίτημα είναι πολύ περιορισμένη. Η δυνατότητα επεξεργασίας μεγάλων ποσοτήτων δεδομένων είναι επίσης χαμηλή λόγω του ότι το DBMS έχει διαμορφωθεί για να εκτελεί σύντομες συναλλαγές και αναπόφευκτα επιβραδύνει την εργασία άλλων χρηστών.

Η απάντηση σε αυτή την ανάγκη ήταν η ανάδυση νέα τεχνολογίαΤεχνολογίες αποθήκης δεδομένων οργάνωσης βάσης δεδομένων.

Ορισμός και τυπικές αρχιτεκτονικές αποθηκών δεδομένων

Η ιδέα της αποθήκης δεδομένων βασίζεται σε δύο κύριες ιδέες - την ενοποίηση των αναλυόμενων λεπτομερών δεδομένων (με την έννοια ότι περιγράφει ορισμένα συγκεκριμένα γεγονότα, ιδιότητες, συμβάντα κ.λπ.) σε ένα ενιαίο χώρο αποθήκευσης και τον διαχωρισμό των συνόλων δεδομένων και των εφαρμογών που χρησιμοποιούνται για λειτουργική επεξεργασία και χρησιμοποιείται για την επίλυση προβλημάτων ανάλυσης. Ορισμός του " αποθήκευση δεδομένων" δόθηκε για πρώτη φορά από τον William G. Inmon στη μονογραφία του. Σε αυτήν, όρισε μια αποθήκη δεδομένων ως "μια συγκεκριμένη για τον τομέα, ολοκληρωμένη, ιστορική, μη καταστρεπτή συλλογή δεδομένων που έχει σχεδιαστεί για να υποστηρίζει τη λήψη αποφάσεων διαχείρισης."

Εννοιολογικά, το μοντέλο της αποθήκης δεδομένων μπορεί να αναπαρασταθεί ως ένα διάγραμμα που φαίνεται στο Σχήμα 1. Τα δεδομένα από διάφορες πηγές τοποθετούνται στην αποθήκη δεδομένων και οι περιγραφές αυτών των δεδομένων τοποθετούνται στο χώρο αποθήκευσης μεταδεδομένων. Ο τελικός χρήστης, χρησιμοποιώντας διάφορα εργαλεία (εργαλεία οπτικοποίησης, εργαλεία αναφοράς, στατιστική επεξεργασία κ.λπ.) και τα περιεχόμενα του αποθετηρίου, αναλύει τα δεδομένα του αποθετηρίου. Το αποτέλεσμα των δραστηριοτήτων του είναι πληροφορίες με τη μορφή έτοιμων αναφορών, κρυφών μοτίβων που βρέθηκαν και τυχόν προβλέψεων. Δεδομένου ότι τα μέσα εργασίας τελικός χρήστηςμε μια αποθήκη δεδομένων μπορεί να είναι πολύ διαφορετική, τότε θεωρητικά η επιλογή τους δεν θα πρέπει να επηρεάζει τη δομή της και τις λειτουργίες της διατήρησής της ενημερωμένης.

Η φυσική υλοποίηση του παραπάνω εννοιολογικού σχήματος μπορεί να είναι πολύ διαφορετική. Οι πιο συνηθισμένες προσεγγίσεις παρατίθενται παρακάτω.

Εικονική αποθήκευση δεδομένωνΑυτό είναι ένα σύστημα που αντιπροσωπεύει διεπαφές και μεθόδους πρόσβασης στο σύστημα εγγραφής, οι οποίες μιμούνται την εργασία με δεδομένα σε αυτό το σύστημα, όπως με μια αποθήκη δεδομένων. Ένα εικονικό κατάστημα δεδομένων μπορεί να οργανωθεί δημιουργώντας μια σειρά προβολών στη βάση δεδομένων ή χρησιμοποιώντας ειδικά μέσαπρόσβαση, για παράδειγμα, σε προϊόντα κατηγορίας OLAP για επιτραπέζιους υπολογιστές, τα οποία περιλαμβάνουν, για παράδειγμα, BusinessObjects, Brio Enterprise και άλλα.

Τα κύρια πλεονεκτήματα αυτής της προσέγγισης είναι:

Ωστόσο, έχει πολλά περισσότερα μειονεκτήματα παρά πλεονεκτήματα. Δημιουργία εικονική αποθήκευσηδεδομένα, δεν δημιουργείτε μια εγκατάσταση αποθήκευσης αυτή καθαυτή, αλλά την ψευδαίσθηση της ύπαρξής της. Η δομή αποθήκευσης δεδομένων και η ίδια η αποθήκευση δεδομένων δεν αλλάζουν και τα προβλήματα παραμένουν:

Παραγωγικότητα;

Μετασχηματισμοί δεδομένων;

Ενοποίηση δεδομένων με άλλες πηγές.

Έλλειψη ιστορίας.

Καθαριότητα δεδομένων.

Εξάρτηση από τη διαθεσιμότητα της κύριας βάσης δεδομένων.

Εξάρτηση από τη δομή της κύριας βάσης δεδομένων.

Αρχιτεκτονική δύο επιπέδωνΗ αποθήκευση δεδομένων περιλαμβάνει τη δημιουργία μαρκετών δεδομένων χωρίς τη δημιουργία κεντρικού αποθετηρίου, με πληροφορίες που προέρχονται από μικρό αριθμό συστημάτων εγγραφής και περιορίζονται σε μια συγκεκριμένη θεματική περιοχή. Κατά την κατασκευή μαρκετών δεδομένων, χρησιμοποιούνται οι βασικές αρχές κατασκευής αποθηκών δεδομένων, οι οποίες θα συζητηθούν παρακάτω, ώστε να μπορούν να θεωρηθούν μικροσκοπικές αποθήκες δεδομένων. Τα πλεονεκτήματα των data marts είναι:

Η οικοδόμηση μιας πλήρους εταιρικής αποθήκης δεδομένων γίνεται συνήθως σε αρχιτεκτονική τριών επιπέδων(Θα πρέπει να σημειωθεί ότι εδώ η αρχιτεκτονική τριών επιπέδων δεν σημαίνει τη δομή «DB Application Server Client»). Στο πρώτο επίπεδο υπάρχουν διάφορες πηγές δεδομένων εσωτερικά συστήματα καταγραφής, συστήματα αναφοράς, εξωτερικές πηγές (δεδομένα πρακτορεία ειδήσεωνμακροοικονομικοί δείκτες). Το δεύτερο επίπεδο περιέχει μια κεντρική αποθήκη δεδομένων, όπου ρέουν πληροφορίες από όλες τις πηγές πρώτο επίπεδο, και πιθανώς μια λειτουργική αποθήκη δεδομένων (ODS). Η επιχειρησιακή αποθήκη δεν περιέχει ιστορικά δεδομένα και εξυπηρετεί δύο κύριες λειτουργίες. Πρώτον, είναι μια πηγή αναλυτικών πληροφοριών για επιχειρησιακή διαχείριση και, δεύτερον, τα δεδομένα προετοιμάζονται εδώ για μεταγενέστερη φόρτωση στην κεντρική αποθήκευση. Η προετοιμασία δεδομένων αναφέρεται στον μετασχηματισμό τους και στην εφαρμογή ορισμένων ελέγχων. Η παρουσία OSD είναι απλώς απαραίτητη όταν υπάρχουν διαφορετικοί κανονισμοί για τη λήψη πληροφοριών από πηγές. Το τρίτο επίπεδο στην περιγραφόμενη αρχιτεκτονική είναι ένα σύνολο μαρτύρων δεδομένων για συγκεκριμένο τομέα, η πηγή πληροφοριών για τις οποίες είναι η κεντρική αποθήκη δεδομένων. Τα data marts είναι εκεί που εργάζονται οι περισσότεροι τελικοί χρήστες.

Σχεδιασμός δομής σχεσιακής αποθήκης δεδομένων

Οι αποθήκες δεδομένων κατασκευάζονται με βάση ένα πολυδιάστατο μοντέλο δεδομένων. Ένα πολυδιάστατο μοντέλο δεδομένων περιλαμβάνει τον προσδιορισμό μεμονωμένων διαστάσεων (χρόνος, γεωγραφία, πελάτης, λογαριασμός) και γεγονότων (όγκος πωλήσεων, εισόδημα, ποσότητα αγαθών), τα οποία αναλύονται σύμφωνα με τις επιλεγμένες διαστάσεις. Ένα πολυδιάστατο μοντέλο δεδομένων μπορεί να εφαρμοστεί φυσικά τόσο σε πολυδιάστατα όσο και σε σχεσιακά DBMS. Στην τελευταία περίπτωση, εκτελείται σύμφωνα με το μοτίβο "αστέρι" ή "νιφάδα χιονιού". Αυτά τα σχήματα περιλαμβάνουν το διαχωρισμό πινάκων γεγονότων και πινάκων διαστάσεων. Κάθε πίνακας γεγονότων περιέχει λεπτομερή δεδομένα και ξένα κλειδιάστους πίνακες μετρήσεων. Η θεωρία της κατασκευής ενός πολυδιάστατου μοντέλου δεδομένων και η εφαρμογή του στο σχεσιακή δομήκαλύπτεται ευρέως τόσο στην ξένη όσο και στην εγχώρια λογοτεχνία.

Ένα από τα λιγότερο καλυπτόμενα θέματα είναι το πρόβλημα της αναπαράστασης ιεραρχιών. Ως παράδειγμα μέτρησης που χρησιμοποιείται ευρέως για την ανάλυση των δραστηριοτήτων μιας επιχείρησης και έχει ιεραρχική δομή, μπορούμε να αναφέρουμε έναν κατάλογο στοιχείων κόστους. Ας εξετάσουμε το μοντέλο των κέντρων κόστους (κέντρων κόστους) που παρουσιάζεται στο Σχ. 2.

Η κλασική επιστήμη των υπολογιστών λύνει το πρόβλημα της αναπαράστασης ιεραρχιών χρησιμοποιώντας αναδρομική επικοινωνία. Αυτή η απλή λύση σας επιτρέπει να τοποθετήσετε ένα δέντρο οποιουδήποτε βάθους και διάστασης σε ένα τραπέζι. Στην περίπτωσή μας, τα υπό εξέταση δεδομένα θα παρουσιαστούν με την ακόλουθη μορφή:

Ταυτότητα γονέα

1

Εταιρία

2

Ελεγχος

3

Υποδομή

4

Παραγωγή

5
6

Υπηρεσίες

7

Κατάθεση Α

8

Κατάθεση Β

Τραπέζι 1.

Ωστόσο, η απλότητα αυτής της λύσης κρύβει και το κύριο μειονέκτημά της. Δυστυχώς, η τυπική SQL δεν υποστηρίζει αναδρομικούς δείκτες, επομένως χρησιμοποιούνται άλλες μέθοδοι για την αναπαράσταση δέντρων στη βάση δεδομένων.

Η μέθοδος που προτείνει ο Joe Celko βασίζεται στη θεωρία συνόλων. Σε αυτή τη μέθοδο, όλοι οι κόμβοι του δέντρου διασχίζονται με σειρά άμεσης διέλευσης και για κάθε κόμβο συμπληρώνονται δύο τιμές - το αριστερό και το δεξιό όριο και για κάθε κόμβο του κλάδου δέντρου συμπληρώνεται πρώτα το αριστερό όριο και μόνο μετά το δεξιά - όταν επιστρέφετε από τους απογόνους στους γονείς. Έτσι, στο παράδειγμά μας, η αρίθμηση των κόμβων θα είναι η εξής:

Με αυτήν την αρίθμηση κόμβων, κάθε γονέας περιέχει παιδιά των οποίων το αριστερό και το δεξί περίγραμμα βρίσκονται στο διάστημα μεταξύ του αριστερού και του δεξιού περιγράμματος του γονέα. Ομοίως, όλοι οι γονείς ενός παιδιού έχουν ένα αριστερό περίγραμμα που είναι μικρότερο από το αριστερό περίγραμμα του παιδιού και ένα δεξιό περίγραμμα που είναι μεγαλύτερο από το δεξιό περίγραμμα του παιδιού. Επομένως, το ποσό του κόστους για ένα συγκεκριμένο κέντρο κόστους και όλα τα στοιχεία του μπορεί να ληφθεί σε ένα αίτημα. Για παράδειγμα, για να λάβετε το κόστος υποδομής, μπορείτε να εκτελέσετε το ακόλουθο ερώτημα SQL:

επιλέξτε sum (fact_table.cost)
από fact_table, dimension_table D1, dimension_table D2
όπου fact_table.dimension_id = D2.id
και Δ2.αριστερά >= Δ1.αριστερά
και Δ2.δεξιά<= D1.right
και D1.name = "Υποδομή"

Για να διευκολύνετε την εργασία με έναν τέτοιο κατάλογο, εκτός από το αριστερό και το δεξί πεδία, αξίζει να προσθέσετε δύο ακόμη πεδία: επίπεδο κόμβου "Level" στο δέντρο, "Is_leaf" μια σημαία που υποδεικνύει εάν ο κόμβος είναι φύλλο στο το δέντρο ή όχι. Έτσι, παίρνουμε τον πίνακα "dimension_table" (βλ. Πίνακα 2), ο οποίος σας επιτρέπει να αποθηκεύσετε ένα δέντρο οποιουδήποτε βάθους και διάστασης φωλιάς και σας επιτρέπει να επιλέξετε παιδιά και γονείς χρησιμοποιώντας ένα μόνο ερώτημα.

1

Εταιρία

2

Ελεγχος

3

Υποδομή

4

Παραγωγή

5
6

Υπηρεσίες

7

Κατάθεση Α

8

Κατάθεση Β

Πίνακας 2. Αναπαράσταση ιεραρχιών χρησιμοποιώντας αριστερά και δεξιά περιγράμματα

Μια άλλη μέθοδος, που περιγράφεται από τον Ralph Kimball, βασίζεται στην εισαγωγή ενός βοηθητικού πίνακα ("helper-table"), μέσω του οποίου ο πίνακας γεγονότων συνδέεται με τον πίνακα διαστάσεων. Αυτός ο βοηθητικός πίνακας αντικατοπτρίζει την ιεραρχική δομή της διάστασης και υπακούει στον ακόλουθο νόμο: Ο βοηθητικός πίνακας περιέχει ολόκληρο το σύνολο των ζευγών γονέα-παιδιού και το παιδί μπορεί να μην είναι άμεσο παιδί του γονέα. Η δομή ενός τέτοιου πίνακα και τα περιεχόμενά του φαίνονται στον Πίνακα 3.

Ταυτότητα γονέα

Ταυτότητα παιδιού

Απόσταση

1
1
1
1
1
1
1
1
2 2 0 Υ
3 3 0 Ν
3 5 1 Ν
3 6 1 Ν
4 4 0 Ν
4 7 1 Ν
4 8 1 Ν
5 5 0 Υ
6 6 0 Υ
7 7 0 Υ
8 8 0 Υ

Πίνακας 3. Δομή και περιεχόμενο του βοηθητικού πίνακα.

Τώρα συνδέοντας τον πίνακα γεγονότων (βλ. Εικ. 4) με το αναγνωριστικό παιδιού στον βοηθητικό πίνακα και τον πίνακα διαστάσεων με το αναγνωριστικό γονέα, μπορούμε να υπολογίσουμε το ποσό του κόστους για κάθε κέντρο κόστους και όλα τα στοιχεία του σε ένα ερώτημα, όπως στην προηγούμενη περίπτωση. Ταυτόχρονα, προσθέτοντας περιορισμούς στα πεδία «Απόσταση» και «Είναι φύλλο», μπορούμε εύκολα να υπολογίσουμε το κόστος για οποιοδήποτε επίπεδο στην ιεραρχία.

επιλέξτε sum (fact_table.cost)
από fact_table, dimension_table, helper_table
όπου fact_table.dimension_id = helper_table.child_id
και dimension_table.dimension_id = helper_table.parent_id
και dimension_table.name = "Υποδομή"
και helper_table.distance = 1

Το πρόβλημα του σχεδιασμού ιεραρχικών καταλόγων γίνεται ακόμη πιο περίπλοκο όταν μια διάσταση μπορεί να έχει πολλές εναλλακτικές ιεραρχίες και γίνεται εντελώς δυσεπίλυτο όταν είναι απαραίτητο να διατηρηθεί το ιστορικό αλλαγών του πίνακα διαστάσεων.

Γενικά, το πρόβλημα της αργής αλλαγής διαστάσεων είναι από μόνο του ενδιαφέρον, χωρίς να το περιπλέκει με μια ιεραρχία ταξινομητών. Στη βιβλιογραφία, στις περισσότερες περιπτώσεις θεωρείται στο πλαίσιο της «διάστασης που αλλάζει αργά το γεγονός». Αυτή η εργασία, πράγματι, μπορεί να επιλυθεί σχετικά απλά προσθέτοντας την ημερομηνία έναρξης και την ημερομηνία λήξης της εγγραφής στον πίνακα διαστάσεων. Η αλλαγή μιας καταχώρησης στον κατάλογο οδηγεί στο «κλείσιμο» της παλιάς καταχώρησης και στην προσθήκη μιας νέας. Τώρα, επιστρέφοντας στο παράδειγμα ενός καταλόγου στοιχείων κόστους, ένας χρήστης που θέλει να λάβει πληροφορίες για ένα τρέχον στοιχείο κόστους για οποιαδήποτε συγκεκριμένη ημερομηνία πρέπει να το συμπεριλάβει στη συνθήκη ερωτήματος SQL.

Ας υποθέσουμε ότι ο κατάλογος των στοιχείων κόστους είναι συνδεδεμένος με τον κατάλογο των λογιστικών λογαριασμών. Ένας ή περισσότεροι λογαριασμοί λογιστικού αντιπροσωπεύουν ένα στοιχείο κόστους. Πώς πρέπει μια αλλαγή σε οποιοδήποτε χαρακτηριστικό ενός στοιχείου κόστους να επηρεάσει τον κατάλογο των λογιστικών λογαριασμών; Αφενός, από την άποψη του λογιστικού σχεδίου, η αλλαγή ενός χαρακτηριστικού δεν οδηγεί σε αλλαγή στην ουσία του στοιχείου κόστους και οι λογιστικές εγγραφές μέσω του λογιστικού σχεδίου πρέπει να σχετίζονται με το ίδιο στοιχείο κόστους. Από την άλλη πλευρά, μια νέα καταχώρηση εμφανίστηκε στον κατάλογο των στοιχείων κόστους, η οποία πρέπει να συνδέεται με κάποιο τρόπο με τον κατάλογο των λογαριασμών. Αυτό το πρόβλημα μπορεί να λυθεί διαιρώντας τον πίνακα μέτρησης σε δύο - που περιέχει τρέχουσες πληροφορίες και περιέχει το ιστορικό αλλαγών οντοτήτων. Αυτή η προσέγγιση μας επιτρέπει επίσης να λύσουμε το πρόβλημα μιας ιεραρχικής διάστασης με την ανάγκη να διατηρήσουμε ένα ιστορικό αλλαγών σε εγγραφές σε αυτήν.

Ας το δούμε πιο αναλυτικά (βλ. Εικ. 5). Ο πίνακας "dimension_actual" είναι ένας πίνακας ιδιοτήτων με ένα πρωτεύον κλειδί του dimension_id που περιέχει τα έγκυρα χαρακτηριστικά διάστασης για σήμερα. Συνδεδεμένος με αυτό μέσω του ξένου κλειδιού dimension_id είναι ο ιστορικός πίνακας "dimension_history", ο οποίος περιέχει το ιστορικό των αλλαγών της εγγραφής, που καθορίζεται από τις ημερομηνίες έναρξης/λήξης της εγγραφής (πεδία date_start, date_end). Η καταχώρηση που είναι τρέχουσα σήμερα υπάρχει και σε αυτήν με ανοιχτή ημερομηνία λήξης. Ο πίνακας γεγονότων "fact_table" συνδέεται με τον πίνακα διαστάσεων μέσω ενός βοηθητικού πίνακα "helper_table", ο οποίος αντικατοπτρίζει την ιεραρχική δομή της διάστασης.

Η περιγραφόμενη προσέγγιση επιτρέπει: πρώτον, την αποθήκευση και την εργασία με τη διάσταση ως μη ισορροπημένο δέντρο. Δεύτερον, να εκτελέσετε γρήγορα ερωτήματα για τα οποία το ιστορικό αλλαγών διαστάσεων δεν είναι σημαντικό (ο πίνακας που περιέχει το ιστορικό δεν εμπλέκεται). τρίτον, σας επιτρέπει να παρακολουθείτε το ιστορικό των αλλαγών σε μια διάσταση και, τέλος, διαχωρίζει την αντανάκλαση της ιστορίας και της ιεραρχίας, γεγονός που απλοποιεί σημαντικά τη διατήρηση της διάστασης.

Το τρίτο σημαντικό σημείο που πρέπει συχνά να αντιμετωπίσει ένας προγραμματιστής αποθήκευσης σχετίζεται με τις συγκεντρωτικές τιμές. Αυτή η κατηγορία προβλημάτων μπορεί να χωριστεί σε δύο υποκατηγορίες. Το πρώτο εξετάζει τα προβλήματα δημιουργίας και διατήρησης αδρανών με βάση τα διαθέσιμα λεπτομερή δεδομένα και καλύπτεται αρκετά ευρέως στη βιβλιογραφία. Το δεύτερο οφείλεται στο γεγονός ότι οι πηγές δεδομένων για την αποθήκη δεν παρέχουν λεπτομερείς τιμές, αλλά ένα συγκεκριμένο σύνολο συγκεντρωτικών δεδομένων. Αυτή η κατάσταση είναι χαρακτηριστική κατά τη δημιουργία αποθηκών δεδομένων για εταιρείες διαχείρισης και κρατικές ρυθμιστικές αρχές που συλλέγουν πολλές φόρμες αναφοράς.

Μια ακραία περίπτωση αυτής της προσέγγισης είναι ένα μοντέλο που μπορεί να ονομαστεί συμβατικά «τιμή-δείκτη». Η ουσία του είναι ότι συλλέγεται ένα μεγάλο σύνολο δεικτών που χαρακτηρίζουν τις χρηματοοικονομικές και οικονομικές δραστηριότητες της επιχείρησης. Αυτοί οι δείκτες μπορεί να σχετίζονται λειτουργικά μεταξύ τους ή να μην αντικατοπτρίζουν τις ίδιες τιμές, αλλά με διαφορετικούς βαθμούς λεπτομέρειας, κ.λπ. Όταν προσπαθεί να αναπαραστήσει τέτοια δεδομένα με τη μορφή ενός πολυδιάστατου μοντέλου, ο προγραμματιστής αντιμετωπίζει σημαντικά προβλήματα και πολύ συχνά ακολουθεί το μονοπάτι της δημιουργίας όχι μιας αποθήκης δεδομένων, αλλά μιας αποθήκης φορμών. Μια τυπική αποθήκευση φόρμας βασίζεται σε τρεις διαστάσεις: οικονομικούς δείκτες, χρόνος, φόρμες αναφοράς. πίνακες γεγονότων τιμές οικονομικών δεικτών και βοηθητικοί πίνακες που περιγράφουν τον τρόπο με τον οποίο οι δείκτες και οι τιμές τους βρίσκονται σε φόρμες αναφοράς. Κατά την ανάλυση τέτοιων δεδομένων, ο αναλυτής θα αντιμετωπίσει σημαντικές δυσκολίες, κυρίως λόγω του γεγονότος ότι οι δείκτες διαφορετικών μορφών δεν μπορούν να συγκριθούν μεταξύ τους. Το μόνο που του απομένει είναι να παρακολουθεί τις αλλαγές στους δείκτες μιας φόρμας με την πάροδο του χρόνου.

συμπέρασμα

Κατά την υλοποίηση έργων αποθήκης δεδομένων, προκύπτει ένας αριθμός κοινών εργασιών που είναι ανεξάρτητες θεματική ενότηταεπεξεργασμένες πληροφορίες. Τέτοιες εργασίες περιλαμβάνουν:

Αυτό το άρθρο εξέτασε πιθανές λύσεις σε αυτά τα προβλήματα. Ειδικότερα, δόθηκαν τρόποι υλοποίησης ιεραρχικών διαστάσεων με την εισαγωγή πρόσθετων χαρακτηριστικών (αριστερό και δεξιό περίγραμμα), καθώς και με την εισαγωγή ενός πρόσθετου πίνακα «βοηθός-πίνακας». Ωστόσο, σε όλα τα προβλήματα που εξετάζονται, υπάρχουν άλυτα ζητήματα που απαιτούν περαιτέρω έρευνα. Ειδικότερα, η περίπτωση των ιεραρχικών διαστάσεων με την ανάγκη διατήρησης ιστορικού αλλαγών που έχουν συνδέσεις με κάποιους άλλους καταλόγους είναι δύσκολο να εφαρμοστεί. Αυτό το άρθρο δεν περιλαμβάνει ερωτήσεις σχετικά με μεθόδους καθαρισμού δεδομένων και αλγόριθμους για τη φόρτωση δεδομένων στο χώρο αποθήκευσης. Αυτά τα θέματα απαιτούν ξεχωριστή εξέταση.

ΒΙΒΛΙΟΓΡΑΦΙΑ

1.

Joerg Reinschmidt, Allison Francoise. Οδηγός πιστοποίησης Business Intelligence. Κόκκινα βιβλία της IBM;

2.

Inmon W. Δημιουργία της αποθήκης δεδομένων. Νέα Υόρκη: John Willey & Sons, 1992;

3.

Σπίρλι, Έρικ. Εταιρικές αποθήκες δεδομένων. Σχεδιασμός, ανάπτυξη, υλοποίηση. Ενταση ΗΧΟΥ. 1: Per. από τα Αγγλικά M.: Williams Publishing House, 2001;

4.

Τζο Σέλκο. Trees in SQL: Intelligent Enterprise, 20 Οκτωβρίου 2000.

5.

Donald E. Knuth. The Art of Programming, τόμος 1. Βασικοί αλγόριθμοι, 3η έκδ.: M.: Williams Publishing House, 2000.;

6.

Ραλφ Κίμπολ. Βοήθεια για Ιεραρχίες: DBMS Σεπτέμβριος 1998;

7.

Ραλφ Κίμπολ. Διαστάσεις που αλλάζουν αργά: DBMS Απρίλιος 1996;

8.

Στατιστικό Λεξικό: M. "Finance and Statistics", 1989;

9.

Duke V, Samoilenko A, Data mining: training course. Αγία Πετρούπολη: Peter, 2001;

10.

Erhard Rahm, Hong Hai Do: Data Cleaning: Problems and Current Approaches. IEEE Data Engineering Bulletin 23(4): 3-13 (2000);

11.

Ralph Kimball: The Data Warehouse Toolkit: Practical Techniques for Building Dimensional Data Warehouses. John Wiley 1996;

12.

Maria Sueli Almeida, Missao Ishikawa, Joerg Reinschmidt, Torsten Roeber, Getting Started with Data Warehouse και Business Intelligence. Κόκκινα βιβλία της IBM;

13.

Nigel Pendse, OLAP Architectures: The OLAP Report, http://www.olapreport.com/Architectures.htm#top.

5.1. Οργάνωση δεδομένων σε εταιρικά πληροφοριακά συστήματα.

Λαμβάνοντας υπόψη το CIS στο πιο απλοποιημένο επίπεδο, μπορούμε να πούμε ότι περιέχει ένα εταιρικό δίκτυο υπολογιστών (υπολογιστικό) και ένα εξειδικευμένο πακέτο λογισμικού εφαρμογών (APP) για την επίλυση προβλημάτων στη θεματική περιοχή. Με τη σειρά τους, τόσο οι ΣΔΙΤ όσο και ένα δίκτυο υπολογιστών περιλαμβάνουν ουσιαστικά τη χρήση δεδομένων πληροφοριών σχετικά με την κατάσταση και την ανάπτυξη συστημάτων που ελέγχονται και διαχειρίζονται από αυτά. Ιστορικά, το CIS αποτελείται από χωριστά διακλαδισμένα υποσυστήματα μεμονωμένων επιχειρήσεων, διασυνδεδεμένα και συχνά αντιπροσωπεύουν ένα ιεραρχικό σύστημα. Είναι φυσικό να υποθέσουμε ότι τέτοια υποσυστήματα έχουν και τις δικές τους πηγές και τις δικές τους θέσεις αποθήκευσης για σχετικά δεδομένα. Με το συνδυασμό σε ένα ενιαίο σύστημα, προκύπτουν ερωτήματα σχετικά με την κοινή σωστή χρήση δεδομένων που βρίσκονται γεωγραφικά σε διαφορετικές τοποθεσίες αποθήκευσης. Επομένως, για να διαχειριστεί με επιτυχία μια ένωση παραγωγής εξοπλισμένη με CIS, χρειάζεται ένα αξιόπιστο σύστημα συλλογής, αποθήκευσης και επεξεργασίας δεδομένων. Με άλλα λόγια, απαιτείται μια ενοποιημένη υποδομή πληροφοριών που να ικανοποιεί στρατηγικά έργα BI (Business Intelligence) ή μια ολοκληρωμένη βάση για αποθήκευση και χρήση δεδομένων. Ο κύριος στόχος της ενοποίησης δεδομένων είναι να αποκτήσει μια ενιαία και πλήρη εικόνα της κατάστασης των εταιρικών επιχειρηματικών δεδομένων. Η ίδια η ενσωμάτωση είναι μια πολύπλοκη διαδικασία, βάσει της οποίας είναι σκόπιμο να επισημανθούν:

Τεχνολογίες,

Προϊόντα,

Εφαρμογές.

Μέθοδοιείναι προσεγγίσεις για την ενοποίηση δεδομένων.

τεχνολογίες– πρόκειται για διαδικασίες που εφαρμόζουν ορισμένες μεθόδους ενοποίησης δεδομένων.

Προϊόντα– πρόκειται για εμπορικές λύσεις που υποστηρίζουν τη μία ή την άλλη τεχνολογία ενοποίησης δεδομένων.

Εφαρμογές– πρόκειται για έτοιμες τεχνικές λύσεις που παρέχονται από προγραμματιστές σύμφωνα με τις επιθυμίες των πελατών - πελατών.

Ανάλογα με την πολυπλοκότητα των εταιρικών πληροφοριακών συστημάτων και τις εργασίες που έχουν σχεδιαστεί να επιλύουν, η οργάνωση των δεδομένων σε αυτά ποικίλλει κάπως. Ειδικότερα, στο CIS, που έχει σχεδιαστεί για να διασφαλίζει την αποτελεσματική διαχείριση των επιχειρηματικών διαδικασιών τόσο των μεμονωμένων υποκαταστημάτων όσο και της εταιρείας στο σύνολό της, συνηθίζεται να μιλάμε για την παρουσία εταιρικών βάσεων δεδομένων. Στα εταιρικά πληροφοριακά συστήματα που χρησιμοποιούνται στα υψηλότερα επίπεδα διαχείρισης και συνδέονται κυρίως με τις διαδικασίες επιχειρησιακής ανάλυσης και λήψης αποφάσεων, η αποθήκη δεδομένων ορολογίας χρησιμοποιείται στη διαδικασία σχεδιασμού, σχεδιασμού και πρόβλεψης διαφόρων τύπων δραστηριοτήτων διαχείρισης. Είναι σκόπιμο να σημειωθεί ότι η φράση ενσωματωμένη αποθήκευση δεδομένωνεγγενής και στα δύο.



5.2. Εταιρικές βάσειςδεδομένα και απαιτήσεις για αυτό

Ως ολοκληρωμένη αποθήκευση δεδομένων σε όλο το σύστημα, η εταιρική βάση δεδομένων έχει σχεδιαστεί για να παρέχει πληροφορίες για την αποτελεσματική διαχείριση όλων των επιχειρηματικών διαδικασιών και τμημάτων της εταιρείας. Η ενοποίηση δεδομένων περιλαμβάνει τη δημιουργία μιας νέας δομής που περιλαμβάνει οργανικά δεδομένα από τις βάσεις δεδομένων μεμονωμένων ξεχωριστών τμημάτων, επομένως μια τέτοια δομή πρέπει να πληροί ορισμένες απαιτήσεις:

· Απλή και φιλική προς το χρήστη εισαγωγή δεδομένων στη βάση δεδομένων,

· Αποθήκευση δεδομένων σε μορφή που δεν θα οδηγήσει σε υπερβολική ανάπτυξη δεδομένων,

· Διαθεσιμότητα γενικών πληροφοριών στους υπαλλήλους όλων των τμημάτων της εταιρείας, υπό την προϋπόθεση της υποχρεωτικής διαφοροποίησης των δικαιωμάτων πρόσβασης,

· Βρείτε και ανακτήστε γρήγορα τις απαιτούμενες πληροφορίες,

· Ταξινόμηση και φιλτράρισμα των απαραίτητων δεδομένων,

· Ομαδοποίηση δεδομένων με το ίδιο όνομα,

· Ενδιάμεσοι και τελικοί υπολογισμοί σε πεδία,

· Μετασχηματισμός και σαφήνεια των δεδομένων εξόδου,

· Επεκτασιμότητα,

· Προστασία από τυχαίες βλάβες, ανεπανόρθωτη απώλεια δεδομένων και μη εξουσιοδοτημένη πρόσβαση.

Επιπλέον, κατά την ενσωμάτωση χωριστών (κατανεμημένων) βάσεων δεδομένων σε μια ενιαία εταιρική βάση δεδομένων, είναι σημαντικό να διασφαλίζεται η δυνατότητα εργασίας με τη βάση δεδομένων με τέτοιο τρόπο ώστε ο χρήστης να λειτουργεί μαζί της όπως με μια μη κατανεμημένη.

Η δημιουργία μιας ολοκληρωμένης εταιρικής βάσης δεδομένων είναι δυνατή χρησιμοποιώντας διάφορες μεθόδους, οι κυριότερες από τις οποίες είναι:

· Ενοποίηση,

· Ομοσπονδιοποίηση,

· Εξάπλωση.

5.3. Χαρακτηριστικά λύσεων ολοκλήρωσης εταιρικών βάσεων δεδομένων

Ενοποίηση.Κάτω από ενοποίησησυνήθως αναφέρεται στην προσθήκη ομώνυμων δεδομένων. Παρόμοιος όρος χρησιμοποιείται ευρέως στον τραπεζικό κλάδο, όπου σχηματίζεται ένας ετήσιος ενοποιημένος ισολογισμός, ο οποίος καθιστά δυνατή την παρουσίαση όλων των στοιχείων ενεργητικού και παθητικού της μητρικής τράπεζας μαζί με τα υποκαταστήματά της.

Σε σχέση με μια εταιρεία, όταν χρησιμοποιείται αυτή η μέθοδος, τα δεδομένα αντιγράφονται και συλλέγονται από πρωτεύουσες βάσεις δεδομένων (DB - Slave) με ενσωμάτωση σε μια ενιαία θέση αποθήκευσης (DB - Master). Κατά κανόνα, ως τέτοια θέση αποθήκευσης επιλέγεται ο διακομιστής του κεντρικού (κεντρικού) γραφείου (Εικ. 5.1).

Εικ.5.1. Μέθοδος ενοποίησης δεδομένων

Τα δεδομένα στη βάση δεδομένων Master χρησιμοποιούνται για αναφορά, ανάλυση, ανάπτυξη και λήψη αποφάσεων, καθώς και ως πηγή δεδομένων για άλλα υποκαταστήματα της εταιρείας.

Οι πιο κοινές τεχνολογίες για την υποστήριξη τέτοιων λύσεων κατά τη διάρκεια της ενοποίησης είναι οι ακόλουθες τεχνολογίες:

· Εξαγωγή, μετασχηματισμός και φόρτωση - ETL (Extract Transform Load).

· Διαχείριση εταιρικού περιεχομένου - ECM (Enterprise Content Management).

Τα πλεονεκτήματα της μεθόδου ενοποίησης είναι:

1. Ικανότητα μεταμόρφωσης(αναδιάρθρωση, συμφωνία, καθαρισμός ή/και συνάθροιση) σημαντικών όγκων δεδομένων κατά τη διαδικασία μεταφοράς τους από τα κύρια συστήματα σε τελικές τοποθεσίες αποθήκευσης μέσω της τεχνολογίας ETL,

2. Δυνατότητα διαχείρισης μη δομημένων δεδομένων, όπως έγγραφα, αναφορές και σελίδες χάρη στις τεχνολογικές λύσεις ECM.

Για να εργαστείτε με την ενοποιημένη βάση δεδομένων CIS, ειδική επιχειρηματικές εφαρμογές,που σας επιτρέπουν να δημιουργείτε ερωτήματα σε δεδομένα βάσης δεδομένων, αναφορές και, βάσει αυτών, να πραγματοποιείτε ανάλυση δεδομένων.

Το μειονέκτημα της ενοποίησης μέσω ενοποίησης είναι ότι τα ενοποιημένα δεδομένα στην ενσωματωμένη θέση αποθήκευσης δεν μπορούν να ενημερωθούν συγχρονισμένα με ενημερώσεις δεδομένων στα κύρια συστήματα λόγω διενέξεων συγχρονισμού.

Υπάρχει μια χρονική καθυστέρηση μεταξύ των στιγμών ενημέρωσης δεδομένων στα κύρια συστήματα και στην τελική θέση αποθήκευσης.

Αυτή η καθυστέρηση μπορεί να κυμαίνεται από μερικά δευτερόλεπτα έως αρκετές ώρες ή και ημέρες.

Ομοσπονδιοποίηση.Κάτω από ομοσπονδιοποίησησυνήθως αναφέρεται σε μια ένωση. Ένας παρόμοιος όρος χρησιμοποιείται συχνά στην πολιτική κατά τη διευθέτηση των συνόρων ενός κράτους (για παράδειγμα, Γερμανία, Ρωσική Ομοσπονδία, ΗΠΑ).

Η διαδικασία ομοσπονδιοποίησης δεδομένων σε μια εταιρική βάση δεδομένων είναι η δημιουργία μιας εικονικής (φαινομενικής) εικόνας που συνδυάζει πολλά πρωτεύοντα αρχεία δεδομένων σε ένα ενιαίο εικονικό σύνολο (βλ. Εικ. 5.2). Στην πραγματικότητα, η ομοσπονδιοποίηση δεδομένων συνίσταται στην εξαγωγή δεδομένων από πρωτεύοντα συστήματα με βάση εξωτερικές απαιτήσεις. Η διαχείριση της εταιρικής βάσης δεδομένων που είναι ενσωματωμένη σύμφωνα με την ομοσπονδιακή μέθοδο πραγματοποιείται από επεξεργαστής ομοσπονδιοποίησης.

Εικ.2. Μέθοδος ομοσπονδιοποίησης δεδομένων

Κατά την πρόσβαση σε δεδομένα από μια εικονική βάση δεδομένων, οποιαδήποτε επιχειρηματική εφαρμογή δημιουργεί ένα αίτημα στην εικονική εικόνα. Με βάση αυτό το αίτημα, ο ομοσπονδιακός επεξεργαστής ανακτά δεδομένα από τα αντίστοιχα πρωτεύοντα συστήματα, τα ενσωματώνει σύμφωνα με την εικονική εικόνα και παρέχει το αποτέλεσμα στην επιχειρηματική εφαρμογή που δημιούργησε το αίτημα. Στην περίπτωση αυτή, πραγματοποιούνται όλοι οι απαραίτητοι μετασχηματισμοί δεδομένων όταν εξάγονται από τα πρωτεύοντα συστήματα.

Η υποστήριξη για την ομοσπονδιακή προσέγγιση για την ενοποίηση δεδομένων παρέχεται από την τεχνολογία Enterprise Information integration (E I I), που σημαίνει Ενοποίηση εταιρικών πληροφοριών.

Ένα ιδιαίτερο χαρακτηριστικό της λύσης ομοσπονδίας είναι ότι χρησιμοποιεί ο επεξεργαστής ομοσπονδιοποίησης μεταδεδομένα(γνώση), που περιέχει δεδομένα για τη σύνθεση και τα χαρακτηριστικά της εικονικής εικόνας, την ποσότητα των δεδομένων, τις σημασιολογικές συνδέσεις μεταξύ τους και τους τρόπους πρόσβασης σε αυτά, βοηθώντας τη συνομοσπονδιακή λύση να βελτιστοποιήσει την πρόσβαση στα πρωτεύοντα συστήματα.

Τα κύρια πλεονεκτήματα της ομοσπονδιακής προσέγγισης είναι:

· δυνατότητα πρόσβασης σε τρέχοντα δεδομένα χωρίς τη δημιουργία πρόσθετης νέας βάσης δεδομένων,

σκοπιμότητα εφαρμογής μετά την εξαγορά ή τη συγχώνευση εταιρειών,

· αναγκαιότητα σε περιπτώσεις όπου, για λόγους ασφαλείας, υπάρχουν περιορισμοί αδειοδότησης στην αντιγραφή δεδομένων από πρωτεύοντα συστήματα,

· να χρησιμοποιούν, εάν είναι απαραίτητο, την υψηλή αυτονομία των τοπικών τμημάτων της εταιρείας και την ευελιξία του κεντρικού ελέγχου των δραστηριοτήτων τους,

· υψηλός βαθμός χρησιμότητας για μεγάλες διεθνικές εταιρείες.

Τα μειονεκτήματα της προσέγγισης περιλαμβάνουν:

· Μειωμένη παραγωγικότητα λόγω πρόσθετου κόστους πρόσβασης σε πολλαπλές πηγές δεδομένων,

Η ομοσπονδιοποίηση είναι πιο κατάλληλη για την ανάκτηση μικρών ποσοτήτων δεδομένων,

· υψηλές απαιτήσεις για την ποιότητα των πρωτογενών δεδομένων.

Διάδοση.Κάτω από διάδοσησυνήθως αναφέρεται στην εδαφική μεταφορά πολλαπλασιασμένων αντικειμένων. Η διανομή δεδομένων αναφέρεται στον πολλαπλασιασμό των πρωτογενών βάσεων δεδομένων και τη μετακίνησή τους από το ένα μέρος στο άλλο. Κατά την εφαρμογή αυτής της μεθόδου επιχειρηματικές εφαρμογέςλειτουργούν online και μετακινούν δεδομένα σε προορισμούς ανάλογα με ορισμένα συμβάντα που συμβαίνουν. Για αυτήν την τεχνική λύση, το ζήτημα της ενημέρωσης δεδομένων που είναι δυνατή σε σύγχρονες ή ασύγχρονες λειτουργίες καθίσταται σημαντικό.

Παραδείγματα τεχνολογιών που υποστηρίζουν την εφαρμογή της μεθόδου διάδοσης δεδομένων είναι:

· Ενσωμάτωση εταιρικών εφαρμογών EAI - Enterprise Application Integration,

· Αντιγραφή εταιρικών δεδομένων EDR – Enterprise Data Replication.

Η γενικευμένη δομή της εφαρμογής της μεθόδου διάδοσης δεδομένων μοιάζει με το Σχ. 5.3.

Εικ.5.3. Μέθοδος Διάδοσης Δεδομένων

Ένα χαρακτηριστικό γνώρισμα της μεθόδου διανομής δεδομένων είναι η εγγυημένη παράδοση δεδομένων στο σύστημα προορισμού με ελάχιστη καθυστέρηση, κοντά σε πραγματικό χρόνο.

Ο συνδυασμός τεχνολογιών ολοκλήρωσης (EAI) και αναπαραγωγής (EDR) στη μέθοδο παρέχει πολλαπλά πλεονεκτήματα, με τη μορφή των ακόλουθων πλεονεκτημάτων:

· Υψηλή απόδοση,

· Δυνατότητα αναδιάρθρωσης και καθαρισμού δεδομένων,

· Εξισορρόπηση φορτίου με δημιουργία αντιγράφων ασφαλείας και επαναφορά δεδομένων.

Υβριδική προσέγγιση.Η πραγματικότητα της οικονομικής δραστηριότητας είναι τέτοια που δεν υπάρχουν δύο πανομοιότυπες επιχειρήσεις, πολύ λιγότερο δύο πανομοιότυπες εταιρείες. Αυτή η περίσταση αφήνει το στίγμα της στη διαδικασία δημιουργίας και πλήρωσης της ΚΑΚ. Αυτό ισχύει πλήρως για τις μεθόδους ενσωμάτωσης δεδομένων σε βάσεις δεδομένων. Για το λόγο αυτό, πολλά CIS χρησιμοποιούν το λεγόμενο υβρίδιομια προσέγγιση που περιλαμβάνει ταυτόχρονα πολλές μεθόδους ολοκλήρωσης Παραδείγματα αυτής της προσέγγισης είναι τεχνολογίες που παρέχουν μια συνεπή εικόνα των πληροφοριών των πελατών:

· Ενσωμάτωση δεδομένων πελατών σε συστήματα CDI – Ενσωμάτωση δεδομένων πελατών,

· Ενσωμάτωση δεδομένων πελατών σε ενότητες CRM – Customer Relations Management.

Ειδικότερα, η εφαρμογή του CDI μπορεί να προσεγγιστεί με διάφορους τρόπους.

Ο απλούστερος τρόπος είναι να δημιουργήσετε μια ενοποιημένη βάση δεδομένων πελατών που περιέχει δεδομένα από πρωτεύοντα συστήματα. Σε αυτήν την περίπτωση, η καθυστέρηση πληροφοριών μπορεί να ρυθμιστεί χρησιμοποιώντας διάφορους τρόπους ενοποίησης: λειτουργική ή παρτίδα, ανάλογα με τη συχνότητα ενημέρωσης αυτών των πληροφοριών.

Η δεύτερη μέθοδος είναι η ομοσπονδιοποίηση δεδομένων, όταν είναι εικονική επιχειρηματικές παρουσιάσειςδεδομένα πελατών που περιέχονται στα κύρια συστήματα. Και το αρχείο μεταδεδομένων μπορεί να περιέχει κοινά βασικά στοιχεία που μπορούν να χρησιμοποιηθούν για τη συσχέτιση πληροφοριών πελατών.

Έτσι, τα γενικά (για παράδειγμα, λεπτομέρειες) δεδομένα πελατών μπορούν να ενοποιηθούν ως τα πιο στατικά δεδομένα. Και πιο δυναμικά δεδομένα (για παράδειγμα, πληροφορίες σχετικά με παραγγελίες) μπορούν να ομοσπονδιοποιηθούν.

Επιπλέον, η υβριδική προσέγγιση μπορεί να επεκταθεί χρησιμοποιώντας μια μέθοδο διάδοσης δεδομένων. Για παράδειγμα, ένας πελάτης που χρησιμοποιεί τις υπηρεσίες ενός ηλεκτρονικού καταστήματος αλλάζει τα στοιχεία του κατά τη διάρκεια της υπηρεσίας. Αυτές οι αλλαγές μπορούν να αποσταλούν στο ενοποιημένο τμήμα της βάσης δεδομένων και από εκεί να διανεμηθούν σε όλα τα κύρια συστήματα που περιέχουν δεδομένα για τους πελάτες του καταστήματος.

Έχοντας υπόψη τα πλεονεκτήματα και τα μειονεκτήματα κάθε μεθόδου, καλό είναι να ακολουθήσετε μια δημιουργική προσέγγιση στην εφαρμογή και την κοινή χρήση τους.

Για παράδειγμα, συνιστάται η χρήση ομοσπονδιοποίησης δεδομένων σε περιπτώσεις όπου το κόστος της ενοποίησης δεδομένων υπερβαίνει τα επιχειρηματικά οφέλη που παρέχει η ενοποίηση. Ειδικότερα, η άμεση διεκπεραίωση των αιτημάτων και η προετοιμασία εκθέσεων είναι ακριβώς μια τέτοια κατάσταση.

Η πρακτική εφαρμογή της μεθόδου διανομής δεδομένων είναι πολύ διαφορετική, τόσο ως προς την απόδοση όσο και ως προς τις δυνατότητες αναδιάρθρωσης και καθαρισμού δεδομένων.

5.4. Έννοιες και δομικές λύσεις αποθηκών δεδομένων

Αποθήκευση δεδομένων -Πρόκειται για μια ολοκληρωμένη συσκευή αποθήκευσης πληροφοριών προσανατολισμένη στο θέμα που συγκεντρώνει εξωτερικά και λειτουργικά δεδομένα, καθώς και δεδομένα από άλλα συστήματα, βάσει των οποίων χτίζονται οι διαδικασίες λήψης αποφάσεων και ανάλυσης δεδομένων.

Σε αντίθεση με τις βάσεις δεδομένων και τις τράπεζες δεδομένων, η βάση των αποθηκών δεδομένων δεν είναι εσωτερική, αλλά εξωτερικές πηγέςδεδομένα: διάφορα Πληροφοριακά συστήματα, ηλεκτρονικά αρχεία, προσβάσιμοι στο κοινό ηλεκτρονικοί κατάλογοι, βιβλία αναφοράς και συλλογές.

Η έννοια των αποθηκών δεδομένων βασίζεται σε δύο βασικές ιδέες:

1. Ενσωμάτωση διαχωρισμένων λεπτομερών δεδομένων (που περιγράφουν συγκεκριμένα γεγονότα, ιδιότητες, γεγονότα κ.λπ.) σε ένα ενιαίο αποθετήριο.

2. Διαχωρισμός συνόλων δεδομένων και εφαρμογών που χρησιμοποιούνται για επεξεργασία και ανάλυση.

Μια αποθήκη δεδομένων οργανώνεται σε περιπτώσεις όπου είναι απαραίτητο να αποκτηθούν:

· Ενσωμάτωση τρεχουσών και ιστορικών τιμών δεδομένων,

· Συνδυασμός δεδομένων από διαφορετικές πηγές,

· Δημιουργία αξιόπιστης πλατφόρμας δεδομένων για αναλυτικούς σκοπούς,

· Διασφάλιση ομοιογένειας δεδομένων στον οργανισμό,

· Διευκόλυνση της εφαρμογής εταιρικών προτύπων δεδομένων χωρίς αλλαγή των υφιστάμενων λειτουργικών συστημάτων,

· Παροχή ευρείας ιστορικής προοπτικής και ευκαιριών ανάλυσης των τάσεων ανάπτυξης.

Ιστορικά, οι αποθήκες δεδομένων κατασκευάζονταν χρησιμοποιώντας ένα, δύο ή τρία επίπεδα.

Σχέδια μονού επιπέδουπροορίζονταν αρχικά για τις απλούστερες αρχιτεκτονικές, οι οποίες περιλαμβάνουν λειτουργικό DSS, με ανεπαρκώς ανεπτυγμένη πληροφοριακή υποδομή, όταν η ανάλυση πραγματοποιείται χρησιμοποιώντας δεδομένα από λειτουργικά συστήματα, σύμφωνα με την αρχή: δεδομένα - μορφές παρουσίασης.

Τα πλεονεκτήματα τέτοιων σχεδίων είναι:

· Γρήγορη μεταφορά δεδομένων από λειτουργικά συστήματα σε εξειδικευμένο σύστημα χωρίς ενδιάμεσους συνδέσμους,

· Ελάχιστο κόστος μέσω της χρήσης μιας ενιαίας πλατφόρμας.

Ελαττώματα:

· Στενό εύρος ζητημάτων που πρέπει να επιλυθούν λόγω μιας ενιαίας πηγής δεδομένων,

· Χαμηλή ποιότητα δεδομένων λόγω έλλειψης βήματος καθαρισμού.

Σχέδια δύο επιπέδωνπαρέχετε μια αλυσίδα: δεδομένα – μάρκες δεδομένων – φόρμες παρουσίασης. Χρησιμοποιούνται σε εταιρείες με μεγάλο αριθμό ανεξάρτητων τμημάτων που χρησιμοποιούν τις δικές τους τεχνολογίες πληροφοριών.

Πλεονεκτήματα:

· Οι προθήκες που χρησιμοποιούνται έχουν σχεδιαστεί για να απαντούν σε συγκεκριμένο αριθμό ερωτήσεων,

· Είναι δυνατή η βελτιστοποίηση των δεδομένων στις βιτρίνες, γεγονός που βελτιώνει την παραγωγικότητα.

Ελαττώματα:

· Δυσκολία στη διασφάλιση της συνέπειας των δεδομένων λόγω της επανειλημμένης επανάληψης τους στις βιτρίνες,

· Πιθανή πολυπλοκότητα πλήρωσης βιτρινών με μεγάλο αριθμό πηγών δεδομένων,

· Λόγω της έλλειψης ενοποίησης δεδομένων σε εταιρικό επίπεδο, δεν υπάρχει ενιαία εικόνα της επιχείρησης.

Η εξέλιξη της ανάπτυξης οδήγησε στο γεγονός ότι η κατασκευή μιας πλήρους αποθήκης δεδομένων για σύγχρονα εταιρικά συστήματα άρχισε να πραγματοποιείται χρησιμοποιώντας αρχιτεκτονική τριών επιπέδων (βλ. Εικ. 5.4).

Επί πρώταεπίπεδο υπάρχουν διάφορα συστήματα καταγραφής που αποτελούν πηγές δεδομένων. Τέτοια συστήματα μπορεί να είναι συστήματα προγραμματισμού πόρων επιχειρήσεων (ERP - Enterprise Resource Planning), συστήματα αναφοράς (λειτουργικά), εξωτερικές πηγές ή συστήματα που παρέχουν δεδομένα από φορείς πληροφοριών κ.λπ.

Επί δεύτεροςΤο επίπεδο περιέχει μια κεντρική αποθήκευση, η οποία συλλέγει δεδομένα από όλες τις πηγές του πρώτου επιπέδου, καθώς και μια λειτουργική αποθήκη δεδομένων, η οποία έχει σχεδιαστεί για να εκτελεί δύο λειτουργίες:

· Η αποθήκη είναι μια πηγή αναλυτικών πληροφοριών που χρησιμοποιούνται για τη λειτουργική διαχείριση,

· Στην επιχειρησιακή αποθήκη προετοιμάζονται δεδομένα για μεταγενέστερη φόρτωση στην κεντρική αποθήκη. Η προετοιμασία δεδομένων σημαίνει τη διενέργεια ελέγχων και τη μετατροπή δεδομένων σε σχέση με διάφορους κανονισμούς για τη λήψη δεδομένων από το πρώτο επίπεδο.

Τρίτοςτο επίπεδο είναι μια συλλογή θεματικών μαρτύρων δεδομένων.

μάρκες δεδομένων -Πρόκειται για σχετικά μικρές μονάδες δίσκου προσανατολισμένες στη λειτουργία, το περιεχόμενο των οποίων βοηθά στην επίλυση των αναλυτικών προβλημάτων των επιμέρους τμημάτων της εταιρείας. Τα data marts είναι ουσιαστικά υποσύνολα δεδομένων από μια αποθήκη. Ταυτόχρονα, οι τελικοί χρήστες έχουν τη δυνατότητα πρόσβασης σε αναλυτικά δεδομένα από την αποθήκη σε περίπτωση που δεν υπάρχουν αρκετά στοιχεία στη βιτρίνα, καθώς και να αποκτήσουν μια πληρέστερη εικόνα της κατάστασης της επιχείρησης.

Εικ.5.4. Αρχιτεκτονική Αποθήκης Δεδομένων

Οι κύριες τεχνολογικές λειτουργίες των αποθηκών δεδομένων που οργανώνονται με αυτόν τον τρόπο είναι:

· Εξαγωγήδεδομένα είναι η διαδικασία μεταφοράς δεδομένων από ετερογενείς πηγές σε μια λειτουργική αποθήκη,

· Μετατροπήδεδομένα είναι η τροποποίηση δεδομένων με βάση ειδικούς κανόνες με την επακόλουθη μεταφορά τους σε κεντρική αποθήκευση,

· Καθάρισμαδεδομένα είναι η εξάλειψη της διπλοεπικάλυψης δεδομένων που προέρχονται από διαφορετικές πηγές,

· Εκσυγχρονίζωδεδομένα είναι η διάδοση ενημερώσεων δεδομένων στα δεδομένα προέλευσης των βασικών πινάκων και των παραγόμενων δεδομένων που βρίσκονται στην αποθήκη.

Πλεονεκτήματα:

· Η πλήρωση των βιτρινών είναι απλοποιημένη λόγω της χρήσης μιας ενιαίας πηγής εκκαθαρισμένων δεδομένων,

· Οι μάρκες δεδομένων συγχρονίζονται με την εταιρική επιχειρηματική εικόνα, γεγονός που καθιστά εύκολη την επέκταση της κεντρικής αποθήκευσης και την προσθήκη μαρτύρων δεδομένων,

· Εγγυημένη απόδοση.

Ελαττώματα:

· Η παρουσία πλεονασμού δεδομένων, που οδηγεί σε αυξημένες απαιτήσεις για τεχνολογία αποθήκευσης δεδομένων,

5. 5. Συστήματα διαχείρισης βάσεων δεδομένων και τεχνολογίες πρόσβασης δεδομένων στο CIS

Σύστημα διαχείρισης βάσης δεδομένων(DBMS) είναι ένα σύνολο γλωσσών και εργαλείων λογισμικού που έχουν σχεδιαστεί για τη δημιουργία, τη συντήρηση και την κοινή χρήση μιας βάσης δεδομένων από έναν ή πολλούς χρήστες.

Επί του παρόντος, τα πιο ευρέως χρησιμοποιούμενα ΣΔΒΔ είναι αυτά που κατασκευάζονται με βάση ένα μοντέλο σχεσιακών δεδομένων, που περιγράφεται από μια αυστηρή μαθηματική συσκευή. θεωρίες σχέσεων.

Ένα χαρακτηριστικό των DBMS που λειτουργούν σε ένα CIS είναι το γεγονός ότι πρέπει να διαχειρίζονται βάσεις δεδομένων που βρίσκονται σε μέσα που είναι κατανεμημένα στο διάστημα.

Προς το συμφέρον της εξάλειψης της πρόσθετης αντιγραφής ή αντιγραφής δεδομένων στο CIS, η κύρια έμφαση δίνεται στην αρχή της εξ αποστάσεως επεξεργασίας δεδομένων. Οι βάσεις δεδομένων στο CIS περιέχουν δεδομένα που χρειάζονται πολλοί χρήστες. Η απόκτηση ταυτόχρονης πρόσβασης πολλών χρηστών στη βάση δεδομένων είναι δυνατή κατά την εγκατάσταση σε μια τοπική δίκτυο υπολογιστών DBMS που λειτουργεί με χρήστες και με μια ενιαία βάση δεδομένων.

Οι κύριες τεχνολογικές λύσεις για εργασία πολλών χρηστών με βάσεις δεδομένων είναι οι τεχνολογίες αρχείων/διακομιστή και πελάτη/διακομιστή. Λαμβάνοντας την καταλληλότερη επιλογή από αυτές τις τεχνολογίες, ο πελάτης/διακομιστής στο CIS οργανώνει εξειδικευμένα συστήματα για την επεξεργασία κατανεμημένων βάσεων δεδομένων. Ταυτόχρονα, η διαχείριση των κατανεμημένων βάσεων δεδομένων γίνεται με τέτοιο τρόπο ώστε τα δεδομένα να διανέμονται όχι σε λογικό, αλλά σε φυσικό επίπεδο και η ίδια η βάση δεδομένων να θεωρείται ως ένα ενιαίο «υπερσχήμα». Σε μια κατανεμημένη βάση δεδομένων, οι λειτουργίες διαχείρισης κατανέμονται μεταξύ του διαχειριστή της ενσωματωμένης βάσης δεδομένων και των διαχειριστών τοπικής βάσης δεδομένων. Ο διαχειριστής της ενσωματωμένης βάσης δεδομένων παρακολουθεί την οριοθέτηση της πρόσβασης διαφορετικών χρηστών στη βάση δεδομένων και διασφαλίζει την ακεραιότητα και την ασφάλεια των δεδομένων, καθώς και την προστασία των δεδομένων από την ταυτόχρονη διόρθωση από πολλούς χρήστες. Ο έλεγχος πρόσβασης πραγματοποιείται σύμφωνα με τα δικαιώματα που παρέχονται σε μεμονωμένους χρήστες στο λειτουργικό σύστημα δικτύου.

Ένα χαρακτηριστικό γνώρισμα των προγραμμάτων που δημιουργούνται χρησιμοποιώντας ένα DBMS για εργασία με απομακρυσμένες και κατανεμημένες εταιρικές βάσεις δεδομένων είναι η χρήση μιας διεπαφής ανοιχτής πρόσβασης δεδομένων - ODBC (Open Data Base Connectivity). Όλες οι λειτουργίες μεταφοράς δεδομένων εκχωρούνται στη διεπαφή ODBC, η οποία είναι μια γέφυρα σύνδεσης μεταξύ του ενσωματωμένου DBMS βάσης δεδομένων και της εφαρμογής πελάτη DBMS. Ταυτόχρονα, το DBMS του πελάτη μπορεί να αλληλεπιδράσει όχι μόνο με τις τοπικές του βάσεις δεδομένων, αλλά και με δεδομένα που βρίσκονται στην ενσωματωμένη βάση δεδομένων. Ο πελάτης έχει τη δυνατότητα να στέλνει ερωτήματα στην ενσωματωμένη βάση δεδομένων DBMS, να λαμβάνει δεδομένα από αυτά και να στέλνει τα δικά του ενημερωμένα δεδομένα.

Η εταιρική βάση δεδομένων είναι ο κεντρικός σύνδεσμος του εταιρικού συστήματος πληροφοριών και σας επιτρέπει να δημιουργήσετε έναν ενιαίο χώρο πληροφοριών για την εταιρεία. Εταιρικές Βάσεις Δεδομένων


Μοιραστείτε την εργασία σας στα κοινωνικά δίκτυα

Εάν αυτό το έργο δεν σας ταιριάζει, στο κάτω μέρος της σελίδας υπάρχει μια λίστα με παρόμοια έργα. Μπορείτε επίσης να χρησιμοποιήσετε το κουμπί αναζήτησης


ΣΕΛΙΔΑ 15

ΘΕΜΑ V. ΕΤΑΙΡΙΚΕΣ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ

ΔΙΑΛΕΞΗ 8

V .1. Οργάνωση δεδομένων σε εταιρικά συστήματα. Εταιρικές βάσεις δεδομένων.

V .2. ΣΔΒΔ και δομικές λύσεις σε εταιρικά συστήματα.

V.3. Τεχνολογίες Διαδικτύου/Intranet και λύσεις πρόσβασης σε εταιρικές βάσεις δεδομένων.

V .1. ΟΡΓΑΝΩΣΗ ΔΕΔΟΜΕΝΩΝ ΣΕ ΕΤΑΙΡΙΚΑ ΣΥΣΤΗΜΑΤΑ. ΕΤΑΙΡΙΚΕΣ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ

Εταιρική βάσηΤα δεδομένα είναι ο κεντρικός σύνδεσμος του εταιρικού συστήματος πληροφοριών και σας επιτρέπουν να δημιουργήσετε έναν ενιαίο χώρο πληροφοριών για την εταιρεία. Εταιρικές βάσεις δεδομένων (Εικ. 1.1).

Υπάρχουν διάφοροι ορισμοί των βάσεων δεδομένων.

Κάτω από τη βάση δεδομένων (DB)κατανοούν ένα σύνολο πληροφοριών που σχετίζονται λογικά με τέτοιο τρόπο ώστε να αποτελούν ένα ενιαίο σύνολο δεδομένων που είναι αποθηκευμένα στις συσκευές αποθήκευσης ενός υπολογιστή. Αυτό το σύνολο λειτουργεί ως τα αρχικά δεδομένα των προβλημάτων που επιλύονται στη διαδικασία λειτουργίας των αυτοματοποιημένων συστημάτων ελέγχου, των συστημάτων επεξεργασίας δεδομένων, των συστημάτων πληροφοριών και υπολογιστών.

Ο όρος βάση δεδομένων μπορεί να διατυπωθεί εν συντομία ως μια συλλογή λογικά σχετικών δεδομένων που προορίζονται να κοινοποιηθούν.

Κάτω από τη βάση δεδομένωναναφέρεται σε μια συλλογή δεδομένων που αποθηκεύονται μαζί με τόσο ελάχιστο πλεονασμό που μπορεί να χρησιμοποιηθεί βέλτιστα για μία ή περισσότερες εφαρμογές.

Σκοπός δημιουργίας βάσεων δεδομένωνως μορφές αποθήκευσης δεδομένωνκατασκευή ενός συστήματος δεδομένων που δεν εξαρτάται από τους υιοθετηθέντες αλγόριθμους (λογισμικό), τα τεχνικά μέσα που χρησιμοποιούνται ή τη φυσική θέση των δεδομένων στον υπολογιστή. Η βάση δεδομένων προϋποθέτει χρήση πολλαπλών χρήσεων (πολλοί χρήστες, πολλές μορφές εγγράφων και ερωτήματα ενός χρήστη).

Βασικές απαιτήσεις για βάσεις δεδομένων:

  • Πληρότητα παρουσίασης δεδομένων. Τα δεδομένα στη βάση δεδομένων πρέπει να αντιπροσωπεύουν επαρκώς όλες τις πληροφορίες σχετικά με το αντικείμενο και πρέπει να είναι επαρκή για ODS.
  • Ακεραιότητα βάσης δεδομένων. Τα δεδομένα πρέπει να διατηρούνται κατά την επεξεργασία του SOD τους και σε οποιεσδήποτε καταστάσεις προκύψουν κατά τη διαδικασία εργασίας.
  • Ευελιξία δομής δεδομένων. Η βάση δεδομένων θα πρέπει να επιτρέπει την αλλαγή των δομών δεδομένων χωρίς να παραβιάζεται η ακεραιότητα και η πληρότητά της όταν αλλάζουν οι εξωτερικές συνθήκες.
  • Σκοπιμότητα. Αυτό σημαίνει ότι πρέπει να υπάρχει μια αντικειμενική αναπαράσταση των διαφόρων αντικειμένων, των ιδιοτήτων και των σχέσεών τους.
  • Διαθεσιμότητα. Είναι απαραίτητο να εξασφαλιστεί η διαφοροποίηση της πρόσβασης στα δεδομένα.
  • Πλεονασμός. Η βάση δεδομένων πρέπει να έχει ελάχιστο πλεονασμό στην αναπαράσταση δεδομένων για οποιοδήποτε αντικείμενο.

Η γνώση νοείται ωςένα σύνολο γεγονότων, μοτίβων και ευρετικών κανόνων με τη βοήθεια των οποίων μπορείτε να λύσετε ένα δεδομένο πρόβλημα.

Γνωσιακή Βάση (KB)  ένα σύνολο βάσεων δεδομένων και κανόνων που χρησιμοποιούνται, που λαμβάνονται από τους υπεύθυνους λήψης αποφάσεων. Η βάση γνώσεων είναι ένα στοιχείο έμπειρων συστημάτων.

Είναι απαραίτητο να γίνει διάκρισηδιαφορετικούς τρόπους παρουσίασης δεδομένων.

Φυσικά δεδομέναΑυτά είναι δεδομένα που είναι αποθηκευμένα στη μνήμη του υπολογιστή.

Λογική αναπαράσταση δεδομένωναντιστοιχεί στην αναπαράσταση φυσικών δεδομένων από τον χρήστη. Η διαφορά μεταξύ της φυσικής και της αντίστοιχης λογικής αναπαράστασης των δεδομένων είναι ότι η τελευταία αντικατοπτρίζει ορισμένες σημαντικές σχέσεις μεταξύ φυσικών δεδομένων.

Κάτω από την εταιρική βάση δεδομένωνκατανοούν μια βάση δεδομένων που συνδυάζει, με τη μία ή την άλλη μορφή, όλα τα απαραίτητα δεδομένα και γνώσεις σχετικά με τον οργανισμό που αυτοματοποιείται. Στα εταιρικά συστήματα πληροφοριών, η πιο συγκεντρωμένη έκφραση έχει βρει την έννοια τουολοκληρωμένες βάσεις δεδομένων, που εφαρμόζουν την αρχή της εφάπαξ εισαγωγής και επαναλαμβανόμενης χρήσης πληροφοριών.

Ρύζι. 1.1. Δομή αλληλεπίδρασης τμημάτων με πληροφοριακούς πόρους της εταιρείας.

Υπάρχουν εταιρικές βάσεις δεδομένωνσυμπυκνωμένος (συγκεντρωτική) και διανεμήθηκε.

Επικεντρωμένη (συγκεντρωμένη)βάση δεδομένων είναι μια βάση δεδομένων της οποίας τα δεδομένα αποθηκεύονται φυσικά στις συσκευές αποθήκευσης ενός υπολογιστή. Στο Σχ. Το σχήμα 1.2 δείχνει ένα διάγραμμα μιας εφαρμογής διακομιστή για πρόσβαση σε βάσεις δεδομένων σε διάφορες πλατφόρμες.

Εικ.1.2. Ετερογενές σχήμα κεντρική βάση δεδομένων

Ο συγκεντρωτισμός της επεξεργασίας πληροφοριών κατέστησε δυνατή την εξάλειψη τέτοιων μειονεκτημάτων των παραδοσιακών συστημάτων αρχείων όπως η ασυνέπεια, η ασυνέπεια και ο πλεονασμός δεδομένων. Ωστόσο, καθώς οι βάσεις δεδομένων μεγαλώνουν και, ειδικά όταν χρησιμοποιούνται σε γεωγραφικά διαχωρισμένους οργανισμούς, προκύπτουν προβλήματα. Για παράδειγμα, για συγκεντρωμένες βάσεις δεδομένων που βρίσκονται στον κόμβο ενός τηλεπικοινωνιακού δικτύου, μέσω των οποίων διάφορα τμήματα του οργανισμού έχουν πρόσβαση σε δεδομένα, προκύπτουν οι ακόλουθες δυσκολίες καθώς αυξάνεται ο όγκος των πληροφοριών και ο αριθμός των συναλλαγών:

  • Μεγάλη ροή ανταλλαγής δεδομένων.
  • Υψηλή κίνηση στο δίκτυο.
  • Χαμηλή αξιοπιστία.
  • Χαμηλή συνολική απόδοση.

Αν και είναι ευκολότερο να διασφαλιστεί η ασφάλεια, η ακεραιότητα και η συνέπεια των πληροφοριών κατά τις ενημερώσεις σε μια συγκεντρωμένη βάση δεδομένων, αυτά τα προβλήματα δημιουργούν ορισμένες δυσκολίες. Η αποκέντρωση δεδομένων προτείνεται ως πιθανή λύση σε αυτά τα προβλήματα. Με την αποκέντρωση επιτυγχάνονται τα εξής:

  • Υψηλότερος βαθμός ταυτόχρονης επεξεργασίας λόγω κατανομής φορτίου.
  • Βελτίωση της χρήσης των επιτόπιων δεδομένων κατά την εκτέλεση απομακρυσμένων (απομακρυσμένων) ερωτημάτων.
  • Χαμηλότερο κόστος?
  • Ευκολία διαχείρισης τοπικών βάσεων δεδομένων.

Το κόστος δημιουργίας ενός δικτύου του οποίου οι κόμβοι περιέχουν σταθμούς εργασίας (μικροί υπολογιστές) είναι πολύ χαμηλότερο από το κόστος δημιουργίας ενός παρόμοιου συστήματος με τη χρήση ενός μεγάλου υπολογιστή. Το σχήμα 1.3 δείχνει το λογικό διάγραμμα μιας κατανεμημένης βάσης δεδομένων.

Εικ.1.3. Κατανεμημένη εταιρική βάση δεδομένων.

Ας δώσουμε τον ακόλουθο ορισμό μιας κατανεμημένης βάσης δεδομένων.

Κατανεμημένη βάση δεδομένων -Πρόκειται για μια συλλογή πληροφοριών, αρχείων (σχέσεων) που αποθηκεύονται σε διαφορετικούς κόμβους του δικτύου πληροφοριών και συνδέονται λογικά με τέτοιο τρόπο ώστε να αποτελούν ένα ενιαίο σύνολο δεδομένων (η σύνδεση μπορεί να είναι λειτουργική ή μέσω αντιγράφων του ίδιου αρχείου). Έτσι, αυτό είναι ένα σύνολο βάσεων δεδομένων που είναι λογικά διασυνδεδεμένες, αλλά βρίσκονται φυσικά σε πολλά μηχανήματα που αποτελούν μέρος του ίδιου δικτύου υπολογιστών.

Οι πιο σημαντικές απαιτήσεις για τα χαρακτηριστικά μιας κατανεμημένης βάσης δεδομένων είναι:

  • Επεκτασιμότητα;
  • Συμβατότητα;
  • Υποστήριξη για διάφορα μοντέλα δεδομένων.
  • Φορητότητα;
  • Διαφάνεια τοποθεσίας.
  • Αυτονομία κατανεμημένων κόμβων βάσης δεδομένων (Αυτονομία τοποθεσίας).
  • Επεξεργασία κατανεμημένων αιτημάτων.
  • Εκτέλεση κατανεμημένων συναλλαγών.
  • Υποστήριξη για ένα ομοιογενές σύστημα ασφαλείας.

Η διαφάνεια τοποθεσίας επιτρέπει στους χρήστες να εργάζονται με βάσεις δεδομένων χωρίς να γνωρίζουν τίποτα για την τοποθεσία τους. Η αυτονομία των κατανεμημένων κόμβων βάσης δεδομένων σημαίνει ότι κάθε βάση δεδομένων μπορεί να διατηρηθεί ανεξάρτητα από τις άλλες. Ένα κατανεμημένο ερώτημα είναι ένα ερώτημα (δήλωση SQL) κατά την εκτέλεση του οποίου γίνεται πρόσβαση σε αντικείμενα (πίνακες ή προβολές) διαφορετικών βάσεων δεδομένων. Κατά την εκτέλεση κατανεμημένων συναλλαγών, υπάρχει έλεγχος συγχρονισμού μεταξύ όλων των εμπλεκόμενων βάσεων δεδομένων. Το Oracle7 χρησιμοποιεί τεχνολογία μεταφοράς πληροφοριών δύο φάσεων για την εκτέλεση κατανεμημένων συναλλαγών.

Οι βάσεις δεδομένων που συνθέτουν μια κατανεμημένη βάση δεδομένων δεν χρειάζεται απαραίτητα να είναι ομοιογενείς (δηλαδή να διατηρούνται από το ίδιο DBMS) ή να υποβάλλονται σε επεξεργασία στο ίδιο περιβάλλον λειτουργικού συστήματος ή/και στον ίδιο τύπο υπολογιστών. Για παράδειγμα, μια βάση δεδομένων μπορεί να είναι μια βάση δεδομένων Oracle σε έναν υπολογιστή SUN με το λειτουργικό σύστημα SUN OS (UNIX), η δεύτερη βάση δεδομένων μπορεί να διατηρηθεί από ένα DB2 DBMS σε ένα κεντρικό υπολογιστή IBM 3090 με το λειτουργικό σύστημα MVS και η τρίτη βάση δεδομένων μπορεί να διατηρούνται από ένα SQL/DS DBMS επίσης σε κεντρικό υπολογιστή IBM, αλλά με λειτουργικό σύστημα VM. Απαιτείται μόνο μία προϋπόθεση - όλα τα μηχανήματα με βάσεις δεδομένων πρέπει να είναι προσβάσιμα μέσω του δικτύου στο οποίο ανήκουν.

Το κύριο καθήκον μιας κατανεμημένης βάσης δεδομένωνδιανομή δεδομένων μέσω του δικτύου και παροχή πρόσβασης σε αυτό. Υπάρχουν οι ακόλουθοι τρόποι επίλυσης αυτού του προβλήματος:

  • Κάθε κόμβος αποθηκεύει και χρησιμοποιεί το δικό του σύνολο δεδομένων, το οποίο είναι διαθέσιμο για απομακρυσμένα ερωτήματα. Αυτή η κατανομή χωρίζεται.
  • Ορισμένα δεδομένα που χρησιμοποιούνται συχνά σε απομακρυσμένους ιστότοπους ενδέχεται να είναι διπλά. Αυτή η κατανομή ονομάζεται μερικώς διπλή.
  • Όλα τα δεδομένα αντιγράφονται σε κάθε κόμβο. Αυτή η κατανομή ονομάζεται πλήρως διπλή.
  • Ορισμένα αρχεία μπορούν να διαχωριστούν οριζόντια (ένα υποσύνολο εγγραφών εκχωρείται) ή κάθετα (ένα υποσύνολο πεδίων χαρακτηριστικών εκχωρείται), με τα εκχωρημένα υποσύνολα να αποθηκεύονται σε διαφορετικούς κόμβους μαζί με τα μη διαχωρισμένα δεδομένα. Αυτή η κατανομή ονομάζεται split (fragmented).

Όταν δημιουργείτε μια κατανεμημένη βάση δεδομένων σε εννοιολογικό επίπεδο, πρέπει να λύσετε τα ακόλουθα προβλήματα:

  • Είναι απαραίτητο να υπάρχει ένα ενιαίο εννοιολογικό διάγραμμα ολόκληρου του δικτύου. Αυτό θα εξασφαλίσει τη λογική διαφάνεια των δεδομένων για τον χρήστη, με αποτέλεσμα να μπορεί να σχηματίσει αίτημα σε ολόκληρη τη βάση δεδομένων ενώ βρίσκεται σε ξεχωριστό τερματικό (είναι σαν να εργαζόταν με μια κεντρική βάση δεδομένων).
  • Απαιτείται ένα σχήμα που να καθορίζει πού βρίσκονται τα δεδομένα στο δίκτυο. Αυτό θα διασφαλίσει τη διαφάνεια της τοποθέτησης δεδομένων, έτσι ώστε ο χρήστης να μην χρειάζεται να προσδιορίσει πού θα προωθήσει το αίτημα για να λάβει τα απαιτούμενα δεδομένα.
  • Είναι απαραίτητο να λυθεί το πρόβλημα της ετερογένειας των κατανεμημένων βάσεων δεδομένων. Οι κατανεμημένες βάσεις δεδομένων μπορεί να είναι ομοιογενείς ή ετερογενείς όσον αφορά το υλικό και το λογισμικό. Το πρόβλημα της ετερογένειας λύνεται σχετικά εύκολα εάν η κατανεμημένη βάση δεδομένων είναι ετερογενής από πλευράς υλικού, αλλά ομοιογενής ως προς το λογισμικό (πανομοιότυπα DBMS στους κόμβους). Εάν χρησιμοποιούνται διαφορετικά DBMS στους κόμβους ενός κατανεμημένου συστήματος, χρειάζονται εργαλεία για τη μετατροπή δομών δεδομένων και γλωσσών. Αυτό θα πρέπει να παρέχει διαφανή μετατροπή μεταξύ των κατανεμημένων κόμβων βάσης δεδομένων.
  • Το πρόβλημα της διαχείρισης λεξικών πρέπει να λυθεί. Για την παροχή όλων των τύπων διαφάνειας σε μια κατανεμημένη βάση δεδομένων, χρειάζονται προγράμματα που διαχειρίζονται πολλά λεξικά και βιβλία αναφοράς.
  • Είναι απαραίτητο να οριστούν μέθοδοι για την εκτέλεση ερωτημάτων σε μια κατανεμημένη βάση δεδομένων. Οι μέθοδοι για την εκτέλεση ερωτημάτων σε μια κατανεμημένη βάση δεδομένων διαφέρουν από παρόμοιες μεθόδους σε κεντρικές βάσεις δεδομένων, καθώς μεμονωμένα μέρη ερωτημάτων πρέπει να εκτελούνται στη θέση των σχετικών δεδομένων και μερικά αποτελέσματα πρέπει να μεταδίδονται σε άλλους κόμβους. Ταυτόχρονα, πρέπει να διασφαλίζεται ο συντονισμός όλων των διαδικασιών.
  • Είναι απαραίτητο να λυθεί το πρόβλημα της παράλληλης εκτέλεσης των ερωτημάτων. Μια κατανεμημένη βάση δεδομένων απαιτεί έναν πολύπλοκο μηχανισμό για τη διαχείριση της ταυτόχρονης επεξεργασίας, ο οποίος, ειδικότερα, πρέπει να εξασφαλίζει συγχρονισμό κατά την ενημέρωση των πληροφοριών, ο οποίος εγγυάται τη συνοχή των δεδομένων.
  • Απαιτείται μια αναπτυγμένη μεθοδολογία για τη διανομή και την τοποθέτηση δεδομένων, συμπεριλαμβανομένου του διαχωρισμού, που είναι μία από τις κύριες απαιτήσεις για μια κατανεμημένη βάση δεδομένων.

Ένας από τους ενεργά αναπτυσσόμενους νέους τομείς της αρχιτεκτονικής συστημάτων υπολογιστών, που είναι ένα ισχυρό μέσο επεξεργασίας μη αριθμητικών πληροφοριών, είναιμηχανές βάσης δεδομένων. Οι μηχανές βάσεων δεδομένων χρησιμοποιούνται για την επίλυση μη αριθμητικών προβλημάτων, όπως η αποθήκευση, η αναζήτηση και η μετατροπή εγγράφων και γεγονότων και η εργασία με αντικείμενα. Μετά τον ορισμό των δεδομένων ως ψηφιακών και γραφικών πληροφοριών για αντικείμενα στον περιβάλλοντα κόσμο, η έννοια των δεδομένων κατά την αριθμητική και τη μη αριθμητική επεξεργασία έχει διαφορετικό περιεχόμενο. Στην αριθμητική επεξεργασία χρησιμοποιούνται αντικείμενα όπως μεταβλητές, διανύσματα, πίνακες, πολυδιάστατοι πίνακες, σταθερές κ.λπ., ενώ στη μη αριθμητική επεξεργασία, αντικείμενα μπορεί να είναι αρχεία, εγγραφές, πεδία, ιεραρχίες, δίκτυα, σχέσεις κ.λπ. -η αριθμητική επεξεργασία ενδιαφέρεται άμεσα για πληροφορίες σχετικά με αντικείμενα (για παράδειγμα, συγκεκριμένο υπάλληλο ή ομάδα εργαζομένων) και όχι για το ίδιο το αρχείο υπαλλήλων. Αυτό δεν ευρετηριάζει το αρχείο εργαζομένων για να επιλέξει ένα συγκεκριμένο άτομο. εδώ σας ενδιαφέρει περισσότερο το περιεχόμενο του δίσκου που ψάχνετε. Τεράστιες ποσότητες πληροφοριών συνήθως υποβάλλονται σε μη αριθμητική επεξεργασία. Σε διάφορες εφαρμογές, μπορείτε να εκτελέσετε τις ακόλουθες λειτουργίες σε αυτά τα δεδομένα, για παράδειγμα:

  • αύξηση μισθών για όλους τους υπαλλήλους της εταιρείας·
  • Υπολογίστε τους τραπεζικούς τόκους στους λογαριασμούς όλων των πελατών.
  • να κάνετε αλλαγές στη λίστα όλων των αγαθών σε απόθεμα·
  • βρείτε την απαιτούμενη περίληψη από όλα τα κείμενα που είναι αποθηκευμένα στη βιβλιοθήκη ή στο σύστημα ανάκτησης βιβλιογραφικών πληροφοριών.
  • βρείτε μια περιγραφή της επιθυμητής σύμβασης σε ένα αρχείο που περιέχει νομικά έγγραφα.
  • ελέγξτε όλα τα αρχεία που περιέχουν περιγραφές διπλωμάτων ευρεσιτεχνίας και βρείτε μια πατέντα (εάν υπάρχει) παρόμοια με αυτή που προτείνεται ξανά.

Για την υλοποίηση της βάσης δεδομένων αναπτύχθηκαν μηχανέςπαράλληλη και συνειρμική αρχιτεκτονική ως εναλλακτική λύση του ενός επεξεργαστήφον Νόιμανδομές που σας επιτρέπουν να εργάζεστε με μεγάλες ποσότητες πληροφοριών σε πραγματικό χρόνο.

Οι μηχανές βάσεων δεδομένων αποκτούν σημασία λόγω της έρευνας και της εφαρμογής εννοιών τεχνητής νοημοσύνης όπως η αναπαράσταση γνώσης, τα έμπειρα συστήματα, τα συμπεράσματα, η αναγνώριση προτύπων κ.λπ.

Αποθετήρια πληροφοριών.Σήμερα, πολλοί παραδέχονται ότι οι περισσότερες εταιρείες διαθέτουν ήδη πολλές βάσεις δεδομένων και, για να δουλέψουν επιτυχώς με πληροφορίες, απαιτούν όχι μόνο διαφορετικούς τύπους βάσεων δεδομένων, αλλά διαφορετικές γενιές DBMS. Σύμφωνα με στατιστικά στοιχεία, κάθε οργανισμός χρησιμοποιεί κατά μέσο όρο 2,5 διαφορετικά DBMS. Έχει καταστεί προφανής η ανάγκη «απομόνωσης» των επιχειρήσεων των εταιρειών, ή μάλλον των ανθρώπων που εμπλέκονται σε αυτήν, από τα τεχνολογικά χαρακτηριστικά των βάσεων δεδομένων, ώστε να παρέχεται στους χρήστες μια ενιαία προβολή εταιρικών πληροφοριών, ανεξάρτητα από το πού είναι αποθηκευμένες. Αυτό τόνωσε την εμφάνιση της τεχνολογίας αποθήκευσης πληροφοριών ( Data Warehousing, DW).

Βασικός στόχος της DW είναιδημιουργία μιας ενοποιημένης λογικής αναπαράστασης δεδομένων που περιέχονται σε διαφορετικούς τύπους βάσεων δεδομένων ή, με άλλα λόγια, ενός ενοποιημένου εταιρικού μοντέλου δεδομένων.

Ένας νέος γύρος ανάπτυξης της DW κατέστη δυνατός χάρη στη βελτίωση Τεχνολογίες πληροφορικήςγενικά, ειδικότερα η εμφάνιση νέων τύπων βάσεων δεδομένων που βασίζονται στην παράλληλη επεξεργασία ερωτημάτων, οι οποίες με τη σειρά τους βασίζονται σε προόδους στον τομέα των παράλληλων υπολογιστών. Δημιουργήθηκανδημιουργοί ερωτημάτωνμε μια διαισθητική γραφική διεπαφή που διευκόλυνε τη δημιουργία σύνθετων ερωτημάτων βάσης δεδομένων. Ποικιλία λογισμικούενδιάμεσο λογισμικόπαρεχόμενη επικοινωνίαμεταξύ διαφορετικών τύπων βάσεων δεδομένων, και τελικά σημείωσε απότομη πτώση στην τιμήσυσκευές αποθήκευσης.

Η δομή της εταιρείας μπορεί να περιλαμβάνειβάση δεδομένων.

Βάση δεδομένων λειτουργικό και οργανωτικό στοιχείο σε αυτοματοποιημένα συστήματα ελέγχου και συστήματα πληροφοριών και υπολογιστών, παρέχοντας κεντρική υποστήριξη πληροφοριών για μια ομάδα χρηστών ή ένα σύνολο εργασιών που επιλύονται στο σύστημα.

Βάση δεδομένων θεωρείται ως ένα σύστημα πληροφοριών και αναφοράς, ο κύριος σκοπός του οποίου είναι:

  • στη συσσώρευση και τη συντήρηση σε κατάσταση λειτουργίας ενός συνόλου πληροφοριών που αποτελούν τη βάση πληροφοριών ολόκληρου του αυτοματοποιημένου συστήματος ή ενός συγκεκριμένου συνόλου εργασιών που επιλύονται σε αυτό.
  • στην έκδοση των δεδομένων που απαιτούνται από την εργασία ή τον χρήστη·
  • στη διασφάλιση συλλογικής πρόσβασης σε αποθηκευμένες πληροφορίες·
  • στη διασφάλιση της απαραίτητης διαχείρισης της χρήσης των πληροφοριών που περιέχονται στη βάση πληροφοριών.

Έτσι, μια σύγχρονη τράπεζα δεδομένων είναι ένα σύνθετο σύμπλεγμα λογισμικού και υλικού, το οποίο περιλαμβάνει τεχνικά, συστήματα και εργαλεία δικτύου, βάσεις δεδομένων και DBMS, συστήματα ανάκτησης πληροφοριών για διάφορους σκοπούς.

V .2. ΣΔΒΑ ΚΑΙ ΔΟΜΙΚΕΣ ΛΥΣΕΙΣ ΣΕ ΕΤΑΙΡΙΚΑ ΣΥΣΤΗΜΑΤΑ

Συστήματα διαχείρισης βάσεων δεδομένων και γνώσης

Ένα σημαντικό συστατικό των σύγχρονων πληροφοριακών συστημάτων είναι τα συστήματα διαχείρισης βάσεων δεδομένων (DBMS).

DBMS ένα σύνολο λογισμικού και εργαλείων γλώσσας σχεδιασμένα για τη δημιουργία, τη συντήρηση και τη χρήση βάσεων δεδομένων.

Ένα σύστημα διαχείρισης βάσεων δεδομένων παρέχει πρόσβαση σε βάσεις δεδομένων για συστήματα επεξεργασίας δεδομένων. Όπως έχει ήδη σημειωθεί, τα ΣΔΒΔ διαδραματίζουν σημαντικό ρόλο στη δημιουργία εταιρικών πληροφοριακών συστημάτων και, ιδιαίτερα, σημαντικό ρόλο στη δημιουργία πληροφοριακών συστημάτων που χρησιμοποιούν κατανεμημένους πόρους πληροφοριών που βασίζονται σε σύγχρονες τεχνολογίες υπολογιστών δικτύου.

Το κύριο χαρακτηριστικό των σύγχρονων DBMS είναι ότι τα σύγχρονα DBMS υποστηρίζουν τέτοιατεχνολογίες όπως:

  • Τεχνολογία πελάτη/διακομιστή.
  • Υποστήριξη γλωσσών βάσεων δεδομένων. Αυτόγλώσσα ορισμού σχήματος DB (SDL - Γλώσσα ορισμού σχήματος),γλώσσα χειρισμού δεδομένων (DML - Data Manipulation Language), ενσωματωμένες γλώσσες SQL (Structured Queue Language), QDB (Query - By - Example) και QMF (Query Management Facility) ) προηγμένο περιφερειακό εργαλείο για την προδιαγραφή ερωτημάτων και τη δημιουργία αναφορών για DB 2, κ.λπ.
  • Άμεση διαχείριση δεδομένων σε εξωτερική μνήμη.
  • Διαχείριση buffer RAM.
  • Διαχείριση συναλλαγών. Τεχνολογία OLTP (On-Line Transaction Processing), OLAPτεχνολογία (Επεξεργασία ανάλυσης σε απευθείας σύνδεση)για την DW.
  • Διασφάλιση προστασίας και ακεραιότητας δεδομένων. Η χρήση του συστήματος επιτρέπεται μόνο σε χρήστες που έχουν εξουσιοδότηση πρόσβασης στα δεδομένα. Όταν οι χρήστες εκτελούν λειτουργίες σε δεδομένα, διατηρείται η συνέπεια των αποθηκευμένων δεδομένων (ακεραιότητα). Αυτό είναι σημαντικό σε εταιρικά συστήματα πληροφοριών πολλών χρηστών.
  • Περιγραφή.

Τα σύγχρονα DBMS πρέπει να διασφαλίζουν ότι πληρούνται οι απαιτήσεις της βάσης δεδομένων που αναφέρονται παραπάνω. Επιπλέον, πρέπει να πληρούν τις ακόλουθες αρχές:

  • Ανεξαρτησία δεδομένων.
  • Ευστροφία. Το DBMS πρέπει να διαθέτει ισχυρή υποστήριξη εννοιολογικού μοντέλου δεδομένων για την εμφάνιση προσαρμοσμένων λογικών προβολών.
  • Συμβατότητα. Το DBMS πρέπει να παραμείνει λειτουργικό καθώς εξελίσσεται το λογισμικό και το υλικό.
  • Μη πλεονασμός δεδομένων. Σε αντίθεση με τα συστήματα αρχείων, μια βάση δεδομένων πρέπει να είναι μια ενιαία συλλογή ενσωματωμένων δεδομένων.
  • Προστασία δεδομένων. Το DBMS πρέπει να παρέχει προστασία από μη εξουσιοδοτημένη πρόσβαση.
  • Ακεραιότητα δεδομένων. Το DBMS πρέπει να εμποδίζει τους χρήστες να παραβιάζουν τη βάση δεδομένων.
  • Ταυτόχρονη διαχείριση εργασιών. Το DBMS πρέπει να προστατεύει τη βάση δεδομένων από ασυνέπειες στη λειτουργία κοινής πρόσβασης. Για να εξασφαλιστεί μια συνεπής κατάσταση βάσης δεδομένων, όλα τα αιτήματα των χρηστών (συναλλαγές) πρέπει να εκτελούνται με συγκεκριμένη σειρά.
  • Το DBMS πρέπει να είναι καθολικό. Πρέπει να υποστηρίζει διαφορετικά μοντέλα δεδομένων σε μια ενιαία λογική και φυσική βάση.
  • Το DBMS πρέπει να υποστηρίζει τόσο τις κεντρικές όσο και τις κατανεμημένες βάσεις δεδομένων και, έτσι, να γίνει ένας σημαντικός σύνδεσμος στα δίκτυα υπολογιστών.

Θεωρώντας ένα DBMS ως μια κατηγορία προϊόντων λογισμικού που στοχεύουν στη διατήρηση βάσεων δεδομένων σε αυτοματοποιημένα συστήματα, μπορούμε να εντοπίσουμε δύο πιο σημαντικά χαρακτηριστικά που καθορίζουν τους τύπους των DBMS. Σύμφωνα με αυτούς, ένα ΣΔΒΔ μπορεί να εξεταστεί από δύο οπτικές γωνίες:

  • τις δυνατότητές τους σε σχέση με κατανεμημένες (εταιρικές) βάσεις δεδομένων·
  • τη σχέση τους με τον τύπο του μοντέλου δεδομένων που εφαρμόζεται στο DBMS.

Σε σχέση με τις εταιρικές (κατανεμημένες) βάσεις δεδομένων, μπορούν να διακριθούν χονδρικά οι ακόλουθοι τύποι DBMS:

  • Desktop DBMS. Αυτά τα προϊόντα επικεντρώνονται κυρίως στην εργασία με προσωπικά δεδομένα (δεδομένα επιφάνειας εργασίας). Έχουν σύνολα εντολών για κοινή χρήση κοινών βάσεων δεδομένων, αλλά μικρού μεγέθους (όπως ένα μικρό γραφείο). Πρώτα απ 'όλα, πρόκειται για DBMS όπως Access, dBASE, Paradox, EcoxPro. Γιατί τα Access, dBASE, Paradox, EcoxPro έχουν μη ικανοποιητική πρόσβαση στα εταιρικά δεδομένα. Γεγονός είναι ότι δεν υπάρχει εύκολος τρόπος να ξεπεραστεί το εμπόδιο μεταξύ προσωπικών και εταιρικών δεδομένων. Και το θέμα δεν είναι καν ότι ο μηχανισμός του DBMS προσωπικών δεδομένων (ή του μικρού γραφείου) επικεντρώνεται στην πρόσβαση σε δεδομένα μέσω πολλών πυλών, προϊόντων διαδικτύου κ.λπ. Το πρόβλημα είναι ότι αυτοί οι μηχανισμοί συνήθως περιλαμβάνουν πλήρεις μεταφορές αρχείων και καμία εκτεταμένη υποστήριξη ευρετηρίου, με αποτέλεσμα οι ουρές των διακομιστών να σταματήσουν ουσιαστικά σε μεγάλα συστήματα.
  • Εξειδικευμένο DBMS πολλαπλών χρηστών υψηλής απόδοσης. Τέτοια DBMS χαρακτηρίζονται από την παρουσία ενός πυρήνα συστήματος πολλαπλών χρηστών, μιας γλώσσας χειρισμού δεδομένων και των ακόλουθων λειτουργιών που χαρακτηρίζουν τα αναπτυγμένα DBMS πολλών χρηστών:
  • Οργάνωση ενός buffer pool.
  • την παρουσία συστήματος επεξεργασίας ουράς συναλλαγών·
  • η παρουσία μηχανισμών για τον αποκλεισμό δεδομένων πολλών χρηστών.
  • διατήρηση ενός αρχείου καταγραφής συναλλαγών·
  • την παρουσία μηχανισμών ελέγχου πρόσβασης.

Αυτά τα DBMS όπως Oracle, DB2, SQL/Server, Informix, Sybase, ADABAS, Titanium και άλλα παρέχουν ένα ευρύ φάσμα υπηρεσιών για την επεξεργασία εταιρικών βάσεων δεδομένων.

Όταν εργάζεστε με βάσεις δεδομένων, χρησιμοποιείται ένας μηχανισμός συναλλαγής.

Συναλλαγή είναι μια λογική μονάδα εργασίας.

Συναλλαγή είναι μια ακολουθία τελεστών χειρισμού δεδομένων που εκτελούνταιως ένα σύνολο(όλα ή τίποτα) και μετάφραση βάσης δεδομένωναπό μια ολοκληρωμένη κατάσταση σε μια άλλη ολοκληρωμένη κατάσταση.

Μια συναλλαγή έχει τέσσερις σημαντικές ιδιότητες γνωστές ωςΙδιότητες ASID:

  • (Α) Ατομικότητα . Μια συναλλαγή εκτελείται ως ατομική λειτουργία - είτε εκτελείται ολόκληρη η συναλλαγή είτε δεν εκτελείται ολόκληρη η συναλλαγή.
  • (Γ) Συνέπεια. Μια συναλλαγή μετακινεί τη βάση δεδομένων από μια συνεπή (ολοκληρωμένη) κατάσταση σε μια άλλη συνεπή (ολοκληρωμένη) κατάσταση. Μέσα σε μια συναλλαγή, η συνοχή της βάσης δεδομένων μπορεί να καταρρεύσει.
  • (Ι) Μόνωση . Οι συναλλαγές από διαφορετικούς χρήστες δεν πρέπει να παρεμβαίνουν μεταξύ τους (για παράδειγμα, σαν να εκτελούνταν με αυστηρή σειρά).
  • (Δ) Ανθεκτικότητα. Εάν μια συναλλαγή ολοκληρωθεί, τότε τα αποτελέσματα της δουλειάς της πρέπει να αποθηκευτούν στη βάση δεδομένων, ακόμα κι αν το σύστημα διακοπεί την επόμενη στιγμή.

Η συναλλαγή συνήθως ξεκινά αυτόματα όταν ο χρήστης εγγραφεί στο DBMS και συνεχίζεται μέχρι να συμβεί ένα από τα ακόλουθα συμβάντα:

  • Εκδόθηκε η εντολή COMMIT WORK (δέσμευση της συναλλαγής).
  • Εκδόθηκε η εντολή ROLLBACK WORK.
  • Ο χρήστης έχει αποσυνδεθεί από το DBMS.
  • Υπήρξε μια αποτυχία του συστήματος.

Για τον χρήστη συνήθως φοράειατομικό χαρακτήρα. Στην πραγματικότητα, πρόκειται για έναν πολύπλοκο μηχανισμό αλληλεπίδρασης μεταξύ χρήστη (εφαρμογής) και βάσης δεδομένων. Το λογισμικό εταιρικών συστημάτων χρησιμοποιεί μηχανισμό επεξεργασίας συναλλαγών σε πραγματικό χρόνο (Συστήματα Επεξεργασίας Συναλλαγών σε απευθείας σύνδεση, OLTP), ιδίως λογιστικά προγράμματα, λογισμικό για λήψη και επεξεργασία αιτημάτων πελατών, οικονομικές εφαρμογές, παράγουν πολλές πληροφορίες. Αυτά τα συστήματα έχουν σχεδιαστεί (και βελτιστοποιηθεί ανάλογα) για να χειρίζονται μεγάλους όγκουςδεδομένων, εκτελώντας σύνθετες συναλλαγές και εντατικές λειτουργίες ανάγνωσης/εγγραφής.

Δυστυχώς, οι πληροφορίες που τοποθετούνται στις βάσεις δεδομένων των συστημάτων OLTP δεν είναι πολύ κατάλληλες για χρήση από απλούς χρήστες (λόγω του υψηλού βαθμού κανονικοποίησης των πινάκων, συγκεκριμένων μορφών παρουσίασης δεδομένων και άλλων παραγόντων). Επομένως, δεδομένα από διαφορετικούς μεταφορείς πληροφοριών αποστέλλονται (με την έννοια του αντιγράφου).αποθήκη αποθήκευσης, διαλογή και εν συνεχεία παράδοση στον καταναλωτή. Στην τεχνολογία της πληροφορίας, ο ρόλος των αποθηκών παίζεται απόαποθετήρια πληροφοριών.

Τα συστήματα αναλυτικής επεξεργασίας δεδομένων σε πραγματικό χρόνο παρέχουν πληροφορίες στον τελικό χρήστη(On-line αναλυτική επεξεργασία, OLAP), τα οποία παρέχουν εξαιρετικά απλή πρόσβαση στα δεδομένα μέσω εύχρηστων μέσων δημιουργίας ερωτημάτων και ανάλυσης αποτελεσμάτων. Στα συστήματα OLAP, η αξία ενός προϊόντος πληροφοριών αυξάνεται μέσω της χρήσης διαφόρων μεθόδων ανάλυσης και στατιστικής επεξεργασίας. Επιπλέον, τα συστήματα αυτά είναι βελτιστοποιημένα ως προς την ταχύτητα ανάκτησης δεδομένων, τη συλλογή γενικευμένων πληροφοριών και απευθύνονται σε απλούς χρήστες (διαθέτουν διαισθητική διεπαφή). ΑνΣύστημα OLTP δίνει απαντήσεις σε απλές ερωτήσεις όπως «ποιο ήταν το επίπεδο πωλήσεων του προϊόντος Ν στην περιοχή Μ τον Ιανουάριο του 199x;», στη συνέχειασυστήματα OLAP έτοιμο για πιο σύνθετα αιτήματα χρηστών, για παράδειγμα: «Δώστε μια ανάλυση των πωλήσεων του προϊόντος N σε όλες τις περιοχές σύμφωνα με το σχέδιο για το δεύτερο τρίμηνο σε σύγκριση με τα δύο προηγούμενα έτη».

Αρχιτεκτονική πελάτη/διακομιστή

Στα σύγχρονα συστήματακατανεμημένη επεξεργασία πληροφοριών, η τεχνολογία βρίσκεται στο επίκεντροδιακομιστή-πελάτη. Στο σύστημα αρχιτεκτονική πελάτη-διακομιστήΗ επεξεργασία δεδομένων διαιρείται μεταξύ του υπολογιστή-πελάτη και του υπολογιστή διακομιστή, η επικοινωνία μεταξύ των οποίων πραγματοποιείται μέσω του δικτύου. Αυτή η διαίρεση των διαδικασιών επεξεργασίας δεδομένων βασίζεται στην ομαδοποίηση των λειτουργιών. Συνήθως, ένας υπολογιστής διακομιστή βάσης δεδομένων είναι αφιερωμένος στην εκτέλεση λειτουργιών βάσης δεδομένων και ένας υπολογιστής-πελάτης εκτελεί προγράμματα εφαρμογών. Το σχήμα 2.1 δείχνει ένα απλό σύστημα αρχιτεκτονικής πελάτη-διακομιστή που αποτελείται από έναν υπολογιστή που λειτουργεί ως διακομιστής και έναν άλλο υπολογιστή που ενεργεί ως πελάτης του. Κάθε μηχάνημα εκτελεί διαφορετικές λειτουργίες και έχει τους δικούς του πόρους.

Υπηρέτης

Βάση δεδομένων

Υπολογιστής διακομιστή


Καθαρά

Υπολογιστής συμβατός με IBM

Υπολογιστής συμβατός με IBM

Υπολογιστής συμβατός με IBM

Πελάτες

Εφαρμογές

Ρύζι. 2.1. Σύστημα αρχιτεκτονικής πελάτη-διακομιστή

Η κύρια λειτουργία του υπολογιστή-πελάτη είναι να εκτελεί την εφαρμογή (διεπαφή χρήστη και λογική παρουσίασης) και να επικοινωνεί με τον διακομιστή όταν απαιτείται από την εφαρμογή.

Υπηρέτης Αυτό είναι ένα αντικείμενο (υπολογιστής) που παρέχει υπηρεσίες σε άλλα αντικείμενα κατόπιν αιτήματός τους.

Όπως υποδηλώνει ο ίδιος ο όρος, η κύρια λειτουργία ενός υπολογιστή διακομιστή είναι να εξυπηρετεί τις ανάγκες του πελάτη. Ο όρος "Διακομιστής" χρησιμοποιείται για να αναφέρεται σε δύο διαφορετικές ομάδες λειτουργιών: έναν διακομιστή αρχείων και έναν διακομιστή βάσης δεδομένων (εφεξής, αυτοί οι όροι σημαίνουν, ανάλογα με το πλαίσιο, είτε λογισμικό που υλοποιεί αυτές τις ομάδες λειτουργιών είτε υπολογιστές με αυτό το λογισμικό). Οι διακομιστές αρχείων δεν έχουν σχεδιαστεί για να εκτελούν λειτουργίες βάσης δεδομένων η κύρια λειτουργία τους είναι να μοιράζονται αρχεία μεταξύ πολλών χρηστών, π.χ. εξασφάλιση ταυτόχρονης πρόσβασης πολλών χρηστών σε αρχεία υπολογιστή - διακομιστή αρχείων. Ένα παράδειγμα διακομιστή αρχείων είναι το λειτουργικό σύστημα NetWare της Novell. Ο διακομιστής βάσης δεδομένων μπορεί να εγκατασταθεί και να ενεργοποιηθεί σε υπολογιστή - διακομιστή αρχείων. Το Oracle DBMS με τη μορφή NLM (Network Loadable Module) εκτελείται στο περιβάλλον NetWare σε έναν διακομιστή αρχείων.

Ο διακομιστής τοπικού δικτύου πρέπει να διαθέτει πόρους που ανταποκρίνονται στο λειτουργικό του σκοπό και στις ανάγκες του δικτύου. Σημειώστε ότι λόγω της εστίασης στην προσέγγιση των ανοιχτών συστημάτων, είναι πιο σωστό να μιλάμε για λογικούς διακομιστές (που σημαίνει ένα σύνολο πόρων και λογισμικού που παρέχουν υπηρεσίες μέσω αυτών των πόρων), οι οποίοι δεν βρίσκονται απαραίτητα σε διαφορετικούς υπολογιστές. Ένα χαρακτηριστικό ενός λογικού διακομιστή σε ένα ανοιχτό σύστημα είναι ότι εάν, για λόγους αποτελεσματικότητας, είναι σκόπιμο να μετακινηθεί ο διακομιστής σε ξεχωριστό υπολογιστή, τότε αυτό μπορεί να γίνει χωρίς να χρειάζεται καμία τροποποίηση, είτε στον εαυτό του είτε στην εφαρμογή προγράμματα που το χρησιμοποιούν.

Μία από τις σημαντικές απαιτήσεις για τον διακομιστή είναι ότι το λειτουργικό σύστημα στο οποίο βρίσκεται ο διακομιστής της βάσης δεδομένων πρέπει να είναι πολλαπλών εργασιών (και, κατά προτίμηση, αλλά όχι απαραίτητα, πολλαπλών χρηστών). Για παράδειγμα, ένα Oracle DBMS που είναι εγκατεστημένο σε έναν προσωπικό υπολογιστή με λειτουργικό σύστημα MS-DOS (ή PC-DOS) που δεν πληροί την απαίτηση πολλαπλών εργασιών δεν μπορεί να χρησιμοποιηθεί ως διακομιστής βάσης δεδομένων. Και το ίδιο Oracle DBMS, εγκατεστημένο σε υπολογιστή με λειτουργικό σύστημα πολλαπλών εργασιών (αν και όχι πολλαπλών χρηστών) OS/2, μπορεί να είναι διακομιστής βάσης δεδομένων. Πολλές ποικιλίες συστημάτων UNIX, MVS, VM και ορισμένων άλλων λειτουργικών συστημάτων είναι τόσο πολλαπλών εργασιών όσο και πολλαπλών χρηστών.

Κατανεμημένος Υπολογισμός

Ο όρος "κατανεμημένος υπολογισμός" χρησιμοποιείται συχνά για να αναφερθεί σε δύο διαφορετικές, αν και συμπληρωματικές, έννοιες:

  • Κατανεμημένη βάση δεδομένων.
  • Κατανεμημένη επεξεργασία δεδομένων.

Η εφαρμογή αυτών των εννοιών καθιστά δυνατή την οργάνωση της πρόσβασης σε πληροφορίες που είναι αποθηκευμένες σε πολλαπλές μηχανές από τελικούς χρήστες χρησιμοποιώντας διαφορετικά εργαλεία.

Υπάρχουν πολλοί τύποι διακομιστών:

  • Διακομιστής βάσης δεδομένων.
  • Διακομιστής εκτύπωσης.
  • Διακομιστής απομακρυσμένης πρόσβασης.
  • Διακομιστής φαξ.
  • Διακομιστής Ιστού κ.λπ.

Με βάση την υποκείμενη τεχνολογία Πελάτη/ΔιακομιστήΥπάρχουν βασικές τεχνολογίες όπως:

  • Τεχνολογίες λειτουργικών συστημάτων, η έννοια της αλληλεπίδρασης ανοιχτών συστημάτων, η δημιουργία αντικειμενοστρεφών περιβαλλόντων για τη λειτουργία των προγραμμάτων.
  • Τεχνολογίες τηλεπικοινωνιών;
  • Τεχνολογίες δικτύου;
  • Τεχνολογίες γραφικής διεπαφής χρήστη ( GUI);
  • Και τα λοιπά.

Πλεονεκτήματα της τεχνολογίας πελάτη-διακομιστή:

  • Η τεχνολογία πελάτη/διακομιστή επιτρέπει τον υπολογισμό σε ετερογενή υπολογιστικά περιβάλλοντα. Ανεξαρτησία πλατφόρμας: Πρόσβαση σε ετερογενή περιβάλλοντα δικτύου που περιλαμβάνουν διαφορετικούς τύπους υπολογιστών με διαφορετικά λειτουργικά συστήματα.
  • Ανεξαρτησία πηγών δεδομένων: πρόσβαση σε πληροφορίες από ετερογενείς βάσεις δεδομένων. Παραδείγματα τέτοιων συστημάτων είναι τα DB2, SQL/DS, Oracle, Sybase.
  • Ισοζύγιο φόρτου πελάτη και διακομιστή.
  • Εκτελέστε υπολογισμούς όπου γίνονται πιο αποτελεσματικά.
  • Παρέχετε την ικανότητα αποτελεσματικής κλίμακας.
  • Υπολογισμός μεταξύ πλατφορμών. Ο υπολογισμός μεταξύ πλατφορμών ορίζεται απλώς ως η εφαρμογή τεχνολογιών σε ετερογενή υπολογιστικά περιβάλλοντα. Εδώ θα πρέπει να παρέχονται οι ακόλουθες δυνατότητες:
  • Η εφαρμογή πρέπει να εκτελείται σε πολλές πλατφόρμες.
  • Σε όλες τις πλατφόρμες πρέπει να έχει την ίδια διεπαφή και λογική λειτουργίας.
  • Η εφαρμογή πρέπει να ενσωματωθεί στο εγγενές λειτουργικό περιβάλλον.
  • Θα πρέπει να συμπεριφέρεται το ίδιο σε όλες τις πλατφόρμες.
  • Θα πρέπει να έχει απλή και συνεπή υποστήριξη.

Κατανεμημένος υπολογισμός. Ο κατανεμημένος υπολογισμός περιλαμβάνει τη διανομή εργασίας μεταξύ πολλών υπολογιστών (αν και ο κατανεμημένος υπολογισμός είναι μια ευρύτερη έννοια).

Διάσπαση. Αποδεσμοποίηση μεταφοράς εφαρμογών για μεγάλους υπολογιστές σε πλατφόρμες μικρών υπολογιστών.

  • Μειωμένο κόστος υποδομής και υλικού. Οικονομικά: Η διαθεσιμότητα φθηνού εξοπλισμού υπολογιστών και η αυξανόμενη επικράτηση των τοπικών δικτύων καθιστούν την τεχνολογία πελάτη-διακομιστή πιο οικονομική από άλλες τεχνολογίες επεξεργασίας δεδομένων. Ο εξοπλισμός μπορεί να αναβαθμιστεί αμέσως μόλις παραστεί ανάγκη.

Μείωση του συνολικού χρόνου εκτέλεσης της εφαρμογής.

Μείωση της χρήσης μνήμης πελάτη.

Μείωση της κίνησης του δικτύου.

  • Δυνατότητα εργασίας με πολυμέσα: μέχρι σήμερα έχουν δημιουργηθεί πολλά προγράμματα πολυμέσων για υπολογιστές. Είτε δεν υπάρχουν παρόμοια προγράμματα για τη διαμόρφωση τερματικού-κεντρικού υπολογιστή, είτε είναι πολύ ακριβά.
  • Δυνατότητα προσέλκυσης μεγάλων υπολογιστικών πόρων για λειτουργίες βάσης δεδομένων: εφόσον οι εφαρμογές εκτελούνται σε υπολογιστές-πελάτες, ο υπολογιστής διακομιστή ελευθερώνει πρόσθετους πόρους (σε σύγκριση με τη διαμόρφωση τερματικού-κεντρικού υπολογιστή) για λειτουργίες βάσης δεδομένων, όπως υπολογιστικούς πόρους CPU και λειτουργική μνήμη.
  • Αυξημένη παραγωγικότητα προγραμματιστή: Η παραγωγικότητα του προγραμματιστή αυξάνεται με εργαλεία όπως το SQL*Forms και το CASE, τα οποία σας επιτρέπουν να αναπτύσσετε εφαρμογές πιο γρήγορα από γλώσσες προγραμματισμού όπως C, PL1 ή COBOL.
  • Αυξημένη παραγωγικότητα τελικού χρήστη: Σήμερα, πολλοί τελικοί χρήστες έχουν κατακτήσει συστήματα όπως τα Lotus, Paradox, Word Perfect, Harvard Graphics κ.λπ.

Η διεπαφή υποστήριξης ορίζεται και διορθώνεται. Επομένως, είναι δυνατή η δημιουργία νέων τμημάτων πελάτη ενός υπάρχοντος συστήματος (παράδειγμα διαλειτουργικότητας σε επίπεδο συστήματος).

Ρύζι. 2.2. Απεικόνιση πρόσβασης πελάτη σε κοινόχρηστο πόρο διακομιστή.

Πώς να εφαρμόσετε την τεχνολογία πελάτη-διακομιστή

Η εγκατάσταση ενός συστήματος βασισμένου στην τεχνολογία πελάτη-διακομιστή και ικανού για κατανεμημένη επεξεργασία δεδομένων συζητείται παρακάτω. Απαιτείται το ακόλουθο υλικό και λογισμικό υπολογιστή:

  • υπολογιστής διακομιστή βάσης δεδομένων.
  • υπολογιστές-πελάτες?
  • δίκτυο επικοινωνίας?
  • λογισμικό δικτύου·
  • λογισμικό εφαρμογής.

Γλώσσα SQL . Γλώσσα ερωτήματος υψηλού επιπέδου - SQL (Structured Query Language ) χρησιμοποιείται για την υλοποίηση ερωτημάτων σε βάσεις δεδομένων, όπως NMD, DML και PYAD και είναι αποδεκτό ως πρότυπο. Γλώσσα SQL υιοθετήθηκε αρχικά ως η γλώσσα δεδομένων των προϊόντων λογισμικού της εταιρείας IBM και σχεσιακό DBMS YaMD SYSTEM R από την IBM . Σημαντικό χαρακτηριστικό της γλώσσας SQL είναι ότι η ίδια γλώσσα αναπαρίσταται μέσω δύο διαφορετικών διεπαφών, δηλαδή: μέσω μιας διαδραστικής διεπαφής και μέσω μιας διεπαφής προγραμματισμού εφαρμογών (δυναμική SQL). Δυναμική SQL αποτελείται από πολλές ενσωματωμένες γλωσσικές δυνατότητες SQL , που παρέχεται ειδικά για την κατασκευή διαδραστικών εφαρμογών, όπου μια διαδραστική εφαρμογή ορίζεται ως ένα πρόγραμμα που είναι γραμμένο για να υποστηρίζει την πρόσβαση στη βάση δεδομένων από έναν τελικό χρήστη που εκτελείται σε ένα διαδραστικό τερματικό. Γλώσσα SQL παρέχει τις λειτουργίες ορισμού, χειρισμού και διαχείρισης δεδομένων βάσης δεδομένων και είναι διαφανής στον χρήστη από την άποψη του υλοποιημένου ΣΔΒΔ.

Ρύζι. 2.3. Σχέδιο για την εκτέλεση ερωτημάτων χρήστη σε κατανεμημένες βάσεις δεδομένων.

Η εσωτερική δομή των βάσεων δεδομένων καθορίζεται από τα μοντέλα δεδομένων που χρησιμοποιούνται. Το εννοιολογικό μοντέλο έχει μεγαλύτερες δυνατότητες αφαίρεσης και πιο πλούσια σημασιολογία σε σύγκριση με τα εξωτερικά μοντέλα. Τα εξωτερικά μοντέλα ονομάζονται συχνά συντακτικά ή λειτουργικά μοντέλα, αναφερόμενα στη συντακτική φύση του ελέγχου και της εφαρμογής ως μέσο αλληλεπίδρασης του χρήστη με τη βάση δεδομένων. Στη μοντελοποίηση πληροφοριών, υπάρχουν διάφορα επίπεδα αφαίρεσης, από το επίπεδο του εννοιολογικού μοντέλου έως το επίπεδο του μοντέλου φυσικών δεδομένων, που επηρεάζουν την αρχιτεκτονική του ΣΔΒΔ.

Το μοντέλο δεδομένων αποτελείται από τρία στοιχεία:

  • Η δομή δεδομένων για την αναπαράσταση της βάσης δεδομένων από την οπτική γωνία του χρήστη.
  • Έγκυρες λειτουργίες που εκτελούνται στη δομή δεδομένων. Είναι απαραίτητο να μπορείτε να εργαστείτε με αυτή τη δομή χρησιμοποιώντας διάφορες λειτουργίες DML και NMD. Μια πλούσια δομή είναι άχρηστη εάν δεν υπάρχει τρόπος να λειτουργήσει το περιεχόμενό της.
  • Περιορισμοί για τον έλεγχο της ακεραιότητας. Το μοντέλο δεδομένων πρέπει να διαθέτει μέσα για τη διατήρηση της ακεραιότητάς του και την προστασία του. Για παράδειγμα, εξετάστε τους ακόλουθους δύο περιορισμούς:
  • Κάθε υποδέντρο πρέπει να έχει έναν κόμβο πηγής. Οι ιεραρχικές βάσεις δεδομένων δεν μπορούν να αποθηκεύσουν θυγατρικούς κόμβους χωρίς τον γονικό κόμβο.
  • Σε σχέση με μια σχεσιακή βάση δεδομένων, δεν μπορούν να υπάρχουν πανομοιότυπες πλειάδες. Για ένα αρχείο, αυτή η απαίτηση απαιτεί όλες οι εγγραφές να είναι μοναδικές.

Ένα από τα πιο σημαντικά χαρακτηριστικά ενός DBMS είναι η ικανότητα σύνδεσης αντικειμένων.

Υπάρχουν οι ακόλουθοι τύποι συνδέσεων μεταξύ αντικειμένων:

  • Ένας προς έναν (1:1). Ένα αντικείμενο ενός συνόλου μπορεί να συσχετιστεί με ένα αντικείμενο ενός άλλου συνόλου.
  • Ένα προς πολλά (1:M). Ένα αντικείμενο ενός συνόλου μπορεί να συσχετιστεί με πολλά αντικείμενα ενός άλλου συνόλου.
  • Πολλά-προς-Πολλά (Μ:Ν). Ένα αντικείμενο ενός συνόλου μπορεί να συσχετιστεί με πολλά αντικείμενα ενός άλλου συνόλου, αλλά ένα αντικείμενο ενός άλλου συνόλου μπορεί να συσχετιστεί με πολλά αντικείμενα του πρώτου συνόλου.
  • Κλαδωτός . Ένα αντικείμενο ενός συνόλου μπορεί να συσχετιστεί με αντικείμενα πολλών συνόλων.
  • Αναδρομικό . Ένα αντικείμενο ενός δεδομένου συνόλου μπορεί να συσχετιστεί με ένα αντικείμενο του ίδιου συνόλου.

Υπάρχουν τα ακόλουθα κύρια μοντέλα δεδομένων:

  • Σχεσιακό μοντέλοδεδομένα.
  • Ιεραρχικό μοντέλο δεδομένων.
  • Μη ολοκληρωμένο μοντέλο δεδομένων δικτύου.
  • Μοντέλο δεδομένων CODASYL.
  • Εκτεταμένο μοντέλο δεδομένων δικτύου.

V.3. INTERNET / ΤΕΧΝΟΛΟΓΙΕΣ ΙΝΤΡΑΝΕΤ ΚΑΙ ΕΤΑΙΡΙΚΕΣ ΛΥΣΕΙΣ ΓΙΑ ΠΡΟΣΒΑΣΗ ΒΑΣΕΩΝ ΔΕΔΟΜΕΝΩΝ

Το κύριο πρόβλημα των συστημάτων που βασίζονται σε μια αρχιτεκτονική πελάτη-διακομιστή είναι ότι, σύμφωνα με την έννοια των ανοιχτών συστημάτων, απαιτείται να είναι κινητά στην ευρύτερη δυνατή κατηγορία λύσεων υλικού και λογισμικού ανοιχτού συστήματος. Ακόμα κι αν περιοριστούμε σε τοπικά δίκτυα που βασίζονται σε UNIX, διαφορετικά δίκτυα χρησιμοποιούν διαφορετικό υλικό και πρωτόκολλα επικοινωνίας. Οι προσπάθειες δημιουργίας συστημάτων που υποστηρίζουν όλα τα πιθανά πρωτόκολλα οδηγούν σε υπερφόρτωσή τους με λεπτομέρειες δικτύου σε βάρος της λειτουργικότητας.

Μια ακόμη πιο σύνθετη πτυχή αυτού του προβλήματος σχετίζεται με τη δυνατότητα χρήσης διαφορετικών αναπαραστάσεων δεδομένων σε διαφορετικούς κόμβους ενός ετερογενούς τοπικού δικτύου. Διαφορετικοί υπολογιστές μπορεί να έχουν διαφορετική διεύθυνση, αναπαράσταση αριθμών, κωδικοποίηση χαρακτήρων κ.λπ. Αυτό είναι ιδιαίτερα σημαντικό για διακομιστές υψηλού επιπέδου: τηλεπικοινωνίες, υπολογιστές, βάσεις δεδομένων.

Μια κοινή λύση στο πρόβλημα της κινητικότητας συστημάτων που βασίζονται σε μια αρχιτεκτονική πελάτη-διακομιστή είναι να βασίζονται σε πακέτα λογισμικού που εφαρμόζουν πρωτόκολλα κλήσης απομακρυσμένης διαδικασίας (RPC). Όταν χρησιμοποιείτε τέτοια εργαλεία, η κλήση μιας υπηρεσίας σε έναν απομακρυσμένο κόμβο μοιάζει με μια κλήση κανονικής διαδικασίας. Τα εργαλεία RPC, τα οποία, φυσικά, περιέχουν όλες τις πληροφορίες σχετικά με τις ιδιαιτερότητες του τοπικού εξοπλισμού δικτύου και των πρωτοκόλλων δικτύου, μεταφράζουν την κλήση σε μια ακολουθία αλληλεπιδράσεων δικτύου. Έτσι, οι ιδιαιτερότητες του περιβάλλοντος δικτύου και των πρωτοκόλλων αποκρύπτονται από τον προγραμματιστή της εφαρμογής.

Όταν καλείται μια απομακρυσμένη διαδικασία, τα προγράμματα RPC μετατρέπουν μορφές δεδομένων πελάτη σε ενδιάμεσες μορφές ανεξάρτητες από μηχανή και στη συνέχεια μετατρέπουν σε μορφές δεδομένων διακομιστή. Κατά τη μετάδοση παραμέτρων απόκρισης, εκτελούνται παρόμοιοι μετασχηματισμοί.

Άλλα παρόμοια έργα που μπορεί να σας ενδιαφέρουν.vshm>

6914. Έννοια βάσης δεδομένων 11,56 KB
Μια βάση δεδομένων είναι μια συλλογή ανεξάρτητων υλικών που παρουσιάζονται σε αντικειμενική μορφή, άρθρα υπολογισμού κανονιστικών πράξεων δικαστικών αποφάσεων και άλλα παρόμοια υλικά, συστηματοποιημένα με τέτοιο τρόπο ώστε αυτά τα υλικά να μπορούν να βρεθούν και να υποβληθούν σε επεξεργασία χρησιμοποιώντας έναν ηλεκτρονικό υπολογιστή Αστικός Κώδικας της Ρωσίας Ομοσπονδία Art. Μια βάση δεδομένων που οργανώνεται σύμφωνα με ορισμένους κανόνες και διατηρείται στη μνήμη του υπολογιστή είναι ένα σύνολο δεδομένων που χαρακτηρίζει την τρέχουσα κατάσταση ορισμένων...
8064. Κατανεμημένες βάσεις δεδομένων 43,66 KB
Κατανεμημένες βάσεις δεδομένων Κάτω κατανεμημένη βάση Δεδομένα RDBνοείται ως ένα σύνολο λογικά διασυνδεδεμένων κοινόχρηστων δεδομένων που κατανέμονται φυσικά σε διαφορετικούς κόμβους ενός δικτύου υπολογιστών. Η πρόσβαση στα δεδομένα δεν πρέπει να εξαρτάται από την παρουσία ή την απουσία αντιγράφων δεδομένων. Το σύστημα πρέπει να καθορίζει αυτόματα μεθόδους για την εκτέλεση μιας σύνδεσης συγχώνευσης δεδομένων, ένα κανάλι δικτύου ικανό να αντιμετωπίσει τον όγκο των μεταδιδόμενων πληροφοριών και έναν κόμβο που έχει επαρκή υπολογιστική ισχύςγια να ενώσετε τραπέζια. Το RDBMS πρέπει να μπορεί να...
20319. ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ ΚΑΙ ΠΡΟΣΤΑΣΙΑ ΤΟΥΣ 102,86 KB
Επιχειρήσεων δικτυακές βάσεις δεδομένωνδεδομένα εμφανίστηκαν στα μέσα της δεκαετίας του 1960. Οι λειτουργίες σε λειτουργικές βάσεις δεδομένων υποβλήθηκαν σε επεξεργασία στο διαδραστική λειτουργίαχρησιμοποιώντας τερματικά. Οι απλοί οργανισμοί εγγραφών με διαδοχική ευρετηρίαση εξελίχθηκαν γρήγορα σε ένα πιο ισχυρό μοντέλο εγγραφών προσανατολισμένο στο σύνολο. Ο Charles Bachman έλαβε το βραβείο Turing για την ηγεσία του στην Ομάδα Εργασίας Βάσεων Δεδομένων (DBTG), η οποία ανέπτυξε μια τυπική γλώσσα για την περιγραφή και τον χειρισμό δεδομένων.
5031. Βιβλιοθήκη ανάπτυξης βάσεων δεδομένων 11,72 MB
Τεχνολογία σχεδιασμού βάσεων δεδομένων. Καθορίστε τις σχέσεις μεταξύ οντοτήτων και δημιουργήστε ένα μοντέλο δεδομένων. Οι κύριες ιδέες της σύγχρονης τεχνολογίας της πληροφορίας βασίζονται στην ιδέα ότι τα δεδομένα πρέπει να οργανώνονται σε βάσεις δεδομένων προκειμένου να απεικονίζουν επαρκώς τον μεταβαλλόμενο πραγματικό κόσμο και να καλύπτουν τις ανάγκες πληροφοριών των χρηστών. Αυτές οι βάσεις δεδομένων δημιουργούνται και λειτουργούν υπό τον έλεγχο ειδικών συστήματα λογισμικούπου ονομάζονται συστήματα διαχείρισης βάσεων δεδομένων DBMS.
13815. ΜΟΝΤΕΛΟ ΙΕΡΑΡΧΙΚΗΣ ΒΑΣΗΣ ΔΕΔΟΜΕΝΩΝ 81,62 KB
Οι κύριες ιδέες της σύγχρονης τεχνολογίας πληροφοριών βασίζονται στην έννοια των βάσεων δεδομένων, σύμφωνα με την οποία η βάση της πληροφορικής είναι δεδομένα οργανωμένα σε βάσεις δεδομένων που αντικατοπτρίζουν επαρκώς την κατάσταση μιας συγκεκριμένης θεματικής περιοχής και παρέχουν στον χρήστη ενημερωμένες πληροφορίεςσε αυτή τη θεματική περιοχή. Είναι απαραίτητο να αναγνωρίσουμε το γεγονός ότι τα δεδομένα είναι...
14095. Ανάπτυξη βάσης δεδομένων βιβλιοθήκης 11,72 MB
Η αύξηση του όγκου και της δομικής πολυπλοκότητας των αποθηκευμένων δεδομένων και η διεύρυνση του κύκλου των χρηστών των πληροφοριακών συστημάτων οδήγησαν στην ευρεία χρήση του πιο βολικού και σχετικά εύκολα κατανοητού σχεσιακού (πίνακα) DBMS.
5061. Δημιουργία βάσης δεδομένων κλινικής 2,4 MB
Ανάπτυξη ταμείων τεχνολογία υπολογιστώνκαι οι τεχνολογίες πληροφοριών παρείχαν ευκαιρίες για τη δημιουργία και την ευρεία χρήση αυτοματοποιημένων συστημάτων πληροφοριών (AIS) για διάφορους σκοπούς. Αναπτύσσονται και εφαρμόζονται πληροφοριακά συστήματα για τη διαχείριση οικονομικών και τεχνικών εγκαταστάσεων
13542. Βάσεις δεδομένων γεωλογικών πληροφοριών 20,73 KB
ΣΕ Πρόσφαταη εφαρμογή πραγματοποιείται με ταχείς ρυθμούς τεχνολογία υπολογιστώνκαι, ειδικότερα, βάσεις δεδομένων, σε επιστημονικό πεδίο. Αυτή η διαδικασία δεν παρακάμπτει τη γεωλογία, καθώς στις φυσικές επιστήμες υπάρχει ανάγκη για αποθήκευση και επεξεργασία μεγάλου όγκου πληροφοριών.
9100. Βάση δεδομένων. ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ 26,28 KB
Μια βάση δεδομένων είναι μια συλλογή πληροφοριών για συγκεκριμένα αντικείμενα του πραγματικού κόσμου σε οποιαδήποτε θεματική περιοχή, οικονομικά, διαχείριση, χημεία κ.λπ. Ο σκοπός ενός πληροφοριακού συστήματος δεν είναι απλώς να αποθηκεύει δεδομένα για αντικείμενα, αλλά και να χειρίζεται αυτά τα δεδομένα, λαμβάνοντας λαμβάνοντας υπόψη τις συνδέσεις μεταξύ των αντικειμένων. Κάθε αντικείμενο χαρακτηρίζεται από κάποιο σύνολο ιδιοτήτων δεδομένων, οι οποίες στη βάση δεδομένων ονομάζονται χαρακτηριστικά.
5240. Δημιουργία βάσης δεδομένων «Προσμητεία Πανεπιστημίου». 1,57 MB
Μια βάση δεδομένων (DB) είναι μια συλλογή διασυνδεδεμένων, αποθηκευμένων μαζί εξωτερικά μέσαμνήμη υπολογιστή δεδομένων, εάν υπάρχει τέτοια οργάνωση και ελάχιστος πλεονασμός που επιτρέπει τη βέλτιστη χρήση τους για μία ή περισσότερες εφαρμογές

Σκοπός της διάλεξης

Αφού μελετήσετε το υλικό αυτής της διάλεξης, θα γνωρίζετε:

  • τι συνέβη επιχειρηματικό μοντέλο δεδομένων ;
  • πώς να μετατρέψετε εταιρικό μοντέλο δεδομένωνστο μοντέλο αποθήκης δεδομένων·
  • ουσιαστικά στοιχεία εταιρικό μοντέλοδεδομένα ;
  • επίπεδα παρουσίασης του μοντέλου εταιρικών δεδομένων ;
  • αλγόριθμος για τη μετατροπή ενός εταιρικού μοντέλου δεδομένων σε ένα πολυδιάστατο μοντέλο αποθήκης δεδομένων ;

και μάθε:

  • ανάπτυξη μοντέλων αποθήκης δεδομένων με βάση εταιρικό μοντέλο δεδομένωνοργανισμοί?
  • αναπτύξτε ένα σχέδιο αστεριών χρησιμοποιώντας εργαλεία CASE.
  • πίνακες χωρισμάτων πολυδιάστατο μοντέλοχρησιμοποιώντας εργαλεία CASE.

Μοντέλο δεδομένων επιχείρησης

Εισαγωγή

Ο πυρήνας κάθε αποθήκης δεδομένων είναι το μοντέλο δεδομένων της. Χωρίς μοντέλο δεδομένων, θα είναι πολύ δύσκολο να οργανωθούν δεδομένα σε μια αποθήκη δεδομένων. Επομένως, οι προγραμματιστές HD πρέπει να αφιερώσουν χρόνο και προσπάθεια για την ανάπτυξη ενός τέτοιου μοντέλου. Η ανάπτυξη του μοντέλου HD πέφτει στους ώμους του σχεδιαστή HD.

Σε σύγκριση με το σχεδιασμό συστημάτων OLTP, η μεθοδολογία σχεδιασμού της αποθήκης δεδομένων έχει μια σειρά από χαρακτηριστικά γνωρίσματαπου σχετίζονται με τον προσανατολισμό των δομών αποθήκευσης δεδομένων για την επίλυση προβλημάτων ανάλυσης και υποστήριξη πληροφοριώνδιαδικασία λήψης αποφάσεων. Το μοντέλο δεδομένων της αποθήκης δεδομένων πρέπει να παρέχει αποτελεσματική λύσηακριβώς αυτά τα καθήκοντα.

Το σημείο εκκίνησης στο σχεδιασμό μιας αποθήκης δεδομένων μπορεί να είναι το λεγόμενο επιχειρηματικό μοντέλο δεδομένων(εταιρικό μοντέλο δεδομένων ή μοντέλο εταιρικών δεδομένων, EDM), το οποίο δημιουργείται κατά τη διαδικασία σχεδιασμού των συστημάτων OLTP ενός οργανισμού. Κατά το σχεδιασμό εταιρικό μοντέλο δεδομένωνΣυνήθως γίνεται προσπάθεια να δημιουργηθεί, με βάση τις επιχειρηματικές συναλλαγές, μια δομή δεδομένων που θα συλλέγει και θα συνθέτει όλα τα ανάγκες πληροφόρησηςοργανώσεις.

Ετσι, επιχειρηματικό μοντέλο δεδομένωνπεριέχει απαραίτητες πληροφορίεςγια την κατασκευή ενός μοντέλου αποθήκης δεδομένων. Επομένως, στο πρώτο στάδιο, εάν υπάρχει τέτοιο μοντέλο στον οργανισμό, ένας σχεδιαστής αποθήκης δεδομένων μπορεί να ξεκινήσει να σχεδιάζει μια αποθήκη δεδομένων λύνοντας το πρόβλημα μετασχηματισμού εταιρικό μοντέλο δεδομένων σε μοντέλο HD.

Μοντέλο δεδομένων επιχείρησης

Πώς να λύσετε το πρόβλημα μετασχηματισμού εταιρικό μοντέλο δεδομένωνστο μοντέλο HD; Για να λύσετε αυτό το πρόβλημα, πρέπει να έχετε αυτό το μοντέλο, π.χ. επιχειρηματικό μοντέλο δεδομένωνπρέπει να κατασκευαστεί και τεκμηριωμένη. Και πρέπει να καταλάβεις Τιαπό αυτό το μοντέλο και Πωςπρέπει να μετατραπεί σε μοντέλο αποθήκευσης δεδομένων.

Ας διευκρινίσουμε την έννοια από την οπτική γωνία ενός σχεδιαστή HD εταιρικό μοντέλο δεδομένων. Κάτω από εταιρικό μοντέλο δεδομένωνκατανοούν μια πολυεπίπεδη, δομημένη περιγραφή των θεματικών περιοχών του οργανισμού, των δομών δεδομένων της θεματικής περιοχής, των επιχειρηματικών διαδικασιών και των επιχειρησιακών διαδικασιών, των ροών δεδομένων που γίνονται αποδεκτές στον οργανισμό, των διαγραμμάτων κατάστασης, των πινάκων διαδικασιών δεδομένων και άλλων αναπαραστάσεων μοντέλων που χρησιμοποιούνται στις δραστηριότητες του οργανισμού . Έτσι, με την ευρεία έννοια της λέξης, επιχειρηματικό μοντέλο δεδομένωνείναι ένα σύνολο μοντέλων σε διάφορα επίπεδα που χαρακτηρίζουν (μοντέλο σε κάποιο αφηρημένο επίπεδο) τις δραστηριότητες ενός οργανισμού, δηλ. περιεχόμενο εταιρικό μοντέλοεξαρτάται άμεσα από το ποιες δομές μοντέλων συμπεριλήφθηκαν σε αυτό σε έναν δεδομένο οργανισμό.

Κύρια στοιχεία εταιρικό μοντέλο δεδομένωνείναι:

  • περιγραφή των θεματικών τομέων του οργανισμού (ορισμός τομέων δραστηριότητας).
  • σχέσεις μεταξύ των θεματικών περιοχών που ορίζονται παραπάνω·
  • μοντέλο δεδομένων πληροφοριών (μοντέλο ERD ή μοντέλο σχέσης οντοτήτων).
  • για κάθε περιγραφή θεματικής περιοχής:
    • κλειδιά οντοτήτων?
    • χαρακτηριστικά οντότητας;
    • υποτύποι και υπερτύποι?
    • συνδέσεις μεταξύ οντοτήτων·
    • ομαδοποιήσεις χαρακτηριστικών·
    • σχέσεις μεταξύ θεματικών περιοχών·
  • λειτουργικό μοντέλο ή μοντέλο επιχειρηματικής διαδικασίας·
  • διαγράμματα ροής δεδομένων.
  • διαγράμματα κατάστασης?
  • άλλα μοντέλα.

Ετσι, επιχειρηματικό μοντέλο δεδομένωνπεριέχει οντότητες, χαρακτηριστικά και σχέσεις που αντιπροσωπεύουν τις ανάγκες πληροφοριών ενός οργανισμού. Στο Σχ. Το 16.1 δείχνει τα κύρια στοιχεία εταιρικό μοντέλο δεδομένων.

Επίπεδα αναπαράστασης μοντέλων δεδομένων επιχείρησης

Μοντέλο δεδομένων επιχείρησηςχωρίζεται ανά θεματικές περιοχές, οι οποίες αντιπροσωπεύουν ομάδες οντοτήτων που σχετίζονται με την υποστήριξη συγκεκριμένων επιχειρηματικών αναγκών. Ορισμένοι θεματικοί τομείς μπορεί να καλύπτουν συγκεκριμένες επιχειρηματικές λειτουργίες, όπως η διαχείριση συμβολαίων, ενώ άλλοι μπορεί να συνδυάζουν οντότητες που περιγράφουν προϊόντα ή υπηρεσίες.

Κάθε λογικό μοντέλο πρέπει να αντιστοιχεί σε έναν υπάρχοντα τομέα προβλήματος εταιρικό μοντέλο δεδομένων. Αν το λογικό μοντέλο δεν ταιριάζει αυτή η απαίτηση, πρέπει να προστεθεί ένα μοντέλο που καθορίζει την περιοχή θέματος.

Μοντέλο δεδομένων επιχείρησηςσυνήθως έχει πολλά επίπεδα παρουσίασης. Πράγματι υψηλό επίπεδο (υψηλό επίπεδο) εταιρικό μοντέλο δεδομένωνυπάρχει περιγραφή των κύριων θεματικών τομέων του οργανισμού και των σχέσεών τους σε επίπεδο οντότητας. Στο Σχ. Το 16.2 δείχνει ένα θραύσμα εταιρικό μοντέλο δεδομένων κορυφαίο επίπεδο.


Ρύζι. 16.2.

Το διάγραμμα που φαίνεται στο σχήμα δείχνει τέσσερις θεματικές ενότητες: «Αγοραστής» ( Πελάτης), "Έλεγχος" ( λογαριασμός), "Σειρά" ( Σειρά) και "Προϊόν" ( Προϊόν). Συνήθως, στο ανώτερο επίπεδο, οι προβολές μοντέλων καθορίζουν μόνο άμεσες συνδέσειςμεταξύ θεματικών περιοχών, οι οποίες, για παράδειγμα, καταγράφουν το εξής γεγονός: ο αγοραστής πληρώνει ένα τιμολόγιο για την παραγγελία αγαθών. Λεπτομερείς πληροφορίες και έμμεσες σχέσεις σε αυτό το επίπεδο εταιρικό μοντέλοδεν δίνονται.

Στο επόμενο μέσο επίπεδο(μεσαίο επίπεδο) εταιρικό μοντέλο δεδομένωνεμφανίζει λεπτομερείς πληροφορίες σχετικά με αντικείμενα τομέα, π.χ. κλειδιά και χαρακτηριστικά οντότητας, τις σχέσεις τους, τους υποτύπους και τους υπερτύπους κ.λπ. Για κάθε τομέα του μοντέλου ανώτατου επιπέδου, υπάρχει ένα μοντέλο μεσαίου επιπέδου. Στο Σχ. Εμφανίζεται το 16.3 μέσο επίπεδοαναπαράσταση εταιρικό μοντέλογια ένα τμήμα της θεματικής περιοχής "Παραγγελία".

Από το Σχ. 16.3 μπορείτε να δείτε ότι η θεματική περιοχή "Παραγγελία" ( Σειρά) περιλαμβάνει πολλές οντότητες, που ορίζονται μέσω των ιδιοτήτων τους, και τις μεταξύ τους σχέσεις. Το μοντέλο που παρουσιάζεται σάς επιτρέπει να απαντάτε σε ερωτήσεις όπως η ημερομηνία της παραγγελίας, ποιος έκανε την παραγγελία, ποιος έστειλε την παραγγελία, ποιος έλαβε την παραγγελία και έναν αριθμό άλλων. Από το παραπάνω διάγραμμα είναι σαφές ότι σε αυτόν τον οργανισμό υπάρχουν δύο τύποι παραγγελιών - παραγγελίες για προώθηση ( Εμπορικός) και παραγγελίες από ΛΙΑΝΙΚΟ ΕΜΠΟΡΙΟ (Λιανεμποριο).

σημειώσε ότι επιχειρηματικό μοντέλο δεδομένωνμπορεί να αντιπροσωπεύει διαφορετικές πτυχές των δραστηριοτήτων ενός οργανισμού και με διάφορους βαθμούς λεπτομέρειας και πληρότητας. Αν εταιρικό μοντέλοαντιπροσωπεύει όλες τις πτυχές των δραστηριοτήτων του οργανισμού, ονομάζεται επίσης μοντέλο δεδομένων οργάνωσης(μοντέλο δεδομένων επιχείρησης).

Από σχεδιαστική άποψη HD σημαντικος ΠΑΡΑΓΟΝΤΑΣστην απόφαση δημιουργίας ενός μοντέλου αποθήκης δεδομένων από εταιρικό μοντέλο δεδομένωνείναι το κράτος πληρότητα εταιρικό μοντέλο δεδομένων.

Μοντέλο δεδομένων επιχείρησηςο οργανισμός έχει το χαρακτηριστικό της εξέλιξης, δηλ. συνεχώς αναπτύσσεται και βελτιώνεται. Ορισμένες θεματικές ενότητες εταιρικό μοντέλο δεδομένωνμπορεί να είναι καλά επεξεργασμένο, για κάποιους η δουλειά μπορεί να μην έχει ακόμη ξεκινήσει. Εάν ένα τμήμα της θεματικής περιοχής δεν έχει επεξεργαστεί στο εταιρικό μοντέλο δεδομένων, τότε δεν είναι δυνατό να χρησιμοποιηθεί αυτό το μοντέλο ως αφετηρίαΣχεδίαση HD.

Βαθμός ολοκλήρωσης εταιρικό μοντέλομπορούν να ισοπεδωθούν στο σχεδιασμό της εγκατάστασης αποθήκευσης ως εξής. Δεδομένου ότι η διαδικασία ανάπτυξης μιας αποθήκης δεδομένων συνήθως χωρίζεται χρονικά σε μια ακολουθία σταδίων, η διαδικασία σχεδιασμού της μπορεί να συγχρονιστεί με διαδικασία ολοκλήρωσηςανάπτυξη μεμονωμένων θραυσμάτων εταιρικό μοντέλο δεδομένωνοργανώσεις.

Στο χαμηλότερο επίπεδο παρουσίασης του εταιρικού μοντέλου δεδομένωνεμφανίζει πληροφορίες σχετικά με τα φυσικά χαρακτηριστικά των αντικειμένων βάσης δεδομένων που αντιστοιχούν λογικό μοντέλοδεδομέναμέση τιμή επίπεδο παρουσίασης του εταιρικού μοντέλου δεδομένων.