Διακριτή εικόνα. Μετάβαση από συνεχή σήματα και μετασχηματισμούς σε διακριτά

Οι εικόνες που αποτελούνται από διακριτά στοιχεία, καθένα από τα οποία μπορεί να λάβει μόνο έναν πεπερασμένο αριθμό διακριτών τιμών που αλλάζουν σε ένα πεπερασμένο χρόνο, ονομάζονται διακριτές. Πρέπει να τονιστεί ότι τα στοιχεία μιας διακριτής εικόνας, σε γενικές γραμμές, μπορεί να έχουν άνισο εμβαδόν και καθένα από αυτά μπορεί να έχει άνισο αριθμό διακριτών διαβαθμίσεων.

Όπως φάνηκε στο πρώτο κεφάλαιο, ο αμφιβληστροειδής εκπέμπει ανώτερα τμήματαοπτικός αναλυτής διακριτών εικόνων.

Η φαινομενική τους συνέχεια είναι μόνο μία από τις ψευδαισθήσεις της όρασης. Αυτή η «κβαντοποίηση» των αρχικά συνεχών εικόνων δεν καθορίζεται από τους περιορισμούς που σχετίζονται με την ανάλυση του οπτικού συστήματος του ματιού και ούτε καν από τα μορφολογικά δομικά στοιχεία του οπτικού συστήματος, αλλά από τη λειτουργική οργάνωση των νευρικών δικτύων.

Η εικόνα χωρίζεται σε διακριτά στοιχεία από δεκτικά πεδία που ενώνουν τον ένα ή τον άλλο αριθμό φωτοϋποδοχέων. Τα δεκτικά πεδία παράγουν την κύρια επιλογή του χρήσιμου φωτεινού σήματος μέσω χωρικής και χρονικής άθροισης.

Το κεντρικό τμήμα του αμφιβληστροειδούς (fovea) καταλαμβάνεται μόνο από κώνους στην περιφέρεια έξω από το βοθρίο υπάρχουν και κώνοι και ράβδοι. Υπό συνθήκες νυχτερινής όρασης, τα κωνικά πεδία στο κεντρικό τμήμα του αμφιβληστροειδούς έχουν περίπου το ίδιο μέγεθος (περίπου 5" σε γωνιακό μέτρο). Ο αριθμός τέτοιων πεδίων στο βοθρίο, του οποίου οι γωνιακές διαστάσεις είναι περίπου 90", είναι περίπου 200. Τον κύριο ρόλο στις συνθήκες νυχτερινής όρασης παίζουν τα πεδία των ράβδων, τα οποία καταλαμβάνουν ολόκληρη την υπόλοιπη επιφάνεια του αμφιβληστροειδούς. Έχουν γωνιακό μέγεθος περίπου 1° σε όλη την επιφάνεια του αμφιβληστροειδούς. Ο αριθμός τέτοιων πεδίων στον αμφιβληστροειδή είναι περίπου 3 χιλιάδες Όχι μόνο η ανίχνευση, αλλά και η θέαση αντικειμένων με χαμηλό φωτισμό υπό αυτές τις συνθήκες πραγματοποιείται από τις περιφερειακές περιοχές του αμφιβληστροειδούς.

Καθώς ο φωτισμός αυξάνεται, ένα άλλο σύστημα κυψελών αποθήκευσης - τα πεδία υποδοχής κώνου - αρχίζει να παίζει σημαντικό ρόλο. Στο βοθρίο, μια αύξηση του φωτισμού προκαλεί σταδιακή μείωση της ισχύος του ενεργού πεδίου έως ότου, σε φωτεινότητα περίπου 100 asb, μειωθεί σε έναν κώνο. Στην περιφέρεια, με την αύξηση του φωτισμού, τα πεδία των ράβδων σταδιακά σβήνουν (επιβραδύνουν) και τα πεδία κώνου μπαίνουν σε δράση. Τα κωνικά πεδία στην περιφέρεια, όπως και τα βοθροειδή πεδία, έχουν την ικανότητα να μειώνονται ανάλογα με την φωτεινή ενέργεια που προσπίπτει σε αυτά. Μεγαλύτερη ποσότηταοι κώνοι, τους οποίους τα πεδία υποδοχής κώνου μπορούν να έχουν με αυξανόμενο φωτισμό, αναπτύσσονται από το κέντρο προς τις άκρες του αμφιβληστροειδούς και σε γωνιακή απόσταση 50-60° από το κέντρο φτάνει περίπου τις 90.

Μπορεί να υπολογιστεί ότι σε καλές συνθήκες το φως της ημέραςο αριθμός των δεκτικών πεδίων φτάνει περίπου τις 800 χιλιάδες Αυτή η τιμή αντιστοιχεί περίπου στον αριθμό των ινών στο ανθρώπινο οπτικό νεύρο. Η διάκριση (ανάλυση) αντικειμένων στην ημερήσια όραση πραγματοποιείται κυρίως από το βοθρίο, όπου το δεκτικό πεδίο μπορεί να μειωθεί σε έναν κώνο και οι ίδιοι οι κώνοι βρίσκονται πιο πυκνά.

Εάν ο αριθμός των κυττάρων αποθήκευσης του αμφιβληστροειδούς μπορεί να προσδιοριστεί σε ικανοποιητική προσέγγιση, τότε δεν υπάρχουν ακόμη επαρκή δεδομένα για τον προσδιορισμό του αριθμού των πιθανών καταστάσεων των δεκτικών πεδίων. Μόνο ορισμένες εκτιμήσεις μπορούν να γίνουν με βάση τη μελέτη των διαφορικών ορίων των δεκτικών πεδίων. Η αντίθεση κατωφλίου στα πεδία υποδοχής του βοθρίου σε ένα συγκεκριμένο εύρος φωτισμού λειτουργίας είναι της τάξης του 1. Σε αυτήν την περίπτωση, ο αριθμός των διακριτών διαβαθμίσεων είναι μικρός. Σε όλο το εύρος της αναδιάρθρωσης του δεκτικού πεδίου του βοθρίου κώνου, διαφέρουν 8-9 διαβαθμίσεις.

Η περίοδος συσσώρευσης στο δεκτικό πεδίο - η λεγόμενη κρίσιμη διάρκεια - καθορίζεται κατά μέσο όρο από μια τιμή περίπου 0,1 δευτερολέπτου, αλλά σε υψηλά επίπεδαο φωτισμός μπορεί προφανώς να μειωθεί σημαντικά.

Στην πραγματικότητα, το μοντέλο που περιγράφει τη διακριτή δομή μεταδιδόμενες εικόνες, θα πρέπει να είναι ακόμα πιο δύσκολο. Θα πρέπει να λάβει κανείς υπόψη τη σχέση μεταξύ των μεγεθών των δεκτικών πεδίων, των ορίων και της κρίσιμης διάρκειας, καθώς και τη στατιστική φύση των οπτικών ορίων. Αλλά προς το παρόν δεν υπάρχει ανάγκη για αυτό. Αρκεί να φανταστούμε ως μοντέλο εικόνας ένα σύνολο στοιχείων ίσου εμβαδού, των οποίων οι γωνιακές διαστάσεις είναι μικρότερες από τις γωνιακές διαστάσεις της παραμικρής λεπτομέρειας που επιλύεται από το μάτι, ο αριθμός των διακριτών καταστάσεων των οποίων είναι μεγαλύτερος από τον μέγιστο αριθμό διακριτών διαβαθμίσεων φωτεινότητας και ο χρόνος διακριτής αλλαγής των οποίων είναι μικρότερος από την περίοδο τρεμοπαίζει στην κρίσιμη συχνότητα σύντηξης τρεμούλιασμα.

Αν αντικαταστήσουμε εικόνες πραγματικών συνεχών αντικειμένων έξω κόσμοςτέτοιες διακριτές εικόνες, το μάτι δεν θα παρατηρήσει την αντικατάσταση.* Κατά συνέπεια, διακριτές εικόνες αυτού του είδους περιέχουν τουλάχιστονόχι λιγότερες πληροφορίες από αυτές που αντιλαμβάνεται το οπτικό σύστημα. **

* Χρώματα και ογκομετρικές εικόνεςμπορεί επίσης να αντικατασταθεί από ένα διακριτό μοντέλο.
** Το πρόβλημα της αντικατάστασης συνεχών εικόνων με διακριτές έχει σπουδαίοςγια την τεχνολογία του κινηματογράφου και της τηλεόρασης. Η κβαντοποίηση του χρόνου είναι η βάση αυτής της τεχνικής. Στα τηλεοπτικά συστήματα με παλμικό κώδικα, η εικόνα διαιρείται επίσης σε διακριτά στοιχεία και κβαντίζεται με βάση τη φωτεινότητα.

Μπορείτε να αντικαταστήσετε μια συνεχή εικόνα με μια διακριτή διαφορετικοί τρόποι. Μπορείτε, για παράδειγμα, να επιλέξετε οποιοδήποτε σύστημα ορθογώνιων συναρτήσεων και, έχοντας υπολογίσει τους συντελεστές αναπαράστασης εικόνας χρησιμοποιώντας αυτό το σύστημα (χρησιμοποιώντας αυτή τη βάση), να αντικαταστήσετε την εικόνα με αυτούς. Η ποικιλία των βάσεων καθιστά δυνατό τον σχηματισμό διαφόρων διακριτών αναπαραστάσεων μιας συνεχούς εικόνας. Ωστόσο, η πιο συχνά χρησιμοποιούμενη είναι η περιοδική δειγματοληψία, ειδικότερα, όπως προαναφέρθηκε, η δειγματοληψία με ορθογώνιο ράστερ. Αυτή η μέθοδος διακριτοποίησης μπορεί να θεωρηθεί ως μία από τις επιλογές για τη χρήση μιας ορθογώνιας βάσης που χρησιμοποιεί μετατοπισμένες συναρτήσεις ως στοιχεία της. Στη συνέχεια, ακολουθώντας κυρίως, θα εξετάσουμε αναλυτικά τα κύρια χαρακτηριστικά της ορθογώνιας δειγματοληψίας.

Έστω μια συνεχής εικόνα και έστω η αντίστοιχη διακριτή, που προκύπτει από τη συνεχή με ορθογώνια δειγματοληψία. Αυτό σημαίνει ότι η σχέση μεταξύ τους καθορίζεται από την έκφραση:

όπου βρίσκονται τα κάθετα και οριζόντια βήματα ή τα διαστήματα δειγματοληψίας, αντίστοιχα. Το Σχ. 1.1 απεικονίζει τη θέση των δειγμάτων στο επίπεδο με ορθογώνια δειγματοληψία.

Το κύριο ερώτημα που ανακύπτει κατά την αντικατάσταση μιας συνεχούς εικόνας με μια διακριτή είναι να καθοριστούν οι συνθήκες υπό τις οποίες ολοκληρώνεται μια τέτοια αντικατάσταση, δηλ. δεν συνοδεύεται από απώλεια πληροφοριών που περιέχονται στο συνεχές σήμα. Δεν υπάρχουν απώλειες εάν, έχοντας διακριτό σήμα, μπορείτε να επαναφέρετε τη συνεχή. Από μαθηματική άποψη, το ζητούμενο είναι επομένως να ανακατασκευαστεί ένα συνεχές σήμα σε δισδιάστατους χώρους μεταξύ κόμβων στους οποίους είναι γνωστές οι τιμές του ή, με άλλα λόγια, να πραγματοποιηθεί δισδιάστατη παρεμβολή. Αυτή η ερώτηση μπορεί να απαντηθεί με ανάλυση φασματικές ιδιότητεςσυνεχείς και διακριτές εικόνες.

Το δισδιάστατο συνεχές φάσμα συχνοτήτων ενός συνεχούς σήματος προσδιορίζεται από έναν δισδιάστατο άμεσο μετασχηματισμό Fourier:

που αντιστοιχεί στο δισδιάστατο αντίστροφο συνεχής μεταμόρφωση Fourier:

Η τελευταία σχέση ισχύει για οποιεσδήποτε τιμές, συμπεριλαμβανομένων των κόμβων ενός ορθογώνιου πλέγματος . Επομένως, για τις τιμές σήματος στους κόμβους, λαμβάνοντας υπόψη το (1.1), η σχέση (1.3) μπορεί να γραφτεί ως:

Για συντομία, ας υποδηλώσουμε με μια ορθογώνια τομή στον τομέα της δισδιάστατης συχνότητας. Ο υπολογισμός του ολοκληρώματος στο (1.4) σε ολόκληρο τον τομέα συχνότητας μπορεί να αντικατασταθεί από ολοκλήρωση σε επιμέρους περιοχέςκαι συνοψίζοντας τα αποτελέσματα:

Αντικαθιστώντας τις μεταβλητές σύμφωνα με τον κανόνα, επιτυγχάνουμε ανεξαρτησία του τομέα ολοκλήρωσης από τους αριθμούς και:

Εδώ λαμβάνεται υπόψη ότι για τυχόν ακέραιες τιμές και . Αυτή η έκφραση είναι πολύ κοντά σε μορφή με τον αντίστροφο μετασχηματισμό Fourier. Η μόνη διαφορά είναι η λανθασμένη μορφή του εκθετικού παράγοντα. Για να του δώσουμε την απαιτούμενη μορφή, εισάγουμε κανονικοποιημένες συχνότητες και πραγματοποιούμε μια αλλαγή μεταβλητών σύμφωνα με αυτό. Ως αποτέλεσμα παίρνουμε:

Τώρα η έκφραση (1.5) έχει τη μορφή ενός αντίστροφου μετασχηματισμού Fourier, επομένως, η συνάρτηση κάτω από το ολοκληρωτικό πρόσημο είναι

(1.6)

είναι ένα δισδιάστατο φάσμα μιας διακριτής εικόνας. Στο επίπεδο των μη τυποποιημένων συχνοτήτων, η έκφραση (1.6) έχει τη μορφή:

(1.7)

Από το (1.7) προκύπτει ότι το δισδιάστατο φάσμα μιας διακριτής εικόνας είναι ορθογώνια περιοδικό με τελείες και κατά μήκος των αξόνων συχνότητας και, αντίστοιχα. Το φάσμα μιας διακριτής εικόνας σχηματίζεται ως αποτέλεσμα της άθροισης ενός άπειρου αριθμού φασμάτων μιας συνεχούς εικόνας, που διαφέρουν μεταξύ τους σε μετατοπίσεις συχνότητας και . Το Σχ. 1.2 δείχνει ποιοτικά τη σχέση μεταξύ των δισδιάστατων φασμάτων συνεχών (Εικ. 1.2.α) και διακριτών (Εικ. 1.2.β) εικόνων.

Ρύζι. 1.2. Φάσματα συχνότητας συνεχών και διακριτών εικόνων

Το ίδιο το αποτέλεσμα της άθροισης εξαρτάται σημαντικά από τις τιμές αυτών των μετατοπίσεων συχνότητας ή, με άλλα λόγια, από την επιλογή των διαστημάτων δειγματοληψίας. Ας υποθέσουμε ότι το φάσμα μιας συνεχούς εικόνας είναι μη μηδενικό σε μια ορισμένη δισδιάστατη περιοχή στην περιοχή της μηδενικής συχνότητας, δηλαδή περιγράφεται από μια δισδιάστατη πεπερασμένη συνάρτηση. Εάν τα διαστήματα δειγματοληψίας επιλεγούν έτσι ώστε για , , τότε η επικάλυψη μεμονωμένων κλάδων κατά το σχηματισμό του αθροίσματος (1.7) δεν θα συμβεί. Κατά συνέπεια, μέσα σε κάθε ορθογώνιο τμήμα μόνο ένας όρος θα διαφέρει από το μηδέν. Ειδικότερα, όταν έχουμε:

στο , . (1.8)

Έτσι, εντός του πεδίου συχνοτήτων, τα φάσματα συνεχών και διακριτών εικόνων συμπίπτουν μέχρι έναν σταθερό παράγοντα. Σε αυτήν την περίπτωση, το φάσμα της διακριτής εικόνας σε αυτήν την περιοχή συχνότητας περιέχει πλήρεις πληροφορίεςσχετικά με το φάσμα μιας συνεχούς εικόνας. Τονίζουμε ότι αυτή η σύμπτωση συμβαίνει μόνο υπό καθορισμένες συνθήκες, που καθορίζονται από μια επιτυχημένη επιλογή διαστημάτων δειγματοληψίας. Σημειώστε ότι η εκπλήρωση αυτών των προϋποθέσεων, σύμφωνα με το (1.8), επιτυγχάνεται σε αρκετά μικρές τιμές διαστημάτων δειγματοληψίας, τα οποία πρέπει να πληρούν τις απαιτήσεις:

στο οποίο βρίσκονται οι οριακές συχνότητες του δισδιάστατου φάσματος.

Η σχέση (1.8) καθορίζει τη μέθοδο λήψης μιας συνεχούς εικόνας από μια διακριτή. Για να γίνει αυτό, αρκεί να εκτελέσετε δισδιάστατο φιλτράρισμα μιας διακριτής εικόνας χρησιμοποιώντας ένα χαμηλοπερατό φίλτρο με απόκριση συχνότητας

Το φάσμα της εικόνας στην έξοδό της περιέχει μη μηδενικά συστατικά μόνο στον τομέα συχνότητας και είναι ίσο, σύμφωνα με το (1.8), με το φάσμα μιας συνεχούς εικόνας. Αυτό σημαίνει ότι η εικόνα εξόδου ενός ιδανικού φίλτρου χαμηλές συχνότητεςσυμπίπτει με .

Έτσι, η ιδανική ανακατασκευή παρεμβολής μιας συνεχούς εικόνας πραγματοποιείται χρησιμοποιώντας ένα δισδιάστατο φίλτρο με ορθογώνια απόκριση συχνότητας (1.10). Δεν είναι δύσκολο να γράψετε ρητά έναν αλγόριθμο για την ανακατασκευή μιας συνεχούς εικόνας. Δισδιάστατη παρορμητική απόκρισηΤο φίλτρο ανακατασκευής, το οποίο μπορεί να ληφθεί εύκολα χρησιμοποιώντας τον αντίστροφο μετασχηματισμό Fourier από το (1.10), έχει τη μορφή:

.

Το προϊόν φίλτρου μπορεί να προσδιοριστεί χρησιμοποιώντας μια δισδιάστατη συνέλιξη της εικόνας εισόδου και μια δεδομένη απόκριση παλμού. Αναπαράσταση της εικόνας εισόδου ως μια δισδιάστατη ακολουθία συναρτήσεων

μετά την εκτέλεση της περιέλιξης βρίσκουμε:

Η σχέση που προκύπτει υποδεικνύει μια μέθοδο για την ακριβή ανακατασκευή παρεμβολής μιας συνεχούς εικόνας από μια γνωστή ακολουθία των δισδιάστατων δειγμάτων της. Σύμφωνα με αυτήν την έκφραση, για ακριβή ανακατασκευή, οι δισδιάστατες συναρτήσεις της φόρμας θα πρέπει να χρησιμοποιούνται ως συναρτήσεις παρεμβολής. Η σχέση (1.11) είναι μια δισδιάστατη εκδοχή του θεωρήματος Kotelnikov-Nyquist.

Ας τονίσουμε για άλλη μια φορά ότι αυτά τα αποτελέσματα είναι έγκυρα εάν το δισδιάστατο φάσμα του σήματος είναι πεπερασμένο και τα διαστήματα δειγματοληψίας είναι αρκετά μικρά. Η ορθότητα των συμπερασμάτων που εξάγονται παραβιάζεται εάν δεν πληρούται τουλάχιστον μία από αυτές τις προϋποθέσεις. Οι πραγματικές εικόνες σπάνια έχουν φάσματα με έντονες συχνότητες αποκοπής. Ένας από τους λόγους που οδηγεί στο απεριόριστο φάσμα είναι το περιορισμένο μέγεθος εικόνας. Εξαιτίας αυτού, όταν αθροίζονται στο (1.7), η δράση όρων από γειτονικές φασματικές ζώνες εμφανίζεται σε κάθε μία από τις ζώνες. Σε αυτή την περίπτωση, η ακριβής αποκατάσταση μιας συνεχούς εικόνας καθίσταται εντελώς αδύνατη. Συγκεκριμένα, η χρήση φίλτρου με ορθογώνια απόκριση συχνότητας δεν οδηγεί σε ακριβή ανακατασκευή.

Ένα χαρακτηριστικό της βέλτιστης αποκατάστασης εικόνας στα διαστήματα μεταξύ των δειγμάτων είναι η χρήση όλων των δειγμάτων μιας διακριτής εικόνας, όπως ορίζεται στη διαδικασία (1.11). Αυτό δεν είναι πάντα βολικό, είναι συχνά απαραίτητο να ανακατασκευαστεί ένα σήμα σε μια τοπική περιοχή, βασιζόμενος σε έναν μικρό αριθμό διαθέσιμων διακριτών τιμών. Σε αυτές τις περιπτώσεις, συνιστάται η χρήση σχεδόν βέλτιστης ανακατασκευής χρησιμοποιώντας διάφορες συναρτήσεις παρεμβολής. Αυτό το είδος προβλήματος προκύπτει, για παράδειγμα, κατά την επίλυση του προβλήματος της σύνδεσης δύο εικόνων, όταν, λόγω του γεωμετρικού αποσυντονισμού αυτών των εικόνων, οι διαθέσιμες αναγνώσεις μιας από αυτές μπορεί να αντιστοιχούν σε ορισμένα σημεία που βρίσκονται στα κενά μεταξύ των κόμβων του άλλα. Η λύση σε αυτό το πρόβλημα συζητείται με περισσότερες λεπτομέρειες στις επόμενες ενότητες αυτού του εγχειριδίου.

Ρύζι. 1.3. Η επίδραση του διαστήματος δειγματοληψίας στην ανακατασκευή εικόνας

"Δακτυλικό αποτύπωμα"

Ρύζι. Το σχήμα 1.3 απεικονίζει την επίδραση των διαστημάτων δειγματοληψίας στην αποκατάσταση της εικόνας. Η αρχική εικόνα, η οποία είναι δακτυλικό αποτύπωμα, φαίνεται στην Εικ. 1.3, α, και ένα από τα τμήματα του κανονικοποιημένου φάσματος του είναι στο Σχ. 1.3, β. Αυτή η εικόνα είναι διακριτή και η τιμή χρησιμοποιείται ως συχνότητα αποκοπής. Όπως προκύπτει από το Σχ. 1.3, b, η τιμή του φάσματος σε αυτή τη συχνότητα είναι αμελητέα, γεγονός που εγγυάται ανακατασκευή υψηλής ποιότητας. Μάλιστα, παρατηρείται στο Σχ. 1.3.a η εικόνα είναι το αποτέλεσμα της επαναφοράς μιας συνεχούς εικόνας και ο ρόλος ενός φίλτρου επαναφοράς εκτελείται από μια συσκευή οπτικοποίησης - οθόνη ή εκτυπωτή. Υπό αυτή την έννοια, η εικόνα στο Σχ. Το 1.3.α μπορεί να θεωρηθεί συνεχές.

Ρύζι. 1.3, c, d δείχνουν τις συνέπειες μιας λανθασμένης επιλογής των διαστημάτων δειγματοληψίας. Κατά την απόκτησή τους, η «συνεχής» εικόνα «δειγματίστηκε» στο Σχ. 1.3.α αραιώνοντας τις ενδείξεις του. Ρύζι. Το 1.3,c αντιστοιχεί σε μια αύξηση στο βήμα δειγματοληψίας για κάθε συντεταγμένη κατά τρεις, και το Σχ. 1,3, g - τέσσερις φορές. Αυτό θα ήταν αποδεκτό εάν οι τιμές των συχνοτήτων αποκοπής ήταν χαμηλότερες κατά τον ίδιο αριθμό φορών. Μάλιστα, όπως φαίνεται από το Σχ. 1.3, β, υπάρχει παραβίαση των απαιτήσεων (1.9), ιδιαίτερα σοβαρή όταν τα δείγματα αραιώνονται τέσσερις φορές. Επομένως, οι εικόνες που έχουν αποκατασταθεί χρησιμοποιώντας τον αλγόριθμο (1.11) όχι μόνο αποεστιάζονται, αλλά και παραμορφώνουν πολύ την υφή της εκτύπωσης.

Ρύζι. 1.4. Η επίδραση του διαστήματος δειγματοληψίας στην ανακατασκευή της εικόνας «Πορτραίτο».

Στο Σχ. Το 1.4 δείχνει μια παρόμοια σειρά αποτελεσμάτων που ελήφθησαν για μια εικόνα τύπου "πορτραίτου". Οι συνέπειες της ισχυρότερης αραίωσης (τέσσερις φορές στο Σχ. 1.4.γ και έξι φορές στο Σχ. 1.4.δ) εκδηλώνονται κυρίως σε απώλεια διαύγειας. Υποκειμενικά, η απώλεια ποιότητας φαίνεται λιγότερο σημαντική από ό,τι στο Σχ. 1.3. Αυτό εξηγείται από το σημαντικά μικρότερο φασματικό πλάτος από αυτό μιας εικόνας δακτυλικών αποτυπωμάτων. Δειγματοληψία πρωτότυπη εικόνααντιστοιχεί στη συχνότητα αποκοπής. Όπως φαίνεται από το Σχ. 1.4.b, αυτή η τιμή είναι πολύ υψηλότερη από την πραγματική τιμή. Επομένως, η αύξηση του διαστήματος δειγματοληψίας, που απεικονίζεται στο Σχ. 1.3, c, d, αν και επιδεινώνει την εικόνα, εξακολουθεί να μην οδηγεί σε τέτοιες καταστροφικές συνέπειες όπως στο προηγούμενο παράδειγμα.

Ένα άτομο είναι σε θέση να αντιλαμβάνεται και να αποθηκεύει πληροφορίες με τη μορφή εικόνων (οπτικές, ηχητικές, απτικές, γευστικές και οσφρητικές). Οπτικές εικόνεςμπορούν να αποθηκευτούν με τη μορφή εικόνων (σχέδια, φωτογραφίες, κ.λπ.), και ηχητικές μπορούν να εγγραφούν σε δίσκους, μαγνητικές ταινίες, δίσκους λέιζερ κ.λπ.

Οι πληροφορίες, συμπεριλαμβανομένων γραφικών και ήχου, μπορούν να παρουσιαστούν σε αναλογική ή διακριτή μορφή. Με την αναλογική αναπαράσταση, ένα φυσικό μέγεθος παίρνει άπειρο αριθμό τιμών και οι τιμές του αλλάζουν συνεχώς. Με μια διακριτή αναπαράσταση, ένα φυσικό μέγεθος παίρνει ένα πεπερασμένο σύνολο τιμών και η τιμή του αλλάζει απότομα.

Ένα παράδειγμα αναλογικής αναπαράστασης γραφικών πληροφοριών είναι, για παράδειγμα, ένας πίνακας του οποίου το χρώμα αλλάζει συνεχώς, και ένα διακριτό είναι μια εικόνα που εκτυπώνεται χρησιμοποιώντας έναν εκτυπωτή inkjet και αποτελείται από μεμονωμένες κουκκίδες διαφορετικό χρώμα. Ένα παράδειγμα αναλογικής αποθήκευσης πληροφοριών ήχου είναι δίσκος βινυλίου(το ηχητικό κομμάτι αλλάζει συνεχώς το σχήμα του) και διακριτό – ένας δίσκος ήχου (το κομμάτι ήχου του οποίου περιέχει περιοχές με διαφορετική ανακλαστικότητα).

Η μετατροπή γραφικών και ηχητικών πληροφοριών από αναλογική σε διακριτή μορφή πραγματοποιείται με δειγματοληψία, δηλαδή με διαίρεση μιας συνεχούς γραφικής εικόνας και ενός συνεχούς (αναλογικού) ηχητικού σήματος σε μεμονωμένα στοιχεία. Η διαδικασία δειγματοληψίας περιλαμβάνει την κωδικοποίηση, δηλαδή την ανάθεση σε κάθε στοιχείο μιας συγκεκριμένης τιμής με τη μορφή ενός κωδικού.

Δειγματοληψία είναι η μετατροπή συνεχών εικόνων και ήχου σε ένα σύνολο διακριτών τιμών με τη μορφή κωδικών.

Κωδικοποίηση εικόνας

Δημιουργία και αποθήκευση γραφικά αντικείμενασε έναν υπολογιστή υπάρχουν δύο τρόποι - πώς ράστερή πώς διάνυσμαεικόνα. Κάθε τύπος εικόνας χρησιμοποιεί τη δική του μέθοδο κωδικοποίησης.

Κωδικοποίηση bitmap

Μια εικόνα ράστερ είναι μια συλλογή από κουκκίδες (pixel) διαφορετικών χρωμάτων. Ένα pixel είναι η μικρότερη περιοχή μιας εικόνας της οποίας το χρώμα μπορεί να ρυθμιστεί ανεξάρτητα.

Κατά τη διαδικασία κωδικοποίησης, μια εικόνα διακριτοποιείται χωρικά. Η χωρική δειγματοληψία μιας εικόνας μπορεί να συγκριθεί με την κατασκευή μιας εικόνας από ένα μωσαϊκό (ένας μεγάλος αριθμός μικρών πολύχρωμων γυαλιών). Η εικόνα χωρίζεται σε ξεχωριστά μικρά θραύσματα (κουκκίδες) και σε κάθε θραύσμα εκχωρείται μια τιμή χρώματος, δηλαδή ένας κωδικός χρώματος (κόκκινο, πράσινο, μπλε κ.λπ.).

Για μια ασπρόμαυρη εικόνα, ο όγκος πληροφοριών ενός σημείου είναι ίσος με ένα bit (είτε ασπρόμαυρο - είτε 1 είτε 0).

Για τέσσερα χρώματα – 2 bit.

Για 8 χρώματα χρειάζεστε 3 bit.

Για 16 χρώματα – 4 bit.

Για 256 χρώματα – 8 bit (1 byte).

Η ποιότητα της εικόνας εξαρτάται από τον αριθμό των κουκκίδων (από μικρότερο μέγεθοςσημεία και, κατά συνέπεια, όσο μεγαλύτερος είναι ο αριθμός τους, τόσο καλύτερη είναι η ποιότητα) και ο αριθμός των χρωμάτων που χρησιμοποιούνται (όσο περισσότερα χρώματα, τόσο καλύτερα κωδικοποιείται η εικόνα).

Για την αναπαράσταση του χρώματος ως αριθμητικού κώδικα, χρησιμοποιούνται δύο αντίστροφα μοντέλα χρώματος: RGBή CMYK. Το μοντέλο RGB χρησιμοποιείται σε τηλεοράσεις, οθόνες, προβολείς, σαρωτές, ψηφιακές κάμερες... Τα κύρια χρώματα σε αυτό το μοντέλο είναι: κόκκινο (Κόκκινο), πράσινο (Πράσινο), μπλε (Μπλε). Έγχρωμο μοντέλοΤο CMYK χρησιμοποιείται στην εκτύπωση κατά τη δημιουργία εικόνων που προορίζονται για εκτύπωση σε χαρτί.

Οι έγχρωμες εικόνες μπορεί να έχουν διαφορετικά βάθη χρώματος, τα οποία καθορίζονται από τον αριθμό των bits που χρησιμοποιούνται για την κωδικοποίηση του χρώματος μιας κουκκίδας.

Αν κωδικοποιήσουμε το χρώμα ενός pixel σε μια εικόνα με τρία bit (ένα bit για κάθε χρώμα RGB), θα έχουμε και τα οκτώ διαφορετικά χρώματα.

Χρώμα

Μωβ

Στην πράξη, για την αποθήκευση πληροφοριών σχετικά με το χρώμα κάθε σημείου μιας έγχρωμης εικόνας στο μοντέλο RGB, συνήθως εκχωρούνται 3 byte (δηλαδή 24 bit) - 1 byte (δηλαδή, 8 bit) για την τιμή χρώματος κάθε στοιχείου . Έτσι, κάθε στοιχείο RGB μπορεί να πάρει μια τιμή στην περιοχή από 0 έως 255 (2 8 = 256 τιμές συνολικά) και κάθε σημείο εικόνας, με ένα τέτοιο σύστημα κωδικοποίησης, μπορεί να χρωματιστεί σε ένα από τα 16.777.216 χρώματα. Αυτό το σύνολο χρωμάτων ονομάζεται συνήθως True Color, επειδή το ανθρώπινο μάτι εξακολουθεί να μην μπορεί να διακρίνει μια μεγαλύτερη ποικιλία.

Για να σχηματιστεί μια εικόνα στην οθόνη της οθόνης, πληροφορίες για κάθε κουκκίδα (κωδικός χρώματος κουκκίδας) πρέπει να αποθηκευτούν στη μνήμη βίντεο του υπολογιστή. Ας υπολογίσουμε την απαιτούμενη ποσότητα μνήμης βίντεο για ένα από αυτά λειτουργίες γραφικών. Στους σύγχρονους υπολογιστές, η ανάλυση της οθόνης είναι συνήθως 1280x1024 pixel. Εκείνοι. σύνολο 1280 * 1024 = 1310720 πόντοι. Με βάθος χρώματος 32 bit ανά pixel, η απαιτούμενη ποσότητα μνήμης βίντεο είναι: 32 * 1310720 = 41943040 bit = 5242880 byte = 5120 KB = 5 MB.

Οι εικόνες ράστερ είναι πολύ ευαίσθητες στην κλιμάκωση (μεγέθυνση ή σμίκρυνση). Κατά τη μείωση μιας εικόνας ράστερ, πολλά γειτονικά σημεία μετατρέπονται σε ένα, επομένως η ορατότητα χάνεται μικρά κομμάτιαεικόνες. Όταν μεγεθύνετε την εικόνα, το μέγεθος κάθε κουκκίδας αυξάνεται και εμφανίζεται ένα εφέ βήματος που μπορείτε να το δείτε με γυμνό μάτι.

Στο προηγούμενο κεφάλαιο μελετήσαμε γραμμικά χωρικά αμετάβλητα συστήματα σε ένα συνεχές δισδιάστατο πεδίο. Στην πράξη, έχουμε να κάνουμε με εικόνες που έχουν περιορισμένες διαστάσεις και ταυτόχρονα μετρώνται σε ένα διακριτό σύνολο σημείων. Ως εκ τούτου, οι μέθοδοι που έχουν αναπτυχθεί μέχρι τώρα πρέπει να προσαρμοστούν, να επεκταθούν και να τροποποιηθούν ώστε να μπορούν να εφαρμοστούν σε έναν τέτοιο τομέα. Προκύπτουν επίσης αρκετά νέα σημεία που απαιτούν προσεκτική εξέταση.

Το θεώρημα δειγματοληψίας μας λέει υπό ποιες συνθήκες μια συνεχής εικόνα μπορεί να ανακατασκευαστεί με ακρίβεια από ένα διακριτό σύνολο τιμών. Θα μάθουμε επίσης τι συμβαίνει όταν δεν πληρούνται οι προϋποθέσεις εφαρμογής του. Όλα αυτά έχουν άμεση σχέση με την ανάπτυξη των οπτικών συστημάτων.

Οι μέθοδοι που απαιτούν μετάβαση στον τομέα συχνότητας έχουν γίνει δημοφιλείς εν μέρει λόγω αλγορίθμων για γρήγορο υπολογισμό του διακριτού μετασχηματισμού Fourier. Ωστόσο, πρέπει να δοθεί προσοχή καθώς αυτές οι μέθοδοι απαιτούν την παρουσία του περιοδικό σήμα. Θα συζητήσουμε πώς μπορεί να εκπληρωθεί αυτή η απαίτηση και ποιες είναι οι συνέπειες από την παραβίασή της.

7.1. Όριο μεγέθους εικόνας

Στην πράξη, οι εικόνες έχουν πάντα πεπερασμένες διαστάσεις. Εξετάστε μια ορθογώνια εικόνα με πλάτος και ύψος H. Τώρα δεν χρειάζεται να ληφθούν ολοκληρώματα στο μετασχηματισμό Fourier πάνω από άπειρα όρια:

Είναι ενδιαφέρον ότι δεν χρειάζεται να γνωρίζουμε καθόλου συχνότητες για να επαναφέρουμε τη λειτουργία. Γνωρίζοντας ότι το at αντιπροσωπεύει έναν σκληρό περιορισμό. Με άλλα λόγια, μια συνάρτηση που είναι μη μηδενική μόνο σε μια περιορισμένη περιοχή του επιπέδου εικόνας περιέχει πολύ λιγότερες πληροφορίες από μια συνάρτηση που δεν έχει αυτήν την ιδιότητα.

Για να το δείτε αυτό, φανταστείτε ότι το επίπεδο της οθόνης είναι καλυμμένο με αντίγραφα δεδομένη εικόνα. Με άλλα λόγια, επεκτείνουμε την εικόνα μας σε μια συνάρτηση που είναι περιοδική και προς τις δύο κατευθύνσεις

Εδώ είναι ο μεγαλύτερος ακέραιος που δεν υπερβαίνει το x. Ο μετασχηματισμός Fourier μιας τέτοιας πολλαπλασιασμένης εικόνας έχει τη μορφή

Χρησιμοποιώντας κατάλληλα επιλεγμένους παράγοντες σύγκλισης στο Π.χ. 7.1 αποδεικνύεται ότι

Ως εκ τούτου,

από όπου βλέπουμε ότι είναι ίσο με μηδέν παντού εκτός από ένα διακριτό σύνολο συχνοτήτων. Έτσι, για να το βρούμε, αρκεί να το γνωρίζουμε σε αυτά τα σημεία. Ωστόσο, η λειτουργία επιτυγχάνεται με απλή αποκοπή του τμήματος για το οποίο . Επομένως, για να το επαναφέρουμε, αρκεί να γνωρίζουμε μόνο για όλους Αυτό είναι ένα μετρήσιμο σύνολο αριθμών.

Σημειώστε ότι ο μετασχηματισμός μιας περιοδικής συνάρτησης αποδεικνύεται διακριτός. Ο αντίστροφος μετασχηματισμός μπορεί να αναπαρασταθεί ως σειρά, αφού

Κατά κανόνα, τα σήματα εισέρχονται στο σύστημα επεξεργασίας πληροφοριών σε συνεχή μορφή. Για επεξεργασία υπολογιστή συνεχόμενα σήματαείναι απαραίτητο πρώτα από όλα να μετατραπούν σε ψηφιακά. Για να γίνει αυτό, εκτελούνται λειτουργίες δειγματοληψίας και κβαντοποίησης.

Δειγματοληψία εικόνας

Δειγματοληψία– αυτός είναι ο μετασχηματισμός ενός συνεχούς σήματος σε μια ακολουθία αριθμών (δείγματα), δηλαδή η αναπαράσταση αυτού του σήματος σύμφωνα με κάποια πεπερασμένη βάση. Αυτή η αναπαράσταση συνίσταται στην προβολή ενός σήματος σε μια δεδομένη βάση.

Ο πιο βολικός και φυσικός τρόπος δειγματοληψίας από την άποψη της οργάνωσης της επεξεργασίας είναι η αναπαράσταση σημάτων με τη μορφή δείγματος των τιμών τους (δείγματα) σε ξεχωριστά, τακτικά απέχοντα σημεία. Αυτή η μέθοδος ονομάζεται ραστεροποίηση, και η ακολουθία των κόμβων στην οποία λαμβάνονται δείγματα είναι ράστερ. Το διάστημα μέσω του οποίου λαμβάνονται οι τιμές ενός συνεχούς σήματος ονομάζεται βήμα δειγματοληψίας. Το αντίστροφο του βήματος ονομάζεται ρυθμός δειγματοληψίας,

Ένα ουσιαστικό ερώτημα που προκύπτει κατά τη δειγματοληψία: σε ποια συχνότητα πρέπει να λαμβάνουμε δείγματα σήματος για να μπορέσουμε να το ανακατασκευάσουμε από αυτά τα δείγματα; Προφανώς, εάν τα δείγματα λαμβάνονται πολύ σπάνια, δεν θα περιέχουν πληροφορίες σχετικά με ένα ταχέως μεταβαλλόμενο σήμα. Ο ρυθμός μεταβολής ενός σήματος χαρακτηρίζεται από την ανώτερη συχνότητα του φάσματος του. Έτσι, το ελάχιστο επιτρεπόμενο πλάτος του διαστήματος δειγματοληψίας σχετίζεται με την υψηλότερη συχνότητα του φάσματος σήματος (αντίστροφα ανάλογη με αυτήν).

Για την περίπτωση ομοιόμορφης δειγματοληψίας ισχύουν τα ακόλουθα: Το θεώρημα του Kotelnikov, που δημοσιεύτηκε το 1933 στο έργο «On εύρος ζώνηςαιθέρας και σύρμα στις τηλεπικοινωνίες». Λέει: εάν ένα συνεχές σήμα έχει φάσμα περιορισμένο από τη συχνότητα, τότε μπορεί να ανακατασκευαστεί πλήρως και ξεκάθαρα από τα διακριτά δείγματά του που λαμβάνονται με μια τελεία, δηλ. με συχνότητα.

Η αποκατάσταση του σήματος πραγματοποιείται χρησιμοποιώντας τη λειτουργία . Ο Kotelnikov απέδειξε ότι ένα συνεχές σήμα που ικανοποιεί τα παραπάνω κριτήρια μπορεί να αναπαρασταθεί ως μια σειρά:

.

Αυτό το θεώρημα ονομάζεται επίσης θεώρημα δειγματοληψίας. Η συνάρτηση καλείται επίσης συνάρτηση δειγματοληψίας ή Kotelnikov, αν και μια σειρά παρεμβολής αυτού του τύπου μελετήθηκε από τον Whitaker το 1915. Η συνάρτηση μέτρησης έχει άπειρη έκταση στο χρόνο και φτάνει στη μέγιστη τιμή της, ίσο με ένα, στο σημείο στο οποίο είναι συμμετρικό.

Κάθε μία από αυτές τις λειτουργίες μπορεί να θεωρηθεί ως απάντηση ενός ιδανικού φίλτρο χαμηλής διέλευσης(χαμηλοπερατό φίλτρο) στον παλμό δέλτα που φτάνει τη στιγμή . Έτσι, για να αποκατασταθεί ένα συνεχές σήμα από τα διακριτά δείγματά του, πρέπει να περάσουν από ένα κατάλληλο φίλτρο χαμηλής διέλευσης. Θα πρέπει να σημειωθεί ότι ένα τέτοιο φίλτρο είναι μη αιτιολογικό και φυσικά μη πραγματοποιήσιμο.

Η παραπάνω αναλογία σημαίνει τη δυνατότητα ακριβούς ανακατασκευής σημάτων με περιορισμένο φάσμα από την αλληλουχία των δειγμάτων τους. Σήματα περιορισμένου φάσματος– πρόκειται για σήματα των οποίων το φάσμα Fourier διαφέρει από το μηδέν μόνο σε ένα περιορισμένο τμήμα της περιοχής ορισμού. Τα οπτικά σήματα μπορούν να ταξινομηθούν ως ένα από αυτά, επειδή Φάσμα Fourier εικόνων που λαμβάνονται σε οπτικά συστήματα, περιορίζεται λόγω του περιορισμένου μεγέθους των στοιχείων τους. Η συχνότητα ονομάζεται Συχνότητα Nyquist. Αυτή είναι η οριακή συχνότητα πάνω από την οποία δεν πρέπει να υπάρχουν φασματικά στοιχεία στο σήμα εισόδου.

Κβαντισμός εικόνας

Στην ψηφιακή επεξεργασία εικόνας, το συνεχές δυναμικό εύρος τιμών φωτεινότητας χωρίζεται σε μια σειρά διακριτά επίπεδα. Αυτή η διαδικασία ονομάζεται κβαντισμός. Η ουσία της έγκειται στον μετασχηματισμό μιας συνεχούς μεταβλητής σε μια διακριτή μεταβλητή που παίρνει ένα πεπερασμένο σύνολο τιμών. Αυτές οι τιμές ονομάζονται επίπεδα κβαντισμού. Γενικά, ο μετασχηματισμός εκφράζεται με μια συνάρτηση βήματος (Εικ. 1). Εάν η ένταση του δείγματος εικόνας ανήκει στο διάστημα (δηλ. πότε ), τότε το αρχικό δείγμα αντικαθίσταται από το επίπεδο κβαντισμού, όπου κατώφλια κβαντοποίησης. Θεωρείται ότι το δυναμικό εύρος τιμών φωτεινότητας είναι περιορισμένο και ίσο με .

Ρύζι. 1. Συνάρτηση που περιγράφει την κβαντοποίηση

Το κύριο καθήκον σε αυτή την περίπτωση είναι ο προσδιορισμός των τιμών των ορίων και των επιπέδων κβαντοποίησης. Ο πιο απλός τρόποςΗ λύση σε αυτό το πρόβλημα συνίσταται στην κατάτμηση δυναμικό εύροςεπί ίσα διαστήματα. Ωστόσο, αυτή η λύση δεν είναι η καλύτερη. Εάν οι τιμές έντασης της πλειονότητας των μετρήσεων εικόνων ομαδοποιηθούν, για παράδειγμα, στη «σκοτεινή» περιοχή και ο αριθμός των επιπέδων είναι περιορισμένος, τότε συνιστάται η κβαντοποίηση άνισα. Στη «σκοτεινή» περιοχή είναι απαραίτητο να γίνεται κβαντισμός πιο συχνά και στη «φωτεινή» περιοχή λιγότερο συχνά. Αυτό θα μειώσει το σφάλμα κβαντισμού.

Σε συστήματα ψηφιακή επεξεργασίαΟι εικόνες τείνουν να μειώνουν τον αριθμό των επιπέδων κβαντισμού και των ορίων, καθώς η ποσότητα των πληροφοριών που απαιτούνται για την κωδικοποίηση της εικόνας εξαρτάται από τον αριθμό τους. Ωστόσο, με έναν σχετικά μικρό αριθμό επιπέδων στην κβαντισμένη εικόνα, ενδέχεται να εμφανιστούν ψευδή περιγράμματα. Προκύπτουν ως αποτέλεσμα μιας απότομης αλλαγής στη φωτεινότητα της κβαντισμένης εικόνας και είναι ιδιαίτερα αισθητές σε επίπεδες περιοχές της αλλαγής της. Τα ψευδή περιγράμματα υποβαθμίζουν σημαντικά την οπτική ποιότητα της εικόνας, καθώς η ανθρώπινη όραση είναι ιδιαίτερα ευαίσθητη στα περιγράμματα. Κατά την ομοιόμορφη κβαντοποίηση τυπικών εικόνων, απαιτούνται τουλάχιστον 64 επίπεδα.