Ανασκόπηση υφιστάμενων μεθόδων αναγνώρισης προτύπων. Το πρόβλημα της αναγνώρισης προτύπων. Ο ρόλος και η θέση της αναγνώρισης προτύπων στον αυτοματισμό ελέγχου σύνθετων συστημάτων

για το ποια προβλήματα πρέπει ακόμη να επιλυθούν προκειμένου να φέρουν τα συστήματα αυτόματης αναγνώρισης ομιλίας στο ανθρώπινο επίπεδο.

Από την εμφάνιση της αναγνώρισης ομιλίας βαθιά μάθηση, το ποσοστό σφάλματος έχει μειωθεί σημαντικά. Ωστόσο, παρά όλα όσα μπορεί να έχετε διαβάσει και δει, εξακολουθούμε να μην έχουμε σύστημα αναγνώρισης ομιλίας σε ανθρώπινο επίπεδο. Υπάρχουν πολλά λάθη στην αναγνώριση ομιλίας. Για να προχωρήσετε, είναι σημαντικό να γνωρίζετε πότε εμφανίζονται και να λαμβάνετε μέτρα για την επίλυση των προβλημάτων. Αυτός είναι ο μόνος τρόπος για να μεταβείτε από την αυτόματη αναγνώριση ομιλίας (ASR), η οποία λειτουργεί για μερικούς ανθρώπους, στην ASR που λειτουργεί για όλους τους ανθρώπους, όλη την ώρα.

Βελτιώσεις στο ποσοστό σφαλμάτων στη δοκιμή αναγνώρισης ομιλίας του πίνακα μεταγωγής. Η δοκιμαστική σουίτα συλλέχτηκε το 2000. Αποτελείται από 40 τηλεφωνικές συνομιλίες μεταξύ δύο τυχαίων φυσικών ομιλητών της αγγλικής γλώσσας.

Το να λέμε ότι έχουμε επιτύχει αναγνώριση ομιλίας σε ανθρώπινο επίπεδο με βάση τα αποτελέσματα του Switchboards είναι σαν να λέμε ότι ένα αυτοοδηγούμενο αυτοκίνητο οδηγεί όπως και ένας άνθρωπος αφού το δοκιμάσουμε σε μια πόλη μια ηλιόλουστη μέρα χωρίς κίνηση. Οι τελευταίες βελτιώσεις στην αναγνώριση προφορικής γλώσσας είναι εκπληκτικές. Αλλά είναι πολύ νωρίς για να δηλώσουμε ότι φτάσαμε στο επίπεδο των ανθρώπων. Παρακάτω είναι μερικές ενότητες που χρειάζονται βελτίωση.

Προφορές και θόρυβος

Μία από τις πιο αξιοσημείωτες διαφορές στην αναγνώριση ομιλίας είναι η ικανότητα αντιμετώπισης προφορών και θορύβου φόντου. Ο άμεσος λόγος για αυτό είναι ότι τα δεδομένα εκπαίδευσης αποτελούνται από αγγλική ομιλία αμερικανικής προφοράς με υψηλή αναλογία σήματος προς θόρυβο (SNR). Για παράδειγμα, τα σύνολα δεδομένων εκπαίδευσης και δοκιμής του Switchboard περιλαμβάνουν μόνο φυσικούς ομιλητές της αγγλικής γλώσσας με μικρό θόρυβο φόντου.

Ωστόσο, η αύξηση του όγκου των δεδομένων εκπαίδευσης πιθανότατα δεν θα λύσει εύκολα το πρόβλημα. Υπάρχουν πολλές γλώσσες με μεγάλο ποσόδιαλέκτους και προφορές. Δεν είναι δυνατή η συλλογή επαρκών δεδομένων για όλες τις περιπτώσεις. Η δημιουργία ενός συστήματος αναγνώρισης ομιλίας υψηλής ποιότητας μόνο για αγγλικά με αμερικανική προφορά απαιτεί πέντε χιλιάδες ώρες απομαγνητοφωνημένου ήχου.

Σύγκριση ανθρώπινων μεταγραφών με αυτά του μοντέλου Deep Speech 2 του Baidu. Σημειώστε ότι οι άνθρωποι είναι λιγότερο ικανοί να αναγνωρίσουν μη αμερικανικές προφορές. Αυτό πιθανότατα οφείλεται στην αμερικανική καταγωγή των στενογράφων. Νομίζω ότι οι ομιλητές που είναι εγγενείς σε κάθε περιοχή θα μπορούσαν να αναγνωρίσουν καλύτερα τις προφορές των χωρών τους.

Όσον αφορά τον θόρυβο περιβάλλοντος, σε ένα κινούμενο αυτοκίνητο το SNR είναι σπάνια -5 dB. Οι άνθρωποι καταλαβαίνουν ο ένας τον άλλον χωρίς προβλήματα σε αυτό το περιβάλλον. Τα αυτόματα συστήματα αναγνώρισης ομιλίας κάνουν πολλά περισσότερα σφάλματα καθώς αυξάνεται ο θόρυβος. Στο παραπάνω γράφημα, βλέπουμε πώς η διαφορά μεταξύ σφαλμάτων ανθρώπου και μοντέλου αυξάνεται δραματικά από ήχο χαμηλού SNR σε ήχο υψηλού SNR.

Σημασιολογικά λάθη

Το επίπεδο των σφαλμάτων στα λόγια δεν είναι ο πιο αντικειμενικός δείκτης. Μας ενδιαφέρει ο δείκτης σημασιολογικά λάθη. Αυτή είναι η αναλογία των δηλώσεων στις οποίες παραποιούμε το νόημα.

Ένα παράδειγμα σημασιολογικού λάθους: αν κάποιος είπε "ας συναντηθούμε την Τρίτη" (ας συναντηθούμε την Τρίτη), αλλά το σύστημα αναγνώριζε τη δήλωση ως "ας συναντηθούμε σήμερα" (ας συναντηθούμε σήμερα). Μπορούμε επίσης να έχουμε λάθη στις λέξεις χωρίς σημασιολογικά λάθη: αν το σύστημα απέρριψε τη λέξη και αναγνώριζε "ας συναντηθούμε την Τρίτη", τότε η σημασιολογία της εκφοράς δεν άλλαξε.

Πρέπει να είμαστε πιο προσεκτικοί στη χρήση της λέξης ποσοστό σφάλματος (WER) ως κύριο δείκτη. Επιτρέψτε μου να σας δείξω τη χειρότερη κατάσταση. Ένα WER 5% αντιστοιχεί σε μία λέξη που λείπει σε κάθε είκοσι. Εάν κάθε πρόταση περιέχει είκοσι λέξεις (ο μέσος όρος για τα αγγλικά), τότε το ποσοστό σφάλματος στις προτάσεις θα είναι 100%. Αλλά οι λέξεις που λείπουν είναι απίθανο να αλλάξουν το νόημα των προτάσεων. Διαφορετικά, ακόμη και με 5% WER, κάθε πρόταση θα παρερμηνευόταν.

Κατά τη σύγκριση μοντέλων και ανθρώπων, είναι σημαντικό να ελέγχετε τη φύση των σφαλμάτων αντί να κοιτάτε απλώς το WER. Από την εμπειρία μου, όταν οι άνθρωποι μεταγράφουν ομιλία, κάνουν λιγότερα λάθη και αυτά τα λάθη δεν είναι τόσο κρίσιμα.

Ερευνητές της Microsoft συνέκριναν πρόσφατα τα σφάλματα των ανθρώπων και των συστημάτων αναγνώρισης ομιλίας με τα ποσοστά ανθρώπινων σφαλμάτων. Βρήκαν ότι το μοντέλο ήταν πιο πιθανό να μπερδέψει τις παρεμβάσεις "αχ" και "ωχ-χα". Αυτές οι δύο λέξεις έχουν εντελώς διαφορετική σημασιολογία: το "a" απλώς γεμίζει παύσεις και το "aha" λειτουργεί ως επιβεβαίωση. Αλλά το μοντέλο και οι άνθρωποι έχουν κάνει επίσης πολλά παρόμοια λάθη.

Ένα κανάλι, πολλά ηχεία

Ο έλεγχος του Switchboard είναι ευκολότερος επειδή κάθε ηχείο εγγράφεται σε ξεχωριστό μικρόφωνο. Δεν υπάρχει επικάλυψη μεταξύ διαφορετικών φωνών στο ίδιο κανάλι ήχου. Οι άνθρωποι μπορούν να καταλάβουν πολλά άτομα που μιλούν ταυτόχρονα.

Ένα καλό σύστημα αναγνώρισης ομιλίας θα πρέπει να μπορεί να τμηματοποιήσει τον ήχο με βάση το ποιος μιλάει (diarization). Πρέπει επίσης να κατανοεί τον ήχο από πολλά ηχεία (διαχωρισμός πηγής). Αυτό θα πρέπει να είναι δυνατό χωρίς την ανάγκη για μικρόφωνο κοντά σε κάθε ηχείο.

Αλλα μέρη

Προφορές και θόρυβος φόντουείναι μόνο δύο παράγοντες στους οποίους θα πρέπει να βελτιωθεί η αξιοπιστία ενός συστήματος αναγνώρισης ομιλίας. Εδώ είναι μερικά ακόμα:

  • Αντήχηση από αλλαγές στο ακουστικό περιβάλλον.
  • Αντικείμενα υλικού.
  • Κωδικοποιητής που χρησιμοποιείται για τεχνουργήματα ήχου και συμπίεσης.
  • Συχνότητα δειγματοληψίας.
  • Ηλικία ομιλητή.

Πολλοί άνθρωποι δεν θα παρατηρήσουν καν τη διαφορά μεταξύ αρχείων mp3 και wav. Τα συστήματα αναγνώρισης ομιλίας πρέπει να είναι αξιόπιστα για αυτούς τους παράγοντες πριν μπορέσουμε να διεκδικήσουμε απόδοση σε ανθρώπινο επίπεδο.

Συμφραζόμενα

Ίσως παρατηρήσετε ότι το ποσοστό ανθρώπινου λάθους σε δοκιμές όπως το Switchboard είναι αρκετά υψηλό. Εάν επικοινωνούσατε με έναν φίλο και δεν καταλάβαινε 1 στις 20 λέξεις που είπατε, θα δυσκολευόσασταν να επικοινωνήσετε.

Ένας από τους λόγους για αυτό είναι ότι η αξιολόγηση γίνεται ανεξάρτητα από το πλαίσιο. ΣΕ πραγματική ζωήχρησιμοποιούμε πολλές άλλες ενδείξεις για να καταλάβουμε τι λέει ο άλλος. Μερικά παραδείγματα περιβάλλοντος που χρησιμοποιούν οι άνθρωποι:

  • Προηγούμενες συζητήσεις και θέμα συζήτησης.
  • Οπτικές ενδείξεις όπως εκφράσεις του προσώπου και κινήσεις των χειλιών.
  • Γνώσεις για το άτομο με το οποίο επικοινωνούμε.

Προς το παρόν, το πρόγραμμα αναγνώρισης ομιλίας του Android έχει πρόσβαση στη λίστα επαφών σας, ώστε να μπορεί να αναγνωρίζει τα ονόματα των φίλων σας. Η φωνητική αναζήτηση στους Χάρτες χρησιμοποιεί γεωγραφική τοποθεσία για να περιορίσει πιθανούς προορισμούς. Η ακρίβεια των συστημάτων ASR αυξάνεται με τη χρήση αυτού του τύπου σήματος. Αλλά μόλις αρχίσαμε να διερευνούμε ποιο πλαίσιο μπορούμε να συμπεριλάβουμε και πώς μπορούμε να το κάνουμε.

Εκτέλεση

Οι πρόσφατες βελτιώσεις στην αναγνώριση της προφορικής γλώσσας δεν μπορούν να αναπτυχθούν γρήγορα. Όταν μιλάμε για αυτό που κάνει νέος αλγόριθμοςΗ αναγνώριση ομιλίας είναι εφικτή, εξετάζουμε τις μετρήσεις καθυστέρησης και ισχύος. Είναι συνδεδεμένα και οι αλγόριθμοι που μειώνουν την καθυστέρηση αυξάνουν την ονομαστική ισχύ. Ας δούμε το καθένα ξεχωριστά.

Καθυστέρηση:Αυτός είναι ο χρόνος από το τέλος της ομιλίας έως το τέλος της μεταγραφής. Η χαμηλή καθυστέρηση είναι μια κοινή απαίτηση στα συστήματα αναγνώρισης ομιλίας. Αυτό μπορεί να επηρεάσει σε μεγάλο βαθμό την εμπειρία του χρήστη και η καθυστέρηση μετριέται συχνά σε δεκάδες χιλιοστά του δευτερολέπτου. Αυτό μπορεί να φαίνεται συντριπτικό, αλλά να θυμάστε ότι η δημιουργία μιας μεταγραφής είναι το πρώτο βήμα σε μια σειρά υπολογισμών. Για παράδειγμα, σε φωνητική αναζήτησηη ίδια η αναζήτηση πραγματοποιείται μετά την αναγνώριση ομιλίας.

Τα αμφίδρομα επαναλαμβανόμενα δίκτυα είναι Καλό παράδειγμασημαντική βελτίωση. Όλες οι πρόσφατες σύγχρονες εξελίξεις στην αναγνώριση προφορικού λόγου τις χρησιμοποιούν. Το πρόβλημα είναι ότι δεν μπορούμε να υπολογίσουμε τίποτα μετά το πρώτο επίπεδο διπλής κατεύθυνσης έως ότου ο χρήστης ολοκληρώσει την ομιλία του. Έτσι, η καθυστέρηση αυξάνεται με το μήκος της έκφρασης.

Χρησιμοποιώντας μία κατεύθυνση μπορούμε να ξεκινήσουμε τη μεταγραφή αμέσως

Με την αμφίδρομη επανάληψη, αναγκαζόμαστε να περιμένουμε το τέλος της ομιλίας.

Ένας καλός τρόπος αποτελεσματικής χρήσης μελλοντικών πληροφοριών στην αναγνώριση ομιλίας εξακολουθεί να είναι ένα ανοιχτό πρόβλημα.

Εξουσία:το ποσό της υπολογιστικής ισχύος που απαιτείται για τη μεταγραφή μιας έκφρασης είναι ένας οικονομικός περιορισμός. Πρέπει να εξετάσουμε την αξία και το κόστος κάθε βελτίωσης στην ακρίβεια αναγνώρισης ομιλίας. Εάν μια βελτίωση δεν εντάσσεται στο οικονομικό πλαίσιο, δεν μπορεί να εφαρμοστεί.

Ένα κλασικό παράδειγμα βελτίωσης που δεν υλοποιείται είναι η μάθηση συνόλου. Η μείωση του ποσοστού σφάλματος κατά 1-2% δεν αξίζει να αυξηθεί η υπολογιστική ισχύς από 2 σε 8 φορές. Τα σύγχρονα μοντέλα επαναλαμβανόμενων νευρωνικών δικτύων συνήθως εμπίπτουν επίσης σε αυτήν την κατηγορία επειδή είναι πολύ ακριβά στη χρήση τους στην αναζήτηση δέσμης, αν και αναμένω ότι αυτό θα αλλάξει στο μέλλον.

Δεν νομίζω ότι η έρευνα που σχετίζεται με βελτιωμένη ακρίβεια και περισσότερη υπολογιστική ισχύ είναι άσκοπη. Έχουμε δει το μοτίβο «πρώτα αργό αλλά σίγουρο, μετά γρήγορο». Η ιδέα είναι ότι έως ότου η βελτίωση είναι αρκετά γρήγορη, δεν μπορεί να χρησιμοποιηθεί.

Τα επόμενα πέντε χρόνια

Υπάρχουν πολλά ανοιχτά και σύνθετα προβλήματα στην αναγνώριση ομιλίας. Ανάμεσα τους:

  • Επέκταση δυνατοτήτων σε νέες περιοχές, νέες εμφατικές εντάσεις και ομιλία χαμηλής αναλογίας σήματος προς θόρυβο.
  • Εισαγωγή περισσότερου πλαισίου στη διαδικασία αναγνώρισης.
  • Διάκριση και διαχωρισμός πηγής.
  • Δείκτης σημασιολογικών λαθών και καινοτόμες μέθοδοι αξιολόγησης αναγνωριστικών.
  • Χαμηλή καθυστέρηση και αποδοτικοί αλγόριθμοι.

Η διαδικασία αναγνώρισης συνίσταται στο γεγονός ότι το σύστημα αναγνώρισης, με βάση τη σύγκριση εκ των υστέρων πληροφοριών σχετικά με κάθε αντικείμενο ή φαινόμενο που λαμβάνεται στην είσοδο του συστήματος με μια a priori περιγραφή κλάσεων, αποφασίζει εάν αυτό το αντικείμενο (φαινόμενο) ανήκει σε μια από τις τάξεις. Ο κανόνας που εκχωρεί σε κάθε αντικείμενο ένα συγκεκριμένο όνομα κλάσης ονομάζεται κανόνας απόφασης. Στη βιβλιογραφία που είναι αφιερωμένη στην αναγνώριση προτύπων, έχει διαπιστωθεί η άποψη ότι η ουσία του προβλήματος της αναγνώρισης έγκειται στον καθορισμό των κανόνων απόφασης, στην εύρεση στον χώρο χαρακτηριστικών τέτοιων ορίων (αποφασιστικά όρια), στα οποία τα χαρακτηριστικά διαστέλλονται με βέλτιστο τρόπο, για παράδειγμα, από την άποψη της ελαχιστοποίησης των σφαλμάτων αναγνώρισης, χωρίζονται σε περιοχές που αντιστοιχούν στις κλάσεις. Έτσι, λέγεται ότι στην εύρεση τέτοιων καθοριστικών κανόνων στη βάση δοσμένες περιγραφέςτάξεις είναι το πρόβλημα της αναγνώρισης.

Κατά τον καθορισμό των κανόνων απόφασης (αποφασιστικά όρια στον χώρο χαρακτηριστικών), ανάλογα με την ποσότητα των αρχικών a priori πληροφοριών, λαμβάνονται υπόψη οι ακόλουθες καταστάσεις:

1. Η ποσότητα της αρχικής πληροφορίας είναι επαρκής για τον καθορισμό των καθοριστικών κανόνων μέσω της ανάλυσης και της άμεσης επεξεργασίας της (συστήματα αναγνώρισης χωρίς εκπαίδευση, βλ. Εικ. 1.4).

2. Ο όγκος των αρχικών πληροφοριών δεν επαρκεί για τον καθορισμό των κανόνων απόφασης με βάση την άμεση επεξεργασία τους, και ως εκ τούτου εφαρμόζεται μια εκπαιδευτική διαδικασία (συστήματα αναγνώρισης μάθησης, βλ. Εικ. 1.5).

Στις καταστάσεις 1 και 2, το καθήκον της εύρεσης κανόνων απόφασης βασίζεται στο γεγονός ότι είναι γνωστά το αλφάβητο των κλάσεων αντικειμένων και το a priori λεξικό των χαρακτηριστικών που προορίζονται για τις περιγραφές τους. Θεωρούμε επίσης μια κατάσταση όπου το λεξικό των χαρακτηριστικών είναι γνωστό, αλλά το αλφάβητο των κλάσεων είναι άγνωστο. Ταυτόχρονα, όμως, ορίζεται ένα συγκεκριμένο σύνολο κανόνων, σύμφωνα με το οποίο, βάσει της διαδικασίας αυτομάθησης, βρίσκεται το απαιτούμενο αλφάβητο των τάξεων. Στη συνέχεια καθορίζονται οι κανόνες απόφασης (συστήματα αυτομάθησης, βλ. Εικ. 1.6).

Ιστορικά, οι πρώτες θεωρητικές μελέτες και εφαρμοσμένες εργασίες στον τομέα της αναγνώρισης βασίστηκαν στο γεγονός ότι ο χώρος χαρακτηριστικών είναι γνωστός και το αλφάβητο της τάξης είναι επίσης γνωστό. Υπό αυτές τις συνθήκες, το πρόβλημα της αναγνώρισης μπορεί πράγματι να ερμηνευθεί ως πρόβλημα καθορισμού, κατά μία έννοια, των καλύτερων ορίων απόφασης (κανόνες απόφασης). Σήμερα, κατά την κατασκευή συσκευών αναγνώρισης, υπάρχει συχνά μια κατάσταση όπου τόσο το αλφάβητο της τάξης όσο και το λεξικό των χαρακτηριστικών είναι γνωστά. Ωστόσο, στη γενική περίπτωση, κατά την κατασκευή πραγματικών συστημάτων αναγνώρισης που απαιτούν την ανάπτυξη ειδικών εργαλείων μέτρησης και ολόκληρων συμπλεγμάτων μέτρησης, δυστυχώς, δεν είναι απαραίτητο να υποθέσουμε ότι το αλφάβητο των κλάσεων και το λεξικό των χαρακτηριστικών είναι γνωστά a priori, δυστυχώς.

Ο σκοπός των συστημάτων αναγνώρισης είναι να αποκτήσουν τις απαραίτητες πληροφορίες για τη λήψη ορισμένων αποφάσεων σχετικά με το αν ένα άγνωστο αντικείμενο (φαινόμενο) ανήκει σε μια συγκεκριμένη κλάση. Αυτό ακριβώς συμβαίνει στα ιατρικά και τεχνικά διαγνωστικά συστήματα, τη γεωλογική εξερεύνηση, τις μετεωρολογικές προβλέψεις, την εγκληματολογία, τα συστήματα αναγνώρισης στόχων κ.λπ. Επομένως, τα συστήματα αναγνώρισης, ως μέρος ενός συστήματος ελέγχου (αυτόματου ή αυτοματοποιημένου), πρέπει να κατασκευαστούν λαμβάνοντας υπόψη την την πιο αποτελεσματική χρήση όλων των συνόλων εφικτών λύσεων. Το γεγονός αυτό επιβάλλει τους ακόλουθους περιορισμούς στην κατασκευή συστημάτων αναγνώρισης.

1. Αν και άλλα πράγματα είναι ίσα, η αύξηση της αποτελεσματικότητας των αποφάσεων που λαμβάνονται θα πρέπει να συνδέεται με τον βαθμό λεπτομέρειας στον ορισμό ή τον σκοπό ή τη φύση του αναγνωρισμένου αντικειμένου ή φαινομένου. Ο βαθμός λεπτομέρειας καθορίζεται από τον αριθμό των τάξεων στις οποίες χωρίζονται πολλά αντικείμενα ή φαινόμενα. Έτσι, εάν το σύστημα ελέγχου έχει m διάφορες λύσεις, τότε στο αλφάβητο των κλάσεων του συστήματος αναγνώρισης, λαμβάνοντας υπόψη τα παραπάνω, καλό είναι να παρέχονται κλάσεις m+1. Τότε, εάν το αναγνωρισμένο αντικείμενο ανήκει στην κλάση Ω 1, λαμβάνεται η απόφαση l 1, εάν στην κλάση Ω 2 - απόφαση h, κ.λπ., εάν το αντικείμενο ανήκει στην κλάση Ω m +1, δεν λαμβάνεται απόφαση.

2. Η αποτελεσματικότητα των αποφάσεων που λαμβάνονται από το σύστημα ελέγχου, με όλα τα άλλα πράγματα να είναι ίσα (συμπεριλαμβανομένου, φυσικά, ενός δεδομένου αλφαβήτου κλάσεων) εξαρτάται από την ακρίβεια του προσδιορισμού εάν ένα αναγνωρισμένο αντικείμενο ή φαινόμενο ανήκει στην αντίστοιχη κλάση. Η ακρίβεια του ορισμού ή του σφάλματος αναγνώρισης με μια δεδομένη εκ των προτέρων περιγραφή των κλάσεων καθορίζεται από τη διάσταση και το περιεχόμενο πληροφοριών του χώρου χαρακτηριστικών, τον όγκο και την ποιότητα των εκ των υστέρων πληροφοριών σχετικά με τις τιμές των χαρακτηριστικών (παραμέτρων) που χαρακτηρίζουν το αναγνωρισμένο αντικείμενο. Με άλλα λόγια, η επέκταση του αλφαβήτου των κλάσεων, η οποία αυξάνει τον βαθμό λεπτομέρειας στον προσδιορισμό του σκοπού ή της φύσης του αναγνωρισμένου αντικειμένου (φαινόμενο), ενώ το λεξικό των χαρακτηριστικών παραμένει αμετάβλητο, αυξάνει το σφάλμα αναγνώρισης.

Έστω τρεις κλάσεις Ω 1, Ω 2 και Ω 3 αντικειμένων που δίνονται από κατανομές f 1 (x), f 2 (x), f 3 (x) με προηγούμενες πιθανότητες εμφάνισης αντικειμένων των αντίστοιχων κλάσεων P(Ω 1) =P(Ω 2)=P (Ω 3) = P, καθώς και απώλειες c 11 = c 22 = c 33 = 0 και c 12 = c 21 = c 13 = c 31 = c 23 = c 32 = c.

Στο Σχ. 2.1 παρουσιάζει τους νόμους διανομής. Μέσος (Bayesian) κίνδυνος (βλ. § 4.2)

Ας υποθέσουμε τώρα ότι αποφασίστηκε να συνδυαστούν αντικείμενα που ανήκουν στις κλάσεις Ω 1 και Ω 2 σε μία κατηγορία Ω 4, η περιγραφή της οποίας

Ο μέσος κίνδυνος σε αυτή την περίπτωση, αν υποτεθεί ότι το όριο b παραμένει αμετάβλητο, θα είναι

Από μια σύγκριση των τιμών των Rã 1 και Rã 2 είναι σαφές ότι Rã l >Rã 2 κατά την ποσότητα

Κατά συνέπεια, για ένα δεδομένο χώρο χαρακτηριστικών και άλλες ίσες συνθήκες, η μείωση του αριθμού των κλάσεων οδηγεί σε

Ρύζι. 2.1

για τη μείωση των σφαλμάτων αναγνώρισης και, αντιστρόφως, με την αύξηση του αριθμού των τάξεων του συστήματος αναγνώρισης, προκειμένου να διατηρηθεί σε ένα δεδομένο επίπεδο ή ακόμη και να μειωθεί ο μέσος κίνδυνος (πιθανότητα λανθασμένων αποφάσεων), είναι απαραίτητο να επεκταθεί το λεξικό των ζωδίων (φυσικά, όλα τα άλλα πράγματα είναι ίσα). Ταυτόχρονα, η επέκταση του χώρου χαρακτηριστικών για τη μείωση των σφαλμάτων αναγνώρισης συνδέεται με την αύξηση του αριθμού των τεχνικών εργαλείων μέτρησης, καθένα από τα οποία εξασφαλίζει τον προσδιορισμό του αντίστοιχου χαρακτηριστικού ή ομάδας χαρακτηριστικών. Αυτό, με τη σειρά του, απαιτεί αυξημένο κόστος για την κατασκευή ενός συστήματος αναγνώρισης. Κατά κανόνα, επιβάλλονται ορισμένοι περιορισμοί στο ύψος του κόστους σε πραγματικές συνθήκες.

Έτσι, η επιθυμία να χρησιμοποιηθεί το σύνολο των πιθανών λύσεων συστημάτων ελέγχου όσο το δυνατόν πιο αποτελεσματικά οδηγεί στην ανάγκη να αυξηθεί το αλφάβητο των κλάσεων σε m+1. Ωστόσο, ο φυσικός περιορισμός των πόρων που διατίθενται για την κατασκευή οργάνων μέτρησης για ένα σύστημα αναγνώρισης ή ένα σύστημα αναγνώρισης στο σύνολό του οδηγεί στο γεγονός ότι καθώς αυξάνεται το αλφάβητο των τάξεων, αυξάνονται τα σφάλματα αναγνώρισης και αυτό μειώνει την αποτελεσματικότητα της χρήσης πιθανών λύσεων . Μόνο ένας ορισμένος συμβιβασμός μεταξύ του μεγέθους του αλφαβήτου των τάξεων και του όγκου του λεξικού εργασίας των χαρακτηριστικών του συστήματος, με βάση τα αρχικά δεδομένα σχετικά με το σύνολο των πιθανών λύσεων και την ποσότητα των πόρων που διατίθενται για τη δημιουργία εξοπλισμού μέτρησης που υλοποιεί το λεξικό χαρακτηριστικών, καθιστά δυνατή την επίλυση του προβλήματος της κατασκευής ενός συστήματος αναγνώρισης με τον βέλτιστο τρόπο.

Έτσι, στη γενική περίπτωση, όταν δημιουργείτε συστήματα αναγνώρισης, πρέπει να αντιμετωπίσετε την ακόλουθη κατάσταση. Δημιουργείται ένα συγκεκριμένο σύστημα ελέγχου που εφαρμόζει τον ένα ή τον άλλο έλεγχο ανάλογα με τα αποτελέσματα της αξιολόγησης, τις βασικές ιδιότητες, τη φύση, τον σκοπό του αντικειμένου ή του φαινομένου και την αναγνώρισή του. Το σύστημα ελέγχου έχει έναν πεπερασμένο αριθμό λύσεων. Η συνιστώσα της αποτελεσματικότητας του ελέγχου που εξαρτάται από τη λειτουργία του συστήματος αναγνώρισης καθορίζεται από δύο παράγοντες. Ο πρώτος παράγοντας σχετίζεται με το βαθμό λεπτομέρειας στην αναγνώριση αντικειμένων ή φαινομένων, υψηλότερη τιμήπου θα συμβεί εάν ο αριθμός των κλάσεων που περιέχονται στο αλφάβητο των κλάσεων του συστήματος αναγνώρισης είναι ίσος με τον αριθμό των πιθανών λύσεων (συν μία - η τελευταία κλάση, τα αντικείμενα της οποίας δεν αναγνωρίζονται). Ο δεύτερος παράγοντας είναι η ακρίβεια επίλυσης του προβλήματος της αναγνώρισης. Φυσικά, όσο υψηλότερο είναι, τόσο λιγότερο πιθανό είναι να ληφθεί μια απόφαση που δεν αντιστοιχεί στα χαρακτηριστικά ενός δεδομένου αντικειμένου ή φαινομένου. Για παράδειγμα, η εφαρμογή μιας στρατηγικής θεραπείας που δεν είναι επαρκής για τη νόσο όταν χρησιμοποιείται ένα ιατρικό διαγνωστικό σύστημα. κακή χρήση αυτό το φάρμακοΑντίδραση στην περίπτωση χρήσης συστήματος αναγνώρισης στόχου, κ.λπ. Ωστόσο, για ένα δεδομένο λεξικό χαρακτηριστικών, η αύξηση του αλφαβήτου των κλάσεων μειώνει την ακρίβεια επίλυσης του προβλήματος αναγνώρισης. Γενικά, μια αύξηση στο λεξικό χαρακτηριστικών σχετίζεται με την ανάπτυξη νέου ή τη χρήση υπάρχοντος εξοπλισμού μέτρησης, γεγονός που συνεπάγεται αύξηση του κόστους κατασκευής ενός συστήματος αναγνώρισης.

Έτσι, η ουσία του προβλήματος της αναγνώρισης είναι να αναπτυχθεί ένα τέτοιο αλφάβητο τάξεων και ένα λεξικό χαρακτηριστικών που, υπό προϋποθέσεις περιορισμένες πηγέςγια την κατασκευή ενός συστήματος αναγνώρισης παρέχουν μέγιστη αποτελεσματικότηταένα σύστημα ελέγχου που λαμβάνει την κατάλληλη απόφαση ανάλογα με τα αποτελέσματα της επίλυσης του προβλήματος αναγνώρισης. Σε αυτήν την περίπτωση, φυσικά, επιλέγοντας ένα λεξικό χαρακτηριστικών και ορίζοντας το αλφάβητο των κλάσεων, θα πρέπει να βρει κανείς τους καλύτερους κανόνες απόφασης που καθορίζουν τα όρια μεταξύ των κλάσεων. Ωστόσο, στη γενική περίπτωση, αυτό δεν είναι το πρόβλημα της αναγνώρισης, όπως και το καθήκον του καθορισμού των βέλτιστων κανόνων απόφασης που παρέχουν τη μεγαλύτερη ακρίβεια αναγνώρισης υπό τις συνθήκες ενός δεδομένου αλφαβήτου κλάσεων και ενός λεξικού χαρακτηριστικών δεν είναι σημαντικό και μερικές φορές όχι δύσκολο. Επιπλέον, κατά την κατασκευή λογικά συστήματααλγόριθμοι αναγνώρισης που χρησιμοποιούν είτε αλγόριθμους αναγνώρισης που βασίζονται σε μεθόδους λογικής άλγεβρας είτε δομικά (γλωσσικά) συστήματα (βλ. Κεφάλαιο 8), οι κανόνες απόφασης δεν ορίζονται καθόλου.

Επομένως, δεν υπάρχουν επαρκείς λόγοι για να θεωρηθεί δίκαιη η κρίση ότι το πρόβλημα της αναγνώρισης συνίσταται στον καθορισμό των αποφασιστικών κανόνων (αποφασιστικά όρια).

Τέλος εργασίας -

Αυτό το θέμα ανήκει στην ενότητα:

Γενικά χαρακτηριστικά του προβλήματος της αναγνώρισης αντικειμένων και φαινομένων

V a Skripkin.. μέθοδοι αναγνώρισης.. γενικά χαρακτηριστικά του προβλήματος της αναγνώρισης αντικειμένων και φαινομένων..

Εάν χρειάζεστε επιπλέον υλικό για αυτό το θέμα ή δεν βρήκατε αυτό που αναζητούσατε, συνιστούμε να χρησιμοποιήσετε την αναζήτηση στη βάση δεδομένων των έργων μας:

Τι θα κάνουμε με το υλικό που λάβαμε:

Εάν αυτό το υλικό σας ήταν χρήσιμο, μπορείτε να το αποθηκεύσετε στη σελίδα σας στα κοινωνικά δίκτυα:

Όλα τα θέματα σε αυτήν την ενότητα:

Ποιοτική περιγραφή της εργασίας αναγνώρισης i
Η αναγνώριση εικόνων (αντικειμένων, σημάτων, καταστάσεων, φαινομένων ή διεργασιών) είναι ίσως η πιο συνηθισμένη εργασία που πρέπει να λύσει ένα άτομο σχεδόν κάθε δευτερόλεπτο από το πρώτο έως το τελευταίο.

Κύρια καθήκοντα συστημάτων αναγνώρισης κτιρίων
Το παράδειγμα που συζητείται στην § 1.1 υποδεικνύει αυτή την αναγνώριση σύνθετα αντικείμενακαι τα φαινόμενα απαιτούν δημιουργία ειδικά συστήματααναγνώριση - σύνθετη δυναμικά συστήματα, sos

Εξειδικευμένα συστήματα αναγνώρισης
Η εξεταζόμενη ταξινόμηση των συστημάτων αναγνώρισης και οι αρχές λειτουργίας τους αντικατοπτρίζουν τωρινή κατάστασηερώτηση. Όλα τα είδη συστημάτων αναγνώρισης βασίζονται σε αυστηρά επισημοποιήσεις

Δήλωση του προβλήματος αναγνώρισης
Έστω ένα σύνολο αντικειμένων ή φαινομένων Ω=(w1 ..., ..., wz), καθώς και ένα σύνολο πιθανών λύσεων L=(l1, ..., lk), που μπορεί να

Μέθοδος επίλυσης του προβλήματος αναγνώρισης
Η εξεταζόμενη διατύπωση του προβλήματος της αναγνώρισης μας επιτρέπει να προσδιορίσουμε τη σειρά των εργασιών που προκύπτουν κατά την ανάπτυξη ενός συστήματος αναγνώρισης, να προτείνουμε τις διατυπώσεις τους και πιθανώς

Συστήματα αναγνώρισης χωρίς εκπαίδευση
Η κατασκευή συστημάτων αναγνώρισης χωρίς εκπαίδευση είναι δυνατή εάν υπάρχουν πλήρεις αρχικές εκ των προτέρων πληροφορίες, οι οποίες είναι ένα σύνολο από: 1) πληροφορίες σχετικά με τη φύση του

Συστήματα αναγνώρισης μάθησης
Η χρήση μεθόδων εκμάθησης για τη δημιουργία συστημάτων αναγνώρισης είναι απαραίτητη σε περιπτώσεις όπου δεν είναι διαθέσιμες πλήρεις αρχικές εκ των προτέρων πληροφορίες. Ο όγκος του μας επιτρέπει να υποδιαιρούμε

Συστήματα αναγνώρισης αυτομάθησης
Στην πράξη, μερικές φορές κάποιος πρέπει να αντιμετωπίσει την ανάγκη κατασκευής συσκευών αναγνώρισης σε συνθήκες όπου είναι είτε αδύνατο να ταξινομηθούν αντικείμενα είτε για τον έναν ή τον άλλο λόγο

Μερικές πληροφορίες από τη θεωρία των στατιστικών αποφάσεων
Ας εξετάσουμε τα κύρια αποτελέσματα της θεωρίας των στατιστικών αποφάσεων χρησιμοποιώντας το ακόλουθο παράδειγμα. Έστω ότι το σύνολο των αντικειμένων χωρίζεται σε κλάσεις Ω1 και Ω2, και για

Κριτήριο Bayes
Το κριτήριο Bayes είναι ένας κανόνας σύμφωνα με τον οποίο η στρατηγική απόφασης επιλέγεται με τέτοιο τρόπο ώστε να διασφαλίζεται ένας ελάχιστος μέσος όρος κινδύνου. Η χρήση του κριτηρίου Bayes συνιστάται σε

Κριτήριο Minimax
Κατά την κατασκευή συστημάτων αναγνώρισης, είναι δυνατές καταστάσεις όταν οι a priori πιθανότητες εμφάνισης αντικειμένων των αντίστοιχων κλάσεων είναι άγνωστες. Ελαχιστοποιήστε τη μέση τιμή κινδύνου

Τεστ Neyman-Pearson
Κατά την κατασκευή ορισμένων συστημάτων αναγνώρισης, μπορεί να είναι άγνωστες όχι μόνο οι a priori πιθανότητες εμφάνισης αντικειμένων των αντίστοιχων κλάσεων, αλλά και ο πίνακας πληρωμής (1.7). Σε παρόμοια

Διαδοχική διαδικασία απόφασης
Προηγουμένως, θεωρήθηκε ότι η απόφαση για το εάν ένα αναγνωρισμένο αντικείμενο w ανήκει στην αντίστοιχη κλάση Ωi, i=l, ..., m, λαμβάνεται μετά τη μέτρηση ολόκληρου του πληθυσμού

Τακτοποίηση του προβλήματος της αναγνώρισης
Σύμφωνα με τη στρατηγική Bayes, εάν ένα αναγνωρισμένο αντικείμενο έχει μια μετρούμενη τιμή χαρακτηριστικού x = x0, τότε

Λεξικό εργασίας σημαδιών
Στην § 5.1 ένα από τα πιθανές μεθόδουςεπιλογή του χώρου χαρακτηριστικών του συστήματος αναγνώρισης, διασφαλίζοντας, εντός των κατανεμημένων πόρων, τη μέγιστη τιμή του κριτηρίου ka

Συγκριτική αξιολόγηση χαρακτηριστικών
Έχουμε συζητήσει αρκετά παραπάνω γενικές μεθόδουςεπιλέγοντας ένα σύνολο χαρακτηριστικών που είναι κατάλληλες και προσβάσιμες για χρήση κατά την κατασκευή ενός συστήματος αναγνώρισης. Ωστόσο, στην πράξη

Αντιπροσωπεύει αριθμούς και βάση
Μια Boolean συνάρτηση θεωρείται δεδομένη εάν είναι δυνατό να καθοριστούν οι τιμές αλήθειας αυτής της συνάρτησης για όλους τους πιθανούς συνδυασμούς των τιμών αλήθειας των στοιχείων της. Το τραπέζι που

Επαναφορά μιας Boolean συνάρτησης από έναν αντιπροσωπευτικό αριθμό
Ας εξετάσουμε μεθόδους που μας επιτρέπουν να μεταβούμε από τον καθορισμό μιας Boolean συνάρτησης με τη μορφή ενός αντιπροσωπευτικού αριθμού στην έκφραση της ρητά μέσω στοιχείων. Διαζευκτική κανονική μορφή (DNF).

Εξάρτηση και ανεξαρτησία δηλώσεων
Προϋποθέσεις ανεξαρτησίας. Δεδομένου ότι κάθε συνάρτηση Boole μπορεί να έχει δύο τιμές αλήθειας, n συναρτήσεις Boole μπορούν να σχηματίσουν 2n συνδυασμούς τιμών αλήθειας. Σύμφωνα με το def.

Boolean εξισώσεις
Η επίλυση πολλών προβλημάτων που σχετίζονται με την αναγνώριση αντικειμένων μπορεί να περιοριστεί στην εύρεση λύσεων στο Boolean αλγεβρικές εξισώσειςμε ένα (ή περισσότερα) άγνωστα. Ένα παράδειγμα boolean

Αντικατάσταση μεταβλητών
Η έννοια της αλλαγής μεταβλητών στη λογική άλγεβρα είναι παρόμοια με την έννοια της αλλαγής μεταβλητών στη συνηθισμένη άλγεβρα. Αν οι Α, Β, Γ, ... είναι στοιχειώδεις προτάσεις και γίνει αλλαγή μεταβλητών, τότε

Επίλυση προβλημάτων λογικής αναγνώρισης
Στα συστήματα λογικής αναγνώρισης, οι κλάσεις και οι ιδιότητες των αντικειμένων θεωρούνται ως λογικές μεταβλητές. Για να τονίσετε αυτό το χαρακτηριστικό, για να δηλώσετε κλάσεις και χαρακτηριστικά, εισάγετε

Επίλυση προβλημάτων αναγνώρισης με μεγάλο αριθμό στοιχείων
Η εφαρμογή των μεθόδων που περιγράφονται στις προηγούμενες παραγράφους για την κατασκευή μιας μειωμένης βάσης και την επίλυση λογικών προβλημάτων περιορίζεται σημαντικά από την ποσότητα της μνήμης του υπολογιστή και την ταχύτητά τους. Τ

Αλγόριθμος για την κατασκευή μειωμένης βάσης
Στην § 7.1 παρουσιάστηκε πώς να χρησιμοποιήσετε έναν υπολογιστή, με βάση τη μειωμένη βάση b´ [A1, A2, ...Ω1, Ω2,...], για να βρείτε

Αναγνώριση αντικειμένων υπό συνθήκες καμουφλάζ τους
Η κάλυψη είναι μια από τις κύριες μεθόδους μείωσης της αποτελεσματικότητας της αναγνώρισης του εχθρού στο συνολικό εύρος των αντίμετρων. Η επίλυση του προβλήματος του καμουφλάζ απαιτεί τη συμμετοχή, με

Αναγνώριση υπό συνθήκες ανακοπής
Ας εξετάσουμε το έργο της αναγνώρισης αντικειμένων σε συνθήκες όπου ο εχθρός μπορεί να αποτρέψει τόσο την αναγνώριση μεμονωμένων χαρακτηριστικών των αντικειμένων όσο και να αλλάξει συνειδητά την τακτική του σε σχέση με

Αλγόριθμοι αναγνώρισης βασισμένοι στον υπολογισμό των βαθμολογιών
Οι αλγόριθμοι λογικής αναγνώρισης που συζητήθηκαν παραπάνω, σε πολλές περιπτώσεις, δεν επιτρέπουν σε κάποιον να λάβει μια σαφή απόφαση σχετικά με το εάν το αναγνωρισμένο αντικείμενο ανήκει σε μια συγκεκριμένη κλάση. YU.

Γενικά χαρακτηριστικά των μεθόδων δομικής αναγνώρισης
Σε πολλές περιπτώσεις, εκ των υστέρων πληροφορίες για αναγνωρισμένα αντικείμενα ή φαινόμενα περιέχονται σε αρχεία αντίστοιχων σημάτων (ηλεκτροκαρδιογραφήματα, εγκεφαλογραφήματα που ανακλώνται από στόχους).

Βασικά στοιχεία της συσκευής μεθόδων δομικής αναγνώρισης
Όταν μιλάμε για ένα μέσο περιγραφής αντικειμένων με όρους μη παράγωγων στοιχείων και των σχέσεών τους, χρησιμοποιείται η έννοια της γλώσσας. Οι κανόνες αυτής της γλώσσας, που καθορίζουν τον τρόπο κατασκευής ενός αντικειμένου από μη υλικό

Εφαρμογή της διαδικασίας αναγνώρισης με βάση δομικές μεθόδους
Για την αναγνώριση ενός άγνωστου αντικειμένου που βασίζεται σε δομικές μεθόδους, είναι απαραίτητο πρώτα από όλα να βρεθούν τα μη προερχόμενα στοιχεία του και οι μεταξύ τους σχέσεις και στη συνέχεια η χρήση συντακτικών

Δήλωση του προβλήματος βελτιστοποίησης της διαδικασίας αναγνώρισης
Πρώτα απ 'όλα, θα δείξουμε ότι με την αύξηση του αριθμού των χαρακτηριστικών που χρησιμοποιούνται στην αναγνώριση, αυξάνεται και η πιθανότητα σωστής αναγνώρισης άγνωστων αντικειμένων. Ver

Αλγόριθμος για τον έλεγχο της διαδικασίας αναγνώρισης
Οι έννοιες που εξετάζονται καθιστούν δυνατή την κατασκευή ενός αλγορίθμου για τον έλεγχο της διαδικασίας αναγνώρισης με τη μορφή κανόνα για διαδοχική αναζήτηση λύσεων, διασφαλίζοντας την ανάπτυξη ενός βέλτιστου σχεδίου

Ιδιαίτερες προσεγγίσεις στη λήψη αποφάσεων στην αναγνώριση
Η επίλυση του προβλήματος βελτιστοποίησης της αναγνώρισης στην εξεταζόμενη διατύπωση απαιτεί τη διαθεσιμότητα ορισμένων δεδομένων. Όταν απουσιάζουν, πρέπει κανείς να χρησιμοποιήσει ιδιωτικές προσεγγίσεις για την πρ

Αλγεβρική προσέγγιση στο πρόβλημα της αναγνώρισης
Οι αλγόριθμοι αναγνώρισης συζητούνται παραπάνω: ντετερμινιστικοί αλγόριθμοι που βασίζονται στη σχεδίαση ενός καθοριστικού ορίου στον χώρο χαρακτηριστικών (το όριο που χωρίζει τις τάξεις και αναπαριστά

Αποτελεσματικότητα πιθανοτικών συστημάτων αναγνώρισης
Για να αξιολογήσετε την αποτελεσματικότητα των πιθανολογικών συστημάτων αναγνώρισης που βασίζονται σε μαθηματική μοντελοποίηση, μπορείτε να χρησιμοποιήσετε τη μέθοδο στατιστικής δοκιμής. Για τη διενέργεια τέτοιων δοκιμών

Αποτελεσματικότητα συστημάτων λογικής αναγνώρισης
Κατά την κατασκευή συστημάτων λογικής αναγνώρισης, πρέπει κανείς να αντιμετωπίσει μια κατάσταση όπου οι τιμές αλήθειας των στοιχείων A1..., An, εκφράζουν τα χαρακτηριστικά των αντικειμένων

Εικόνα, τάξη - μια ομαδοποίηση ταξινόμησης σε ένα σύστημα ταξινόμησης που ενώνει (τονίζει) μια συγκεκριμένη ομάδα αντικειμένων σύμφωνα με κάποιο κριτήριο.

Η ευφάνταστη αντίληψη του κόσμου είναι μια από τις μυστηριώδεις ιδιότητες του ζωντανού εγκεφάλου, που επιτρέπει σε κάποιον να κατανοήσει την ατελείωτη ροή των αντιληπτών πληροφοριών και να διατηρήσει τον προσανατολισμό στον ωκεανό ανόμοιων δεδομένων για τον έξω κόσμο. Κατά την αντίληψη του εξωτερικού κόσμου, ταξινομούμε πάντα τις αντιληπτές αισθήσεις, δηλαδή τις χωρίζουμε σε ομάδες όμοιων, αλλά όχι πανομοιότυπων φαινομένων. Για παράδειγμα, παρά τη σημαντική διαφορά, μια ομάδα περιλαμβάνει όλα τα γράμματα Α, γραμμένα με διαφορετικούς χειρόγραφους, ή όλους τους ήχους που αντιστοιχούν στην ίδια νότα, που λαμβάνονται σε οποιαδήποτε οκτάβα και σε οποιοδήποτε όργανο, και ο χειριστής που ελέγχει ένα τεχνικό αντικείμενο για το σύνολο πολλά κράτητο αντικείμενο αντιδρά με την ίδια αντίδραση. Είναι χαρακτηριστικό ότι για να διατυπωθεί μια έννοια για μια ομάδα αντιλήψεων μιας συγκεκριμένης τάξης, αρκεί να εξοικειωθείτε με έναν μικρό αριθμό εκπροσώπων της. Σε ένα παιδί μπορεί να εμφανιστεί ένα γράμμα μόνο μία φορά ώστε να μπορεί να βρει αυτό το γράμμα σε ένα κείμενο γραμμένο με διαφορετικές γραμματοσειρές ή να το αναγνωρίσει, ακόμα κι αν είναι γραμμένο σε εσκεμμένα παραμορφωμένη μορφή. Αυτή η ιδιότητα του εγκεφάλου μας επιτρέπει να διατυπώσουμε μια τέτοια έννοια ως εικόνα.

Οι εικόνες έχουν μια χαρακτηριστική ιδιότητα, η οποία εκδηλώνεται στο γεγονός ότι η εξοικείωση με έναν πεπερασμένο αριθμό φαινομένων από το ίδιο σύνολο καθιστά δυνατή την αναγνώριση όσο θέλετε. μεγάλος αριθμόςεκπροσώπους της. Παραδείγματα εικόνων μπορεί να είναι: ποτάμι, θάλασσα, υγρό, μουσική του Τσαϊκόφσκι, ποίηση Μαγιακόφσκι κ.λπ. Ένα συγκεκριμένο σύνολο καταστάσεων ενός αντικειμένου ελέγχου μπορεί επίσης να θεωρηθεί ως εικόνα, και ολόκληρο αυτό το σύνολο καταστάσεων χαρακτηρίζεται από το γεγονός ότι για να επιτευχθεί ένας δεδομένος στόχος, η ίδια επίδραση σε ένα αντικείμενο . Οι εικόνες έχουν χαρακτηριστικές αντικειμενικές ιδιότητες με την έννοια ότι διαφορετικοί άνθρωποι, εκπαιδευμένοι σε διαφορετικό υλικό παρατήρησης, ως επί το πλείστον ταξινομούν τα ίδια αντικείμενα με τον ίδιο τρόπο και ανεξάρτητα το ένα από το άλλο. Αυτή η αντικειμενικότητα των εικόνων είναι που επιτρέπει στους ανθρώπους σε όλο τον κόσμο να καταλαβαίνουν ο ένας τον άλλον.

Η ικανότητα αντίληψης του εξωτερικού κόσμου με τη μορφή εικόνων επιτρέπει σε κάποιον να αναγνωρίσει με μια συγκεκριμένη αξιοπιστία έναν άπειρο αριθμό αντικειμένων με βάση την εξοικείωση με έναν πεπερασμένο αριθμό από αυτά και η αντικειμενική φύση της κύριας ιδιότητας των εικόνων επιτρέπει σε κάποιον να μοντελοποιήσει το διαδικασία αναγνώρισής τους. Όντας μια αντανάκλαση της αντικειμενικής πραγματικότητας, η έννοια της εικόνας είναι τόσο αντικειμενική όσο και η ίδια η πραγματικότητα, και επομένως μπορεί η ίδια να αποτελέσει αντικείμενο ειδικής μελέτης.

Στη βιβλιογραφία που είναι αφιερωμένη στο πρόβλημα της αναγνώρισης προτύπων μάθησης (PR), η έννοια της τάξης εισάγεται συχνά αντί της έννοιας της εικόνας.

Το πρόβλημα της αναγνώρισης προτύπων μάθησης (PRT)

Μία από τις πιο ενδιαφέρουσες ιδιότητες του ανθρώπινου εγκεφάλου είναι η ικανότητά του να ανταποκρίνεται άπειρο σύνολοκαταστάσεις του εξωτερικού περιβάλλοντος με πεπερασμένο αριθμό αντιδράσεων. Ίσως ήταν ακριβώς αυτή η ιδιότητα που επέτρεψε στον άνθρωπο να επιτύχει την υψηλότερη μορφή ύπαρξης ζωντανής ύλης, που εκφράζεται στην ικανότητα να σκέφτεται, δηλαδή να αντικατοπτρίζει ενεργά τον αντικειμενικό κόσμο με τη μορφή εικόνων, εννοιών, κρίσεων κ.λπ. Επομένως, το πρόβλημα του ORR προέκυψε στη μελέτη των φυσιολογικών ιδιοτήτων του εγκεφάλου.

Ας εξετάσουμε ένα παράδειγμα προβλημάτων από τον τομέα της ΟΔΟ.


Ρύζι. 3.1.

Υπάρχουν 12 εικόνες που παρουσιάζονται εδώ και θα πρέπει να επιλέξετε χαρακτηριστικά που μπορούν να σας βοηθήσουν να διακρίνετε την αριστερή τριάδα των εικόνων από τη δεξιά. Η επίλυση αυτών των προβλημάτων απαιτεί πλήρη μοντελοποίηση της λογικής σκέψης.

Γενικά, το πρόβλημα της αναγνώρισης προτύπων αποτελείται από δύο μέρη: την εκπαίδευση και την αναγνώριση. Η εκπαίδευση πραγματοποιείται με την εμφάνιση μεμονωμένων αντικειμένων που υποδεικνύουν ότι ανήκουν σε μια ή άλλη εικόνα. Ως αποτέλεσμα της εκπαίδευσης, το σύστημα αναγνώρισης πρέπει να αποκτήσει την ικανότητα να ανταποκρίνεται με τις ίδιες αντιδράσεις σε όλα τα αντικείμενα της ίδιας εικόνας και με διαφορετικές αντιδράσεις σε όλα τα αντικείμενα διαφορετικών εικόνων. Είναι πολύ σημαντικό η διαδικασία εκμάθησης να ολοκληρώνεται μόνο με την εμφάνιση ενός πεπερασμένου αριθμού αντικειμένων χωρίς άλλες προτροπές. Τα μαθησιακά αντικείμενα μπορεί να είναι είτε εικόνες είτε άλλες οπτικές εικόνες (γράμματα), είτε διάφορα φαινόμενα του εξωτερικού κόσμου, για παράδειγμα, ήχοι, σωματικές καταστάσεις κατά τη διάρκεια μιας ιατρικής διάγνωσης, η κατάσταση ενός τεχνικού αντικειμένου στα συστήματα ελέγχου κ.λπ. Είναι σημαντικό ότι μόνο τα ίδια τα αντικείμενα και η ιδιότητά τους στην εικόνα. Την εκπαίδευση ακολουθεί η διαδικασία αναγνώρισης νέων αντικειμένων, που χαρακτηρίζει τις ενέργειες ενός ήδη εκπαιδευμένου συστήματος. Η αυτοματοποίηση αυτών των διαδικασιών είναι το πρόβλημα της διδασκαλίας της αναγνώρισης προτύπων. Στην περίπτωση που ένα άτομο το λύνει ή το εφευρίσκει μόνο του και στη συνέχεια επιβάλλει έναν κανόνα ταξινόμησης στη μηχανή, το πρόβλημα αναγνώρισης επιλύεται εν μέρει, αφού το άτομο αναλαμβάνει το κύριο και κύριο μέρος του προβλήματος (εκπαίδευση).

Το πρόβλημα της διδασκαλίας της αναγνώρισης προτύπων είναι ενδιαφέρον τόσο από εφαρμοσμένη όσο και από θεμελιώδη άποψη. Από εφαρμοσμένης σκοπιάς, η επίλυση αυτού του προβλήματος είναι σημαντική κυρίως επειδή ανοίγει τη δυνατότητα αυτοματοποίησης πολλών διεργασιών που μέχρι τώρα είχαν συνδεθεί μόνο με τη δραστηριότητα του ζωντανού εγκεφάλου. Η θεμελιώδης σημασία του προβλήματος συνδέεται στενά με το ερώτημα που ανακύπτει όλο και περισσότερο σε σχέση με την ανάπτυξη ιδεών στην κυβερνητική: τι μπορεί και τι δεν μπορεί να κάνει ουσιαστικά μια μηχανή; Σε ποιο βαθμό οι δυνατότητες μιας μηχανής μπορούν να είναι κοντά σε αυτές ενός ζωντανού εγκεφάλου; Συγκεκριμένα, μπορεί μια μηχανή να αναπτύξει την ικανότητα να υιοθετεί μια ανθρώπινη ικανότητα να εκτελεί ορισμένες ενέργειες ανάλογα με τις καταστάσεις που προκύπτουν στο περιβάλλον; Μέχρι στιγμής, έχει καταστεί σαφές μόνο ότι εάν ένα άτομο μπορεί πρώτα να συνειδητοποιήσει ο ίδιος τις δεξιότητές του και μετά να το περιγράψει, δηλαδή να δείξει γιατί εκτελεί ενέργειες ως απάντηση σε κάθε κατάσταση του εξωτερικού περιβάλλοντος ή πώς (με ποιον κανόνα) συνδυάζει μεμονωμένα αντικείμενα σε εικόνες, τότε μια τέτοια ικανότητα μπορεί να μεταφερθεί σε ένα μηχάνημα χωρίς θεμελιώδεις δυσκολίες. Εάν ένα άτομο έχει μια δεξιότητα, αλλά δεν μπορεί να την εξηγήσει, τότε υπάρχει μόνο ένας τρόπος να μεταφερθεί η δεξιότητα σε μια μηχανή - η διδασκαλία με παραδείγματα.

Το φάσμα των προβλημάτων που μπορούν να επιλυθούν με τη χρήση συστημάτων αναγνώρισης είναι εξαιρετικά ευρύ. Αυτό περιλαμβάνει όχι μόνο εργασίες αναγνώρισης οπτικών και ακουστικών εικόνων, αλλά και εργασίες αναγνώρισης σύνθετες διαδικασίεςκαι φαινόμενα που προκύπτουν, για παράδειγμα, κατά την επιλογή κατάλληλων ενεργειών από τον επικεφαλής μιας επιχείρησης ή την επιλογή της βέλτιστης διαχείρισης τεχνολογικών, οικονομικών, μεταφορών ή στρατιωτικών επιχειρήσεων. Σε καθεμία από αυτές τις εργασίες, αναλύονται ορισμένα φαινόμενα, διαδικασίες και καταστάσεις του εξωτερικού κόσμου, τα οποία αναφέρονται παρακάτω ως αντικείμενα παρατήρησης. Πριν αρχίσετε να αναλύετε οποιοδήποτε αντικείμενο, πρέπει να αποκτήσετε ορισμένες, διατεταγμένες πληροφορίες σχετικά με αυτό με κάποιο τρόπο. Τέτοιες πληροφορίες αντιπροσωπεύουν τα χαρακτηριστικά των αντικειμένων, την εμφάνισή τους σε μια ποικιλία αντιληπτικών οργάνων του συστήματος αναγνώρισης.

Όμως κάθε αντικείμενο παρατήρησης μπορεί να μας επηρεάσει διαφορετικά, ανάλογα με τις συνθήκες αντίληψης. Για παράδειγμα, κάθε γράμμα, ακόμη και γραμμένο με τον ίδιο τρόπο, μπορεί, καταρχήν, να μετατοπιστεί με οποιονδήποτε τρόπο σε σχέση με τα όργανα που αντιλαμβάνονται. Επιπλέον, τα αντικείμενα της ίδιας εικόνας μπορεί να είναι αρκετά διαφορετικά μεταξύ τους και, φυσικά, να έχουν διαφορετικά αποτελέσματα στα όργανα που αντιλαμβάνονται.

Κάθε χαρτογράφηση ενός αντικειμένου στα αντιληπτικά όργανα του συστήματος αναγνώρισης, ανεξάρτητα από τη θέση του σε σχέση με αυτά τα όργανα, συνήθως ονομάζεται εικόνα του αντικειμένου και τα σύνολα τέτοιων εικόνων, ενωμένα με κάποιες κοινές ιδιότητες, είναι εικόνες.

Κατά την επίλυση προβλημάτων ελέγχου χρησιμοποιώντας μεθόδους αναγνώρισης προτύπων, χρησιμοποιείται ο όρος «κατάσταση» αντί του όρου «εικόνα». κατάσταση- αυτή είναι μια συγκεκριμένη μορφή εμφάνισης των χαρακτηριστικών του μετρούμενου ρεύματος (ή στιγμιαίας) του παρατηρούμενου αντικειμένου. Το σύνολο των κρατών καθορίζει την κατάσταση. Η έννοια της «κατάστασης» είναι ανάλογη με την έννοια της «εικόνας». Αλλά αυτή η αναλογία δεν είναι πλήρης, αφού δεν μπορεί να ονομαστεί κάθε εικόνα κατάσταση, αν και κάθε κατάσταση μπορεί να ονομαστεί εικόνα.

Μια κατάσταση ονομάζεται συνήθως ένα συγκεκριμένο σύνολο καταστάσεων σύνθετο αντικείμενο, καθένα από τα οποία χαρακτηρίζεται από τα ίδια ή παρόμοια χαρακτηριστικά του αντικειμένου. Για παράδειγμα, εάν ένα συγκεκριμένο αντικείμενο ελέγχου θεωρείται ως αντικείμενο παρατήρησης, τότε η κατάσταση συνδυάζει τέτοιες καταστάσεις αυτού του αντικειμένου στις οποίες θα πρέπει να εφαρμόζονται οι ίδιες ενέργειες ελέγχου. Εάν το αντικείμενο της παρατήρησης είναι ένα πολεμικό παιχνίδι, τότε η κατάσταση συνδυάζει όλες τις καταστάσεις παιχνιδιού που απαιτούν, για παράδειγμα, ισχυρό χτύπημα τανκς με αεροπορική υποστήριξη.

Η επιλογή της αρχικής περιγραφής των αντικειμένων είναι μια από τις κεντρικές εργασίες του προβλήματος ODO. Εάν η αρχική περιγραφή (χώρος χαρακτηριστικών) επιλεγεί επιτυχώς, η εργασία αναγνώρισης μπορεί να αποδειχθεί τετριμμένη και αντιστρόφως, μια ανεπιτυχώς επιλεγμένη αρχική περιγραφή μπορεί να οδηγήσει είτε σε πολύ περίπλοκη περαιτέρω επεξεργασία πληροφοριών είτε σε καμία λύση. Για παράδειγμα, εάν λυθεί το πρόβλημα της αναγνώρισης αντικειμένων που διαφέρουν ως προς το χρώμα και επιλεχθούν τα σήματα που λαμβάνονται από αισθητήρες βάρους ως αρχική περιγραφή, τότε το πρόβλημα της αναγνώρισης δεν μπορεί, κατ' αρχήν, να λυθεί.

Ανασκόπηση υπάρχουσες μεθόδουςαναγνώριση μοτίβου

L.P. Πόποβα , ΚΑΙ ΠΕΡΙΠΟΥ. Ντατίεφ

Η ικανότητα «αναγνώρισης» θεωρείται η κύρια ιδιότητα των ανθρώπων, καθώς και άλλων ζωντανών οργανισμών. Η αναγνώριση προτύπων είναι ένας κλάδος της κυβερνητικής που αναπτύσσει αρχές και μεθόδους ταξινόμησης, καθώς και αναγνώριση αντικειμένων, φαινομένων, διεργασιών, σημάτων, καταστάσεων - όλα εκείνα τα αντικείμενα που μπορούν να περιγραφούν από ένα πεπερασμένο σύνολο μερικών σημείων ή ιδιοτήτων που χαρακτηρίζουν το αντικείμενο .

Μια εικόνα είναι μια περιγραφή ενός αντικειμένου. Οι εικόνες έχουν μια χαρακτηριστική ιδιότητα, η οποία εκδηλώνεται στο γεγονός ότι η εξοικείωση με έναν πεπερασμένο αριθμό φαινομένων από το ίδιο σύνολο καθιστά δυνατή την αναγνώριση ενός αυθαίρετα μεγάλου αριθμού εκπροσώπων του.

Στη θεωρία της αναγνώρισης προτύπων, μπορούν να διακριθούν δύο κύριες κατευθύνσεις:

    τη μελέτη των ικανοτήτων αναγνώρισης που κατέχουν οι άνθρωποι και άλλοι ζωντανοί οργανισμοί·

    ανάπτυξη θεωρίας και μεθόδων για την κατασκευή συσκευών σχεδιασμένων για την επίλυση μεμονωμένων προβλημάτων αναγνώρισης προτύπων σε ορισμένους τομείς εφαρμογής.

Περαιτέρω, το άρθρο περιγράφει τα προβλήματα, τις αρχές και τις μεθόδους εφαρμογής συστημάτων αναγνώρισης εικόνων που σχετίζονται με την ανάπτυξη της δεύτερης κατεύθυνσης. Το δεύτερο μέρος του άρθρου εξετάζει μεθόδους νευρωνικών δικτύων αναγνώρισης προτύπων, οι οποίες μπορούν να αποδοθούν στην πρώτη κατεύθυνση της θεωρίας της αναγνώρισης προτύπων.

Προβλήματα κατασκευής συστημάτων αναγνώρισης εικόνων

Τα προβλήματα που προκύπτουν κατά την κατασκευή συστημάτων αυτόματης αναγνώρισης προτύπων μπορούν συνήθως να ταξινομηθούν σε διάφορους κύριους τομείς. Το πρώτο από αυτά σχετίζεται με την παρουσίαση των αρχικών δεδομένων που λαμβάνονται ως αποτελέσματα μετρήσεων για το προς αναγνώριση αντικείμενο. πρόβλημα ευαισθησίας. Κάθε μετρούμενη τιμή είναι κάποιο "χαρακτηριστικό μιας εικόνας ή ενός αντικειμένου. Ας υποθέσουμε, για παράδειγμα, ότι οι εικόνες είναι αλφαριθμητικοί χαρακτήρες. Σε αυτήν την περίπτωση, ένας αμφιβληστροειδής μέτρησης, παρόμοιος με αυτόν που φαίνεται στο Σχ. 1(α), μπορεί να είναι επιτυχής χρησιμοποιείται στον αισθητήρα. Εάν ο αμφιβληστροειδής αποτελείται από n-στοιχεία, τότε τα αποτελέσματα της μέτρησης μπορούν να αναπαρασταθούν ως διάνυσμα μέτρησης ή διάνυσμα εικόνας ,

όπου κάθε στοιχείο xi, λαμβάνει, για παράδειγμα, την τιμή 1 εάν είναι μέσω i-ο κελίο αμφιβληστροειδής περνά την εικόνα του συμβόλου και η τιμή είναι 0 διαφορετικά.

Ας δούμε το Σχ. 2(β). Σε αυτή την περίπτωση, οι εικόνες εξυπηρετούν συνεχείς λειτουργίες(τύπος ηχητικών σημάτων) μεταβλητή t. Εάν η μέτρηση των τιμών συνάρτησης πραγματοποιείται σε διακριτά σημεία t1,t2, ..., tn, τότε το διάνυσμα εικόνας μπορεί να σχηματιστεί λαμβάνοντας x1= f(t1),x2=f(t2),... , xn = f(tn).

Εικόνα 1. Μέτρηση αμφιβληστροειδούς

Το δεύτερο πρόβλημα της αναγνώρισης προτύπων σχετίζεται με την απομόνωση χαρακτηριστικών ή ιδιοτήτων από τα ληφθέντα δεδομένα πηγής και τη μείωση της διάστασης των διανυσμάτων προτύπων. Αυτό το πρόβλημα συχνά ορίζεται ως πρόβλημα προεπεξεργασία και επιλογή χαρακτηριστικών.

Τα χαρακτηριστικά της κατηγορίας εικόνας είναι χαρακτηριστικές ιδιότητες, κοινό για όλες τις εικόνες αυτής της τάξης. Χαρακτηριστικά που χαρακτηρίζουν διαφορές μεταξύ μεμονωμένων κλάσεων μπορούν να ερμηνευθούν ως διακλαδικά χαρακτηριστικά. Τα χαρακτηριστικά ενδοκλάσης, κοινά σε όλες τις υπό εξέταση κατηγορίες, δεν περιέχουν χρήσιμες πληροφορίες από την άποψη της αναγνώρισης και ενδέχεται να μην ληφθούν υπόψη. Η επιλογή χαρακτηριστικών θεωρείται μία από τις σημαντικές εργασίες που σχετίζονται με την κατασκευή συστημάτων αναγνώρισης. Εάν τα αποτελέσματα των μετρήσεων μας επιτρέπουν να αποκτήσουμε ένα πλήρες σύνολο διακριτικών χαρακτηριστικών για όλες τις κατηγορίες, η πραγματική αναγνώριση και ταξινόμηση των εικόνων δεν θα προκαλέσει ιδιαίτερες δυσκολίες. Στη συνέχεια, η αυτόματη αναγνώριση θα περιοριστεί σε μια απλή διαδικασία αντιστοίχισης ή διαδικασίες όπως η σάρωση πίνακα. Στα περισσότερα πρακτικά προβλήματα αναγνώρισης, ωστόσο, ο προσδιορισμός του πλήρους συνόλου των διακριτικών χαρακτηριστικών αποδεικνύεται εξαιρετικά δύσκολος, αν όχι αδύνατος. Είναι συνήθως δυνατό να εξαχθούν ορισμένα από τα διακριτικά χαρακτηριστικά από τα αρχικά δεδομένα και να τα χρησιμοποιήσουμε για να απλοποιήσουμε τη διαδικασία αυτόματης αναγνώρισης προτύπων. Συγκεκριμένα, η διάσταση των διανυσμάτων μέτρησης μπορεί να μειωθεί χρησιμοποιώντας μετασχηματισμούς που ελαχιστοποιούν την απώλεια πληροφοριών.

Το τρίτο πρόβλημα που σχετίζεται με την κατασκευή συστημάτων αναγνώρισης προτύπων είναι η εύρεση των βέλτιστων διαδικασιών λήψης αποφάσεων που είναι απαραίτητες για αναγνώριση και ταξινόμηση. Μόλις τα δεδομένα που συλλέγονται σχετικά με τα προς αναγνώριση μοτίβα αντιπροσωπεύονται από σημεία ή διανύσματα μέτρησης στον χώρο προτύπων, αφήστε το μηχάνημα να καταλάβει σε ποια κατηγορία μοτίβων αντιστοιχούν αυτά τα δεδομένα. Αφήστε το μηχάνημα να είναι σχεδιασμένο για να διακρίνει τις κατηγορίες M, που δηλώνονται με w1, w2, ... ..., wm. Σε αυτήν την περίπτωση, ο χώρος της εικόνας μπορεί να θεωρηθεί ότι αποτελείται από περιοχές M, καθεμία από τις οποίες περιέχει σημεία που αντιστοιχούν σε εικόνες από μία κατηγορία. Σε αυτήν την περίπτωση, η εργασία αναγνώρισης μπορεί να θεωρηθεί ότι κατασκευάζει τα όρια των περιοχών απόφασης που διαχωρίζουν τις κλάσεις M με βάση τα καταχωρημένα διανύσματα μέτρησης. Ας οριστούν αυτά τα όρια, για παράδειγμα, από τις συναρτήσεις απόφασης d1(x), d2(x),..., dm(x). Αυτές οι συναρτήσεις, που ονομάζονται επίσης συναρτήσεις διάκρισης, είναι βαθμωτές και μονής τιμής συναρτήσεις της εικόνας του x. Αν di (x) > dj (x), τότε η εικόνα x ανήκει στην κλάση w1. Με άλλα λόγια, εάν η i-η συνάρτηση απόφασης di(x) έχει τη μεγαλύτερη τιμή, τότε μια ουσιαστική απεικόνιση ενός τέτοιου σχήματος αυτόματη ταξινόμηση, με βάση την εφαρμογή της διαδικασίας λήψης αποφάσεων, φαίνεται στο Σχ. 2 (στο διάγραμμα «GR» είναι η γεννήτρια συναρτήσεων απόφασης).

Εικόνα 2. Αυτόματο σύστημα ταξινόμησης.

Αποφασιστικές συναρτήσεις μπορούν να ληφθούν με διάφορους τρόπους. Σε περιπτώσεις όπου υπάρχουν πλήρεις εκ των προτέρων πληροφορίες σχετικά με τις αναγνωρισμένες εικόνες, οι συναρτήσεις απόφασης μπορούν να προσδιοριστούν ακριβώς με βάση αυτές τις πληροφορίες. Εάν υπάρχουν μόνο ποιοτικές πληροφορίες σχετικά με τις εικόνες, μπορούν να γίνουν εύλογες υποθέσεις σχετικά με τη μορφή των καθοριστικών συναρτήσεων. Στην τελευταία περίπτωση, τα όρια των περιοχών λύσης μπορεί να αποκλίνουν σημαντικά από τα αληθινά, και επομένως είναι απαραίτητο να δημιουργηθεί ένα σύστημα ικανό να επιτύχει ένα ικανοποιητικό αποτέλεσμα μέσω μιας σειράς διαδοχικών προσαρμογών.

Τα αντικείμενα (εικόνες) που πρόκειται να αναγνωριστούν και να ταξινομηθούν χρησιμοποιώντας ένα αυτόματο σύστημα αναγνώρισης προτύπων πρέπει να έχουν ένα σύνολο μετρήσιμων χαρακτηριστικών. Όταν για μια ολόκληρη ομάδα εικόνων τα αποτελέσματα των αντίστοιχων μετρήσεων αποδεικνύονται παρόμοια, αυτά τα αντικείμενα θεωρείται ότι ανήκουν στην ίδια κατηγορία. Ο σκοπός του συστήματος αναγνώρισης προτύπων είναι, με βάση τις συλλεγόμενες πληροφορίες, να προσδιορίσει μια κατηγορία αντικειμένων με χαρακτηριστικά παρόμοια με αυτά που μετρώνται στα αντικείμενα που αναγνωρίζονται. Η ορθότητα της αναγνώρισης εξαρτάται από το πλήθος των διακριτικών πληροφοριών που περιέχονται στα μετρούμενα χαρακτηριστικά και την αποτελεσματικότητα της χρήσης αυτών των πληροφοριών.

      Βασικές μέθοδοι για την εφαρμογή συστημάτων αναγνώρισης προτύπων

Η αναγνώριση προτύπων αναφέρεται στο πρόβλημα της κατασκευής και εφαρμογής τυπικών πράξεων σε αριθμητικές ή συμβολικές αναπαραστάσεις αντικειμένων στον πραγματικό ή τον ιδανικό κόσμο, τα αποτελέσματα των οποίων αντικατοπτρίζουν τις σχέσεις ισοδυναμίας μεταξύ αυτών των αντικειμένων. Οι σχέσεις ισοδυναμίας εκφράζουν την υπαγωγή των αξιολογούμενων αντικειμένων σε οποιεσδήποτε κλάσεις, θεωρούμενες ως ανεξάρτητες σημασιολογικές μονάδες.

Κατά την κατασκευή αλγορίθμων αναγνώρισης, οι κλάσεις ισοδυναμίας μπορούν να καθοριστούν από έναν ερευνητή που χρησιμοποιεί τις δικές του ουσιαστικές αναπαραστάσεις ή χρησιμοποιεί εξωτερικές Επιπλέον πληροφορίεςσχετικά με τις ομοιότητες και τις διαφορές των αντικειμένων στο πλαίσιο του προβλήματος που επιλύεται. Μετά μιλούν για «αναγνώριση με δάσκαλο». Διαφορετικά, δηλ. Όταν ένα αυτοματοποιημένο σύστημα επιλύει ένα πρόβλημα ταξινόμησης χωρίς τη χρήση εξωτερικών πληροφοριών εκπαίδευσης, μιλάμε για αυτόματη ταξινόμηση ή «αναγνώριση χωρίς επίβλεψη». Οι περισσότεροι αλγόριθμοι αναγνώρισης προτύπων απαιτούν τη χρήση πολύ σημαντικής υπολογιστικής ισχύος, η οποία μπορεί να παρέχεται μόνο από τεχνολογία υπολογιστών υψηλής απόδοσης.

Διάφοροι συγγραφείς (Yu.L. Barabash, V.I. Vasiliev, A.L. Gorelik, V.A. Skripkin, R. Duda, P. Hart, L.T. Kuzin, F.I. Peregudov, F.P. Tarasenko, Temnikov F.E., Afonin V.A., R., J., Dmitriev. Gonzalez, P. Winston, K. Fu, Ya.Z. Tsypkin, κ.λπ.) δίνουν μια διαφορετική τυπολογία των μεθόδων αναγνώρισης προτύπων. Ορισμένοι συγγραφείς διακρίνουν μεταξύ παραμετρικών, μη παραμετρικών και ευρετικών μεθόδων, άλλοι προσδιορίζουν ομάδες μεθόδων που βασίζονται σε ιστορικά καθιερωμένες σχολές και τάσεις στον τομέα αυτό.

Ταυτόχρονα, οι γνωστές τυπολογίες δεν λαμβάνουν υπόψη ένα πολύ σημαντικό χαρακτηριστικό, το οποίο αντανακλά την ιδιαιτερότητα του τρόπου αναπαράστασης της γνώσης για μια θεματική περιοχή χρησιμοποιώντας οποιονδήποτε επίσημο αλγόριθμο αναγνώρισης προτύπων. Ο D.A. Pospelov εντοπίζει δύο βασικούς τρόπους παρουσίασης της γνώσης:

    Εντατική αναπαράσταση - με τη μορφή διαγράμματος συνδέσεων μεταξύ χαρακτηριστικών (χαρακτηριστικών).

    Επεκτατική αναπαράσταση - χρησιμοποιώντας συγκεκριμένα γεγονότα (αντικείμενα, παραδείγματα).

Πρέπει να σημειωθεί ότι η ύπαρξη ακριβώς αυτών των δύο ομάδων μεθόδων αναγνώρισης: αυτών που λειτουργούν με πινακίδες και εκείνων που λειτουργούν με αντικείμενα, είναι βαθιά φυσική. Από αυτή την άποψη, καμία από αυτές τις μεθόδους, χωριστά από την άλλη, δεν μας επιτρέπει να σχηματίσουμε μια επαρκή αντανάκλαση της θεματικής περιοχής. Μεταξύ αυτών των μεθόδων υπάρχει μια σχέση συμπληρωματικότητας με την έννοια του N. Bohr, επομένως, τα πολλά υποσχόμενα συστήματα αναγνώρισης θα πρέπει να παρέχουν την εφαρμογή και των δύο αυτών μεθόδων, και όχι μόνο μιας από αυτές.

Έτσι, η ταξινόμηση των μεθόδων αναγνώρισης που προτείνει ο D.A. Pospelov βασίζεται στα θεμελιώδη πρότυπα που διέπουν τον ανθρώπινο τρόπο γνώσης γενικά, γεγονός που τον τοποθετεί σε εντελώς ειδική (προνομιακή) θέση σε σύγκριση με άλλες ταξινομήσεις, οι οποίες σε αυτό το πλαίσιο φαίνονται πιο ελαφριές και τεχνητός.

Εντατικές μέθοδοι

Ένα χαρακτηριστικό γνώρισμα των εντατικών μεθόδων είναι ότι χρησιμοποιούν στοιχεία λειτουργιών κατά την κατασκευή και την εφαρμογή αλγορίθμων αναγνώρισης προτύπων. διάφορα χαρακτηριστικάτα σημάδια και οι συνδέσεις τους. Τέτοια στοιχεία μπορεί να είναι μεμονωμένες τιμές ή διαστήματα τιμών χαρακτηριστικών, μέσες τιμές και διακυμάνσεις, πίνακες σχέσεων χαρακτηριστικών κ.λπ., στους οποίους εκτελούνται ενέργειες, εκφρασμένες σε αναλυτική ή εποικοδομητική μορφή. Ταυτόχρονα, τα αντικείμενα σε αυτές τις μεθόδους δεν θεωρούνται ως ολοκληρωμένες μονάδες πληροφοριών, αλλά λειτουργούν ως δείκτες για την αξιολόγηση της αλληλεπίδρασης και της συμπεριφοράς των ιδιοτήτων τους.

Η ομάδα των εντατικών μεθόδων για την αναγνώριση προτύπων είναι εκτεταμένη και η διαίρεση της σε υποκατηγορίες είναι σε κάποιο βαθμό υπό όρους:

– μέθοδοι που βασίζονται σε εκτιμήσεις των πυκνοτήτων κατανομής των τιμών χαρακτηριστικών

– μέθοδοι που βασίζονται σε υποθέσεις σχετικά με την κατηγορία των συναρτήσεων απόφασης

– λογικές μεθόδους

– γλωσσικές (δομικές) μέθοδοι.

Μέθοδοι που βασίζονται σε εκτιμήσεις των πυκνοτήτων κατανομής των τιμών χαρακτηριστικών.Αυτές οι μέθοδοι αναγνώρισης προτύπων δανείζονται από την κλασική θεωρία των στατιστικών αποφάσεων, στην οποία τα αντικείμενα μελέτης θεωρούνται ως πραγματοποιήσεις μιας πολυδιάστατης τυχαίας μεταβλητής που κατανέμεται στο χώρο χαρακτηριστικών σύμφωνα με κάποιο νόμο. Βασίζονται σε ένα σχέδιο λήψης αποφάσεων Μπεϋζιανού που κάνει έκκληση σε a priori πιθανότητες αντικειμένων που ανήκουν σε μια συγκεκριμένη αναγνωρισμένη κλάση και υπό όρους πυκνότητες κατανομής τιμών διανυσμάτων χαρακτηριστικών. Αυτές οι μέθοδοι καταλήγουν στον προσδιορισμό του λόγου πιθανοτήτων σε διάφορες περιοχές του πολυδιάστατου χώρου χαρακτηριστικών.

Μια ομάδα μεθόδων που βασίζεται στην εκτίμηση της πυκνότητας κατανομής των τιμών χαρακτηριστικών σχετίζεται άμεσα με τις μεθόδους ανάλυσης διάκρισης. Η Bayesian προσέγγιση στη λήψη αποφάσεων είναι μια από τις πιο ανεπτυγμένες λεγόμενες παραμετρικές μεθόδους στη σύγχρονη στατιστική, για την οποία η αναλυτική έκφραση του νόμου κατανομής (στην περίπτωση αυτή, ο κανονικός νόμος) θεωρείται γνωστή και μόνο ένας μικρός αριθμός παραμέτρων ( διανύσματα μέσες τιμές και πίνακες συνδιακύμανσης) απαιτείται να εκτιμηθούν.

Αυτή η ομάδα περιλαμβάνει επίσης τη μέθοδο υπολογισμού του λόγου πιθανότητας για ανεξάρτητα χαρακτηριστικά. Αυτή η μέθοδος, με εξαίρεση την υπόθεση της ανεξαρτησίας των χαρακτηριστικών (η οποία στην πραγματικότητα σχεδόν ποτέ δεν ικανοποιείται), δεν προϋποθέτει γνώση λειτουργικού τύπουνόμος διανομής. Μπορεί να ταξινομηθεί ως μη παραμετρική μέθοδος.

Άλλες μη παραμετρικές μέθοδοι, που χρησιμοποιούνται όταν το σχήμα της καμπύλης πυκνότητας κατανομής είναι άγνωστο και δεν μπορούν να γίνουν καθόλου υποθέσεις για τη φύση της, καταλαμβάνουν ιδιαίτερη θέση. Αυτές περιλαμβάνουν τη γνωστή μέθοδο των πολυδιάστατων ιστογραμμάτων, τη μέθοδο «k-πλησιέστερων γειτόνων», τη μέθοδο της Ευκλείδειας απόστασης, τη μέθοδο των δυνητικών συναρτήσεων κ.λπ., μια γενίκευση των οποίων είναι η μέθοδος που ονομάζεται «Εκτιμήσεις Parzen». Αυτές οι μέθοδοι λειτουργούν επίσημα με αντικείμενα ως ενσωματωμένες δομές, αλλά ανάλογα με τον τύπο της εργασίας αναγνώρισης, μπορούν να δράσουν τόσο σε εντατική όσο και σε εκτατική μορφή.

Οι μη παραμετρικές μέθοδοι αναλύουν τον σχετικό αριθμό αντικειμένων που εμπίπτουν σε δεδομένους πολυδιάστατους όγκους και χρησιμοποιούν διάφορες συναρτήσεις της απόστασης μεταξύ των αντικειμένων στο σετ εκπαίδευσης και των αντικειμένων που αναγνωρίζονται. Για ποσοτικά χαρακτηριστικά, όταν ο αριθμός τους είναι πολύ μικρότερος από το μέγεθος του δείγματος, οι πράξεις με αντικείμενα παίζουν ενδιάμεσο ρόλο στην εκτίμηση της τοπικής πυκνότητας κατανομής πιθανοτήτων υπό όρους και τα αντικείμενα δεν φέρουν το σημασιολογικό φορτίο ανεξάρτητων μονάδων πληροφοριών. Ταυτόχρονα, όταν ο αριθμός των σημείων είναι ανάλογος ή περισσότερος αριθμόςτων υπό μελέτη αντικειμένων, και τα σημάδια είναι ποιοτικής ή διχοτομικής φύσης, τότε δεν μπορεί να γίνει λόγος για τοπικές εκτιμήσεις πυκνοτήτων κατανομής πιθανοτήτων. Στην περίπτωση αυτή, τα αντικείμενα στις καθορισμένες μη παραμετρικές μεθόδους θεωρούνται ως ανεξάρτητες μονάδες πληροφοριών (ολοκληρωτικά εμπειρικά γεγονότα) και αυτές οι μέθοδοι αποκτούν το νόημα της αξιολόγησης των ομοιοτήτων και των διαφορών των αντικειμένων που μελετώνται.

Έτσι, οι ίδιες τεχνολογικές πράξεις των μη παραμετρικών μεθόδων, ανάλογα με τις συνθήκες του προβλήματος, έχουν νόημα είτε για τοπικές εκτιμήσεις των πυκνοτήτων κατανομής πιθανότητας των τιμών χαρακτηριστικών είτε για εκτιμήσεις της ομοιότητας και της διαφοράς των αντικειμένων.

Στο πλαίσιο της εντατικής αναπαράστασης της γνώσης, εξετάζεται εδώ η πρώτη πλευρά των μη παραμετρικών μεθόδων, ως εκτιμήσεις των πυκνοτήτων κατανομής πιθανοτήτων. Πολλοί συγγραφείς σημειώνουν ότι στην πράξη, οι μη παραμετρικές μέθοδοι όπως οι εκτιμητές Parzen λειτουργούν καλά. Οι κύριες δυσκολίες στη χρήση αυτών των μεθόδων είναι η ανάγκη να θυμόμαστε ολόκληρο το δείγμα εκπαίδευσης για τον υπολογισμό των εκτιμήσεων των τοπικών πυκνοτήτων κατανομής πιθανοτήτων και η υψηλή ευαισθησία στη μη αντιπροσωπευτικότητα του δείγματος εκπαίδευσης.

Μέθοδοι που βασίζονται σε υποθέσεις σχετικά με την κατηγορία των συναρτήσεων απόφασης.Σε αυτή την ομάδα μεθόδων, η γενική μορφή της συνάρτησης απόφασης θεωρείται γνωστή και προσδιορίζεται η λειτουργική της ποιότητάς της. Με βάση αυτή τη συνάρτηση, αναζητείται η καλύτερη προσέγγιση της συνάρτησης απόφασης στην ακολουθία εκπαίδευσης. Οι πιο συνηθισμένες είναι αναπαραστάσεις συναρτήσεων απόφασης με τη μορφή γραμμικών και γενικευμένων μη γραμμικών πολυωνύμων. Η λειτουργική ποιότητα του κανόνα απόφασης συνδέεται συνήθως με σφάλμα ταξινόμησης.

Το κύριο πλεονέκτημα των μεθόδων που βασίζονται σε υποθέσεις σχετικά με την κατηγορία των συναρτήσεων απόφασης είναι η σαφήνεια της μαθηματικής διατύπωσης του προβλήματος αναγνώρισης ως πρόβλημα αναζήτησης ενός άκρου. Η λύση σε αυτό το πρόβλημα συχνά επιτυγχάνεται χρησιμοποιώντας κάποιους αλγόριθμους κλίσης. Η ποικιλία των μεθόδων σε αυτήν την ομάδα εξηγείται από το ευρύ φάσμα των συναρτήσεων ποιότητας των κανόνων απόφασης και των αλγορίθμων αναζήτησης ακραίου που χρησιμοποιούνται. Μια γενίκευση των υπό εξέταση αλγορίθμων, που περιλαμβάνουν, ειδικότερα, τον αλγόριθμο του Νεύτωνα, αλγόριθμους τύπου perceptron κ.λπ., είναι η μέθοδος της στοχαστικής προσέγγισης. Σε αντίθεση με τις μεθόδους παραμετρικής αναγνώρισης, η επιτυχία της χρήσης αυτής της ομάδας μεθόδων δεν εξαρτάται τόσο από την ασυμφωνία μεταξύ των θεωρητικών ιδεών σχετικά με τους νόμους της κατανομής των αντικειμένων στον χώρο χαρακτηριστικών και την εμπειρική πραγματικότητα. Όλες οι λειτουργίες υπόκεινται σε έναν κύριο στόχο - την εύρεση της ακραίας ποιότητας λειτουργικής του κανόνα απόφασης. Ταυτόχρονα, τα αποτελέσματα των παραμετρικών και των εξεταζόμενων μεθόδων μπορεί να είναι παρόμοια. Όπως φαίνεται παραπάνω, οι παραμετρικές μέθοδοι για την περίπτωση κανονικών κατανομών αντικειμένων σε διαφορετικές κλάσεις με ίσους πίνακες συνδιακύμανσης οδηγούν σε γραμμικές συναρτήσεις απόφασης. Σημειώστε επίσης ότι οι αλγόριθμοι για την επιλογή ενημερωτικών χαρακτηριστικών σε γραμμικά διαγνωστικά μοντέλα μπορούν να ερμηνευθούν ως ειδικές εκδόσεις αλγορίθμων διαβάθμισης για αναζήτηση ακραίων.

Οι δυνατότητες των αλγορίθμων αναζήτησης ακραίων βαθμίδων, ειδικά στην ομάδα κανόνων γραμμικής απόφασης, έχουν μελετηθεί αρκετά καλά. Η σύγκλιση αυτών των αλγορίθμων έχει αποδειχθεί μόνο για την περίπτωση που οι αναγνωρισμένες κατηγορίες αντικειμένων εμφανίζονται στο χώρο χαρακτηριστικών από συμπαγείς γεωμετρικές δομές. Ωστόσο, η επιθυμία να επιτευχθεί επαρκής ποιότητα του κανόνα απόφασης μπορεί συχνά να ικανοποιηθεί με τη βοήθεια αλγορίθμων που δεν έχουν αυστηρή μαθηματική απόδειξη της σύγκλισης της λύσης σε ένα παγκόσμιο άκρο.

Τέτοιοι αλγόριθμοι περιλαμβάνουν μια μεγάλη ομάδα ευρετικών διαδικασιών προγραμματισμού που αντιπροσωπεύουν την κατεύθυνση της εξελικτικής μοντελοποίησης. Η εξελικτική μοντελοποίηση είναι μια βιονική μέθοδος δανεισμένη από τη φύση. Βασίζεται στη χρήση γνωστών μηχανισμών εξέλιξης προκειμένου να αντικατασταθεί η διαδικασία ουσιαστικής μοντελοποίησης ενός σύνθετου αντικειμένου με φαινομενολογική μοντελοποίηση της εξέλιξής του.

Ένας πολύ γνωστός εκπρόσωπος της εξελικτικής μοντελοποίησης στην αναγνώριση προτύπων είναι η μέθοδος της ομαδικής λογιστικής των ορισμών (MGUA). Η βάση του GMDH είναι η αρχή της αυτοοργάνωσης και οι αλγόριθμοι GMDH αναπαράγουν το σχήμα της μαζικής επιλογής. Στους αλγόριθμους GMDH, τα μέλη ενός γενικευμένου πολυωνύμου συντίθενται και επιλέγονται με έναν ειδικό τρόπο, ο οποίος συχνά ονομάζεται πολυώνυμο Kolmogorov-Gabor. Αυτή η σύνθεση και επιλογή πραγματοποιείται με αυξανόμενη πολυπλοκότητα και είναι αδύνατο να προβλεφθεί εκ των προτέρων ποια τελική μορφή θα έχει το γενικευμένο πολυώνυμο. Πρώτον, συνήθως εξετάζονται απλοί κατά ζεύγη συνδυασμοί αρχικών χαρακτηριστικών, από τους οποίους συντάσσονται εξισώσεις συναρτήσεων απόφασης, συνήθως όχι υψηλότερες από δεύτερης τάξης. Κάθε εξίσωση αναλύεται ως ανεξάρτητη συνάρτηση απόφασης και οι τιμές των παραμέτρων των μεταγλωττισμένων εξισώσεων βρίσκονται με τον ένα ή τον άλλο τρόπο χρησιμοποιώντας το δείγμα εκπαίδευσης. Στη συνέχεια, από το σύνολο των συναρτήσεων απόφασης που προκύπτει, επιλέγονται μερικές από τις καλύτερες. Η ποιότητα των επιμέρους συναρτήσεων απόφασης ελέγχεται σε ένα δείγμα ελέγχου (επικύρωσης), το οποίο μερικές φορές ονομάζεται αρχή της εξωτερικής προσθήκης. Επιλεγμένες συναρτήσεις μερικής απόφασης θεωρούνται περαιτέρω ως ενδιάμεσες μεταβλητές που χρησιμεύουν ως αρχικά επιχειρήματα για μια παρόμοια σύνθεση νέων συναρτήσεων απόφασης κ.λπ. εκδηλώνεται με την υποβάθμιση αυτής της ποιότητας όταν προσπαθεί να αυξήσει περαιτέρω τη σειρά των πολυωνυμικών όρων σε σχέση με τα αρχικά χαρακτηριστικά.

Η αρχή της αυτοοργάνωσης που διέπει το GMDH ονομάζεται ευρετική αυτοοργάνωση, καθώς η όλη διαδικασία βασίζεται στην εισαγωγή εξωτερικών προσθηκών, επιλεγμένων ευρετικά. Το αποτέλεσμα μιας απόφασης μπορεί να εξαρτηθεί σημαντικά από αυτά τα ευρετικά. Το διαγνωστικό μοντέλο που προκύπτει εξαρτάται από τον τρόπο με τον οποίο τα αντικείμενα χωρίζονται σε δείγματα εκπαίδευσης και δοκιμής, πώς καθορίζεται το κριτήριο ποιότητας αναγνώρισης, πόσες μεταβλητές περνούν στην επόμενη σειρά επιλογής κ.λπ.

Τα υποδεικνυόμενα χαρακτηριστικά των αλγορίθμων GMDH είναι επίσης χαρακτηριστικά άλλων προσεγγίσεων της εξελικτικής μοντελοποίησης. Αλλά ας σημειώσουμε εδώ μια ακόμη πτυχή των μεθόδων που εξετάζουμε. Αυτή είναι η ουσιαστική τους ουσία. Χρησιμοποιώντας μεθόδους που βασίζονται σε υποθέσεις σχετικά με την κατηγορία των συναρτήσεων απόφασης (εξελικτικές και διαβαθμισμένες), είναι δυνατό να δημιουργηθούν διαγνωστικά μοντέλα υψηλής πολυπλοκότητας και να ληφθούν πρακτικά αποδεκτά αποτελέσματα. Ταυτόχρονα, η επίτευξη πρακτικών στόχων σε αυτή την περίπτωση δεν συνοδεύεται από την εξαγωγή νέας γνώσης για τη φύση των αναγνωρισμένων αντικειμένων. Η δυνατότητα εξαγωγής αυτής της γνώσης, ιδιαίτερα της γνώσης σχετικά με τους μηχανισμούς αλληλεπίδρασης των χαρακτηριστικών (χαρακτηριστικών), περιορίζεται εδώ θεμελιωδώς από τη δεδομένη δομή μιας τέτοιας αλληλεπίδρασης, που καθορίζεται στην επιλεγμένη μορφή συναρτήσεων απόφασης. Επομένως, το περισσότερο που μπορεί να ειπωθεί μετά την κατασκευή ενός συγκεκριμένου διαγνωστικού μοντέλου είναι η λίστα συνδυασμών χαρακτηριστικών και των ίδιων των χαρακτηριστικών που περιλαμβάνονται στο μοντέλο που προκύπτει. Όμως, η έννοια των συνδυασμών που αντικατοπτρίζουν τη φύση και τη δομή των κατανομών των υπό μελέτη αντικειμένων συχνά παραμένει άγνωστη στο πλαίσιο αυτής της προσέγγισης.

Μέθοδοι Boolean. Οι λογικές μέθοδοι αναγνώρισης προτύπων βασίζονται στη συσκευή της λογικής άλγεβρας και επιτρέπουν σε κάποιον να λειτουργεί με πληροφορίες που περιέχονται όχι μόνο σε μεμονωμένα χαρακτηριστικά, αλλά και σε συνδυασμούς τιμών χαρακτηριστικών. Σε αυτές τις μεθόδους, οι τιμές οποιουδήποτε χαρακτηριστικού θεωρούνται ως στοιχειώδη γεγονότα.

Στην πιο γενική μορφή, οι λογικές μέθοδοι μπορούν να χαρακτηριστούν ως ένας τύπος αναζήτησης μέσω ενός δείγματος εκπαίδευσης λογικών προτύπων και ο σχηματισμός ενός συγκεκριμένου συστήματος κανόνων λογικής απόφασης (για παράδειγμα, με τη μορφή συνδυασμών στοιχειωδών γεγονότων), καθένα από που έχει το δικό του βάρος. Ομάδα λογικές μεθόδουςείναι ποικίλη και περιλαμβάνει μεθόδους ποικίλης πολυπλοκότητας και βάθους ανάλυσης. Για διχοτομικά (Boolean) χαρακτηριστικά, είναι δημοφιλείς οι λεγόμενοι δεντροειδείς ταξινομητές, η μέθοδος δοκιμής αδιέξοδο, ο αλγόριθμος "Bark" και άλλοι. Περισσότερο πολύπλοκες μεθόδουςβασίζονται στην επισημοποίηση των επαγωγικών μεθόδων του D.S. Mill. Η τυποποίηση πραγματοποιείται με την κατασκευή μιας οιονεί αξιωματικής θεωρίας και βασίζεται σε πολυ-ταξινομημένη λογική πολλών τιμών με ποσοτικοποιητές σε πλειάδες μεταβλητού μήκους.

Ο αλγόριθμος "Kora", όπως και άλλες λογικές μέθοδοι αναγνώρισης προτύπων, είναι αρκετά απαιτητικός, καθώς απαιτείται πλήρης αναζήτηση κατά την επιλογή συνδέσμων. Επομένως, όταν χρησιμοποιούνται λογικές μέθοδοι, τίθενται υψηλές απαιτήσεις για την αποτελεσματική οργάνωση της υπολογιστικής διαδικασίας και αυτές οι μέθοδοι λειτουργούν καλά με σχετικά μικρές διαστάσεις του χώρου χαρακτηριστικών και μόνο σε ισχυρούς υπολογιστές.

Γλωσσικές (συντακτικές ή δομικές) μέθοδοι.Οι γλωσσικές μέθοδοι αναγνώρισης προτύπων βασίζονται στη χρήση ειδικών γραμματικών που δημιουργούν γλώσσες, με τη βοήθεια των οποίων μπορεί να περιγραφεί ένα σύνολο ιδιοτήτων αναγνωρισμένων αντικειμένων. Η γραμματική αναφέρεται στους κανόνες για την κατασκευή αντικειμένων από αυτά τα μη προερχόμενα στοιχεία.

Εάν η περιγραφή των εικόνων γίνεται με τη χρήση μη παράγωγων στοιχείων (υπομεγέθη) και των σχέσεών τους, τότε χρησιμοποιείται μια γλωσσική ή συντακτική προσέγγιση που χρησιμοποιεί την αρχή της γενικότητας των ιδιοτήτων για την κατασκευή συστημάτων αυτόματης αναγνώρισης. Μια εικόνα μπορεί να περιγραφεί χρησιμοποιώντας μια ιεραρχική δομή υποεικόνων, παρόμοια με συντακτική δομήΓλώσσα. Αυτή η περίσταση καθιστά δυνατή την εφαρμογή της θεωρίας των επίσημων γλωσσών κατά την επίλυση προβλημάτων αναγνώρισης εικόνων. Μια γραμματική εικόνας θεωρείται ότι περιέχει πεπερασμένα σύνολα στοιχείων που ονομάζονται μεταβλητές, μη παράγωγα στοιχεία και κανόνες αντικατάστασης. Η φύση των κανόνων αντικατάστασης καθορίζει τον τύπο της γραμματικής. Από τις πιο μελετημένες γραμματικές μπορούμε να σημειώσουμε κανονικές, χωρίς συμφραζόμενα και γραμματικές άμεσων συνιστωσών. Τα βασικά σημεία αυτής της προσέγγισης είναι η επιλογή των μη παράγωγων στοιχείων της εικόνας, ο συνδυασμός αυτών των στοιχείων και οι σχέσεις που τα συνδέουν με γραμματικές εικόνων και, τέλος, η υλοποίηση των διαδικασιών ανάλυσης και αναγνώρισης στην κατάλληλη γλώσσα. Αυτή η προσέγγιση είναι ιδιαίτερα χρήσιμη όταν εργάζεστε με εικόνες που είτε δεν μπορούν να περιγραφούν με αριθμητικές μετρήσεις είτε είναι τόσο πολύπλοκες που δεν μπορούν να εντοπιστούν τα τοπικά χαρακτηριστικά τους και πρέπει να στραφεί κανείς στις καθολικές ιδιότητες των αντικειμένων.

Για παράδειγμα, η Ε.Α. Butakov, V.I. Ostrovsky, I.L. Ο Fadeev προτείνει την ακόλουθη δομή συστήματος για την επεξεργασία εικόνας (Εικ. 3), χρησιμοποιώντας μια γλωσσική προσέγγιση, όπου καθένα από τα λειτουργικά μπλοκ είναι ένα σύμπλεγμα λογισμικού (μικροπρόγραμμα) (ενότητα) που υλοποιεί τις αντίστοιχες λειτουργίες.

Εικόνα 3. Μπλοκ διάγραμμα της συσκευής αναγνώρισης

Οι προσπάθειες εφαρμογής των μεθόδων της μαθηματικής γλωσσολογίας στο πρόβλημα της ανάλυσης εικόνας οδηγούν στην ανάγκη επίλυσης ορισμένων προβλημάτων που σχετίζονται με την χαρτογράφηση της δισδιάστατης δομής μιας εικόνας σε μονοδιάστατες αλυσίδες μιας επίσημης γλώσσας.

Επεκτατικές μέθοδοι

Στις μεθόδους αυτής της ομάδας, σε αντίθεση με την εντατική κατεύθυνση, σε κάθε αντικείμενο μελέτης δίνεται, σε μικρότερο ή μεγαλύτερο βαθμό, ανεξάρτητη διαγνωστική σημασία. Στον πυρήνα τους, αυτές οι μέθοδοι είναι κοντά στην κλινική προσέγγιση, η οποία θεωρεί τους ανθρώπους όχι ως μια αλυσίδα αντικειμένων που ταξινομούνται από τον έναν ή τον άλλον δείκτη, αλλά ως ολοκληρωμένα συστήματα, καθένα από τα οποία είναι ατομικό και έχει ιδιαίτερη διαγνωστική αξία. Αυτή η προσεκτική στάση απέναντι στα αντικείμενα της έρευνας δεν επιτρέπει τον αποκλεισμό ή την απώλεια πληροφοριών για κάθε μεμονωμένο αντικείμενο, κάτι που συμβαίνει όταν χρησιμοποιούνται μέθοδοι εντατικής κατεύθυνσης που χρησιμοποιούν αντικείμενα μόνο για τον εντοπισμό και την καταγραφή μοτίβων συμπεριφοράς των ιδιοτήτων τους.

Οι κύριες λειτουργίες στην αναγνώριση προτύπων χρησιμοποιώντας τις μεθόδους που συζητήθηκαν είναι οι πράξεις προσδιορισμού των ομοιοτήτων και των διαφορών των αντικειμένων. Τα αντικείμενα στην καθορισμένη ομάδα μεθόδων παίζουν το ρόλο των διαγνωστικών προηγούμενων. Επιπλέον, ανάλογα με τις συνθήκες μιας συγκεκριμένης εργασίας, ο ρόλος ενός μεμονωμένου προηγούμενου μπορεί να ποικίλλει εντός των ευρύτερων ορίων: από την κύρια και καθοριστική έως την πολύ έμμεση συμμετοχή στη διαδικασία αναγνώρισης. Με τη σειρά τους, οι συνθήκες του προβλήματος μπορεί να απαιτούν τη συμμετοχή του διάφορες ποσότητεςδιαγνωστικά προηγούμενα: από ένα σε κάθε αναγνωρισμένη τάξη έως το πλήρες μέγεθος του δείγματος, καθώς και διαφορετικοί τρόποι υπολογισμού μετρήσεων ομοιότητας και διαφοράς μεταξύ αντικειμένων. Αυτές οι απαιτήσεις εξηγούν την περαιτέρω διαίρεση των μεθόδων επέκτασης σε υποκατηγορίες:

    μέθοδος σύγκρισης με το πρωτότυπο·

    k-μέθοδος πλησιέστερων γειτόνων.

    συλλογικότητες των κανόνων απόφασης.

Μέθοδος σύγκρισης με το πρωτότυπο.Αυτή είναι η απλούστερη μέθοδος επέκτασης αναγνώρισης. Χρησιμοποιείται, για παράδειγμα, όταν οι αναγνωρισμένες κλάσεις εμφανίζονται στο χώρο χαρακτηριστικών με συμπαγείς γεωμετρικές ομαδοποιήσεις. Σε αυτήν την περίπτωση, συνήθως το κέντρο της γεωμετρικής ομαδοποίησης της κλάσης (ή το αντικείμενο που βρίσκεται πιο κοντά στο κέντρο) επιλέγεται ως πρωτότυπο σημείο.

Για την ταξινόμηση ενός άγνωστου αντικειμένου, βρίσκεται το πλησιέστερο πρωτότυπο σε αυτό και το αντικείμενο ανήκει στην ίδια κατηγορία με αυτό το πρωτότυπο. Προφανώς, δεν δημιουργούνται γενικευμένες εικόνες κλάσης σε αυτήν τη μέθοδο.

Διάφοροι τύποι αποστάσεων μπορούν να χρησιμοποιηθούν ως μέτρο εγγύτητας. Συχνά, για διχοτομικά χαρακτηριστικά, χρησιμοποιείται η απόσταση Hamming, η οποία σε αυτή την περίπτωση είναι ίση με το τετράγωνο της Ευκλείδειας απόστασης. Σε αυτή την περίπτωση, ο κανόνας απόφασης για την ταξινόμηση αντικειμένων είναι ισοδύναμος με μια γραμμική συνάρτηση απόφασης.

Αυτό το γεγονός πρέπει να σημειωθεί ιδιαίτερα. Καταδεικνύει ξεκάθαρα τη σύνδεση μεταξύ του πρωτοτύπου και της αναπαράστασης χαρακτηριστικών πληροφοριών σχετικά με τη δομή των δεδομένων. Χρησιμοποιώντας την παραπάνω αναπαράσταση, μπορεί κανείς, για παράδειγμα, να θεωρήσει οποιαδήποτε παραδοσιακή κλίμακα μέτρησης, η οποία είναι μια γραμμική συνάρτηση των τιμών των διχοτόμων χαρακτηριστικών, ως ένα υποθετικό διαγνωστικό πρωτότυπο. Με τη σειρά του, εάν μια ανάλυση της χωρικής δομής των αναγνωρισμένων τάξεων μας επιτρέπει να βγάλουμε ένα συμπέρασμα για τη γεωμετρική τους συμπαγή, τότε αρκεί να αντικαταστήσουμε καθεμία από αυτές τις κατηγορίες με ένα πρωτότυπο, το οποίο είναι στην πραγματικότητα ισοδύναμο με ένα γραμμικό διαγνωστικό μοντέλο.

Στην πράξη, βέβαια, η κατάσταση είναι συχνά διαφορετική από το εξιδανικευμένο παράδειγμα που περιγράφεται. Ένας ερευνητής που σκοπεύει να εφαρμόσει μια μέθοδο αναγνώρισης που βασίζεται στη σύγκριση με πρωτότυπα διαγνωστικά μαθήματα αντιμετωπίζει δύσκολα προβλήματα. Αυτή είναι, πρώτα απ 'όλα, η επιλογή του μέτρου εγγύτητας (μετρική), η οποία μπορεί να αλλάξει σημαντικά τη χωρική διαμόρφωση της κατανομής των αντικειμένων. Και δεύτερον, ανεξάρτητο πρόβλημαείναι η ανάλυση πολυδιάστατων δομών πειραματικών δεδομένων. Και τα δύο αυτά προβλήματα είναι ιδιαίτερα έντονα για τον ερευνητή σε συνθήκες υψηλής διάστασης του χώρου χαρακτηριστικών, χαρακτηριστικών πραγματικών προβλημάτων.

Η μέθοδος k-πλησιέστερων γειτόνων.Η μέθοδος k-πλησιέστερων γειτόνων για την επίλυση προβλημάτων διακριτικής ανάλυσης προτάθηκε για πρώτη φορά το 1952. Είναι ως εξής.

Όταν ταξινομεί κανείς ένα άγνωστο αντικείμενο, βρίσκει δεδομένου αριθμού(ια) γεωμετρικά πλησιέστερα σε αυτό στον χώρο χαρακτηριστικών άλλων αντικειμένων (πλησιέστεροι γείτονες) με ήδη γνωστή συμμετοχή σε αναγνωρίσιμες τάξεις. Η απόφαση να εκχωρηθεί ένα άγνωστο αντικείμενο σε μια συγκεκριμένη διαγνωστική τάξη λαμβάνεται με την ανάλυση πληροφοριών σχετικά με αυτήν τη γνωστή συσχέτιση των πλησιέστερων γειτόνων του, για παράδειγμα, χρησιμοποιώντας μια απλή καταμέτρηση ψήφων.

Αρχικά, η μέθοδος k-πλησιέστερων γειτόνων θεωρήθηκε ως μια μη παραμετρική μέθοδος για την εκτίμηση του λόγου πιθανότητας. Για αυτή τη μέθοδο, ελήφθησαν θεωρητικές εκτιμήσεις της αποτελεσματικότητάς της σε σύγκριση με τον βέλτιστο ταξινομητή Bayes. Έχει αποδειχθεί ότι οι πιθανότητες ασυμπτωτικού σφάλματος για τη μέθοδο k-πλησιέστερου γείτονα υπερβαίνουν τα σφάλματα του κανόνα Bayes όχι περισσότερο από δύο φορές.

Όπως σημειώθηκε παραπάνω, σε πραγματικά προβλήματα είναι συχνά απαραίτητο να λειτουργούμε με αντικείμενα που περιγράφονται από μεγάλο αριθμό ποιοτικών (διχοτομικών) χαρακτηριστικών. Στην περίπτωση αυτή, η διάσταση του χώρου χαρακτηριστικών είναι ανάλογη ή υπερβαίνει τον όγκο του υπό μελέτη δείγματος. Σε τέτοιες συνθήκες, είναι βολικό να ερμηνεύεται κάθε αντικείμενο του δείγματος εκπαίδευσης ως ξεχωριστός γραμμικός ταξινομητής. Στη συνέχεια, αυτή ή εκείνη η διαγνωστική τάξη αντιπροσωπεύεται όχι από ένα πρωτότυπο, αλλά από ένα σύνολο γραμμικών ταξινομητών. Η συνδυασμένη αλληλεπίδραση γραμμικών ταξινομητών οδηγεί τελικά σε μια τμηματικά γραμμική επιφάνεια που διαχωρίζει αναγνωρισμένες κατηγορίες στον χώρο χαρακτηριστικών. Ο τύπος της διαχωριστικής επιφάνειας, που αποτελείται από κομμάτια υπερεπιπέδων, μπορεί να ποικίλλει και εξαρτάται από τη σχετική θέση των ταξινομημένων αδρανών.

Μπορεί επίσης να χρησιμοποιηθεί μια άλλη ερμηνεία των μηχανισμών ταξινόμησης χρησιμοποιώντας τον κανόνα k-πλησιέστερων γειτόνων. Βασίζεται στην ιδέα της ύπαρξης κάποιων λανθάνοντων μεταβλητών, αφηρημένων ή σχετικών με κάποιο μετασχηματισμό στον αρχικό χώρο χαρακτηριστικών. Εάν στο χώρο των λανθάνουσας μεταβλητής οι αποστάσεις ανά ζεύγη μεταξύ των αντικειμένων είναι ίδιες με αυτές του χώρου των αρχικών χαρακτηριστικών και ο αριθμός αυτών των μεταβλητών είναι σημαντικά μικρότερος από τον αριθμό των αντικειμένων, τότε η ερμηνεία της μεθόδου k-πλησιέστερων γειτόνων μπορεί να ληφθούν υπόψη από τη σκοπιά της σύγκρισης μη παραμετρικών εκτιμήσεων των πυκνοτήτων κατανομής πιθανοτήτων υπό όρους. Η άποψη των λανθάνοντων μεταβλητών που παρουσιάζονται εδώ είναι κοντά στη φύση της άποψης της πραγματικής διαστάσεων και άλλων όψεων που χρησιμοποιούνται σε διάφορες τεχνικές μείωσης διαστάσεων.

Όταν χρησιμοποιείται η μέθοδος k-πλησιέστερων γειτόνων για την αναγνώριση προτύπων, ο ερευνητής πρέπει να αποφασίσει σύνθετο πρόβλημαεπιλέγοντας μια μέτρηση για τον προσδιορισμό της εγγύτητας των διαγνωσμένων αντικειμένων. Αυτό το πρόβλημα σε συνθήκες υψηλής διάστασης του χώρου χαρακτηριστικών είναι εξαιρετικά επιδεινωμένο λόγω της επαρκούς πολυπλοκότητας αυτής της μεθόδου, η οποία γίνεται σημαντική ακόμη και για υπολογιστές υψηλής απόδοσης. Επομένως, εδώ, όπως και στη μέθοδο σύγκρισης με ένα πρωτότυπο, είναι απαραίτητο να λυθεί το δημιουργικό πρόβλημα της ανάλυσης της πολυδιάστατης δομής των πειραματικών δεδομένων για να ελαχιστοποιηθεί ο αριθμός των αντικειμένων που αντιπροσωπεύουν διαγνωστικές κατηγορίες.

Αλγόριθμοι υπολογισμού βαθμολογιών (ψηφοφορία).Η αρχή λειτουργίας των αλγορίθμων υπολογισμού αξιολόγησης (ABO) είναι ο υπολογισμός της προτεραιότητας (βαθμοί ομοιότητας) που χαρακτηρίζει την «εγγύτητα» των αναγνωρισμένων και αντικειμένων αναφοράς σύμφωνα με ένα σύστημα συνόλων χαρακτηριστικών, το οποίο είναι ένα σύστημα υποσυνόλων ενός δεδομένου συνόλου χαρακτηριστικών .

Σε αντίθεση με όλες τις μεθόδους που συζητήθηκαν προηγουμένως, οι αλγόριθμοι για τον υπολογισμό των εκτιμήσεων λειτουργούν με περιγραφές αντικειμένων με έναν ριζικά νέο τρόπο. Για αυτούς τους αλγόριθμους, τα αντικείμενα υπάρχουν ταυτόχρονα σε πολύ διαφορετικούς υποχώρους του χώρου χαρακτηριστικών. Η κλάση ABO οδηγεί την ιδέα της χρήσης χαρακτηριστικών στο λογικό της συμπέρασμα: αφού δεν είναι πάντα γνωστό ποιοι συνδυασμοί χαρακτηριστικών είναι οι πιο ενημερωτικοί, τότε στο ABO ο βαθμός ομοιότητας των αντικειμένων υπολογίζεται συγκρίνοντας όλους τους πιθανούς ή συγκεκριμένους συνδυασμούς χαρακτηριστικά που περιλαμβάνονται στις περιγραφές των αντικειμένων.

Συλλογικότητες κανόνων απόφασης.Ο κανόνας απόφασης χρησιμοποιεί ένα σχήμα αναγνώρισης δύο επιπέδων. Στο πρώτο επίπεδο λειτουργούν αλγόριθμοι ιδιωτικής αναγνώρισης, τα αποτελέσματα των οποίων συνδυάζονται στο δεύτερο επίπεδο στο μπλοκ σύνθεσης. Οι πιο συνηθισμένες μέθοδοι τέτοιας ενοποίησης βασίζονται στον εντοπισμό περιοχών αρμοδιότητας ενός συγκεκριμένου αλγορίθμου. Ο πιο απλός τρόποςΗ εύρεση τομέων ικανότητας συνίσταται σε εκ των προτέρων κατανομή του χώρου των χαρακτηριστικών που βασίζεται σε επαγγελματικές εκτιμήσεις μιας συγκεκριμένης επιστήμης (για παράδειγμα, διαστρωμάτωση του δείγματος σύμφωνα με ένα συγκεκριμένο χαρακτηριστικό). Στη συνέχεια, για κάθε μια από τις επιλεγμένες περιοχές, κατασκευάζεται ο δικός της αλγόριθμος αναγνώρισης. Μια άλλη μέθοδος βασίζεται στη χρήση επίσημης ανάλυσης για τον προσδιορισμό τοπικών περιοχών του χώρου χαρακτηριστικών ως γειτονιών αναγνωρισμένων αντικειμένων για τα οποία έχει αποδειχθεί η επιτυχία οποιουδήποτε συγκεκριμένου αλγορίθμου αναγνώρισης.

Πλέον γενική προσέγγισηγια την κατασκευή ενός μπλοκ σύνθεσης, θεωρεί τους προκύπτοντες δείκτες συγκεκριμένων αλγορίθμων ως αρχικά χαρακτηριστικά για την κατασκευή ενός νέου γενικευμένου κανόνα απόφασης. Σε αυτή την περίπτωση, μπορούν να χρησιμοποιηθούν όλες οι παραπάνω μέθοδοι εντατικών και εκτατικών κατευθύνσεων στην αναγνώριση προτύπων. Αποτελεσματικοί για την επίλυση του προβλήματος της δημιουργίας ενός συνόλου κανόνων απόφασης είναι λογικοί αλγόριθμοι του τύπου "Kora" και αλγόριθμοι υπολογισμού εκτιμήσεων (ABO), οι οποίοι αποτελούν τη βάση της λεγόμενης αλγεβρικής προσέγγισης, η οποία παρέχει τη μελέτη και εποικοδομητική περιγραφή του αλγόριθμοι αναγνώρισης, στο πλαίσιο των οποίων εντάσσονται όλοι οι υπάρχοντες τύποι αλγορίθμων.

Μέθοδοι νευρωνικών δικτύων

Οι μέθοδοι νευρωνικών δικτύων είναι μέθοδοι που βασίζονται στη χρήση διαφόρων τύπων νευρωνικών δικτύων (ΝΝ). Οι κύριοι τομείς εφαρμογής των διαφόρων νευρωνικών δικτύων για την αναγνώριση προτύπων και εικόνων:

    εφαρμογή για την εξαγωγή βασικών χαρακτηριστικών ή χαρακτηριστικών δεδομένων εικόνων,

    ταξινόμηση των ίδιων των εικόνων ή των χαρακτηριστικών που έχουν ήδη εξαχθεί από αυτές (στην πρώτη περίπτωση, η εξαγωγή βασικών χαρακτηριστικών γίνεται σιωπηρά εντός του δικτύου),

    επίλυση προβλημάτων βελτιστοποίησης.

Πολυστρωματικά νευρωνικά δίκτυα.Η αρχιτεκτονική ενός πολυστρωματικού νευρωνικού δικτύου (MNN) αποτελείται από διαδοχικά συνδεδεμένα στρώματα, όπου ο νευρώνας κάθε στρώματος συνδέεται με τις εισόδους του σε όλους τους νευρώνες του προηγούμενου στρώματος και τις εξόδους του επόμενου.

Η απλούστερη εφαρμογή ενός νευρωνικού δικτύου μονής στρώσης (που ονομάζεται αυτόματη συσχετιστική μνήμη) είναι να εκπαιδεύσει το δίκτυο να ανακατασκευάσει τις τροφοδοτούμενες εικόνες. Τροφοδοτώντας μια δοκιμαστική εικόνα ως είσοδο και υπολογίζοντας την ποιότητα της ανακατασκευασμένης εικόνας, μπορείτε να αξιολογήσετε πόσο καλά το δίκτυο αναγνώρισε την εικόνα εισόδου. Οι θετικές ιδιότητες αυτής της μεθόδου είναι ότι το δίκτυο μπορεί να επαναφέρει παραμορφωμένες και θορυβώδεις εικόνες, αλλά δεν είναι κατάλληλη για πιο σοβαρούς σκοπούς.

Το MNN χρησιμοποιείται επίσης για άμεση ταξινόμηση εικόνων - είτε η ίδια η εικόνα σε κάποια μορφή είτε ένα σύνολο βασικών χαρακτηριστικών της εικόνας που είχαν εξαχθεί προηγουμένως παρέχεται ως είσοδος· στην έξοδο, ο νευρώνας με τη μέγιστη δραστηριότητα υποδεικνύει συμμετοχή στην αναγνωρισμένη κλάση (Εικ. 4). Εάν αυτή η δραστηριότητα είναι κάτω από ένα συγκεκριμένο όριο, τότε θεωρείται ότι η εικόνα που υποβάλλεται δεν ανήκει σε καμία από τις γνωστές κλάσεις. Η διαδικασία εκμάθησης καθορίζει την αντιστοιχία των εικόνων που παρέχονται στην είσοδο με το να ανήκουν σε μια συγκεκριμένη τάξη. Αυτό ονομάζεται εποπτευόμενη μάθηση. Αυτή η προσέγγιση είναι καλή για εργασίες ελέγχου πρόσβασης μικρή ομάδαπρόσωπα Αυτή η προσέγγιση διασφαλίζει ότι το δίκτυο συγκρίνει απευθείας τις ίδιες τις εικόνες, αλλά με την αύξηση του αριθμού των κλάσεων, ο χρόνος εκπαίδευσης και λειτουργίας του δικτύου αυξάνεται εκθετικά. Επομένως, για εργασίες όπως η αναζήτηση παρόμοιο άτομοσε μια μεγάλη βάση δεδομένων, απαιτεί την εξαγωγή ενός συμπαγούς συνόλου βασικών χαρακτηριστικών για την αναζήτηση.

Ταξινόμηση προσέγγιση χρησιμοποιώντας χαρακτηριστικά συχνότηταςολόκληρη η εικόνα, που περιγράφεται στο . Χρησιμοποιήθηκε ένα νευρωνικό δίκτυο μονού επιπέδου που βασίζεται σε νευρώνες πολλαπλών τιμών.

Η εφαρμογή ενός νευρωνικού δικτύου για ταξινόμηση εικόνων εμφανίζεται όταν η είσοδος του δικτύου λαμβάνει τα αποτελέσματα της αποσύνθεσης της εικόνας χρησιμοποιώντας τη μέθοδο του κύριου στοιχείου.

Στο κλασικό MNN, οι διαστρωματικές νευρικές συνδέσεις είναι πλήρως συνδεδεμένες και η εικόνα αναπαρίσταται ως μονοδιάστατο διάνυσμα, αν και είναι δισδιάστατο. Η αρχιτεκτονική συνελικτικού νευρωνικού δικτύου στοχεύει να ξεπεράσει αυτές τις ελλείψεις. Χρησιμοποιούσε τοπικά πεδία υποδοχέα (παρέχουν τοπική δισδιάστατη συνδεσιμότητα νευρώνων), κοινά βάρη (παρέχουν ανίχνευση ορισμένων χαρακτηριστικών οπουδήποτε στην εικόνα) και ιεραρχική οργάνωση με χωρική υποδειγματοληψία. Το συνελικτικό νευρωνικό δίκτυο (CNN) παρέχει μερική αντίσταση σε αλλαγές κλίμακας, μετατοπίσεις, περιστροφές και παραμορφώσεις.

Τα MNN χρησιμοποιούνται επίσης για την ανίχνευση αντικειμένων συγκεκριμένου τύπου. Εκτός από το γεγονός ότι κάθε εκπαιδευμένο MNN μπορεί, σε κάποιο βαθμό, να προσδιορίσει εάν οι εικόνες ανήκουν στις κατηγορίες «τους», μπορεί να εκπαιδευτεί ειδικά για να ανιχνεύει αξιόπιστα ορισμένες κατηγορίες. Σε αυτήν την περίπτωση, οι κλάσεις εξόδου θα είναι κλάσεις που ανήκουν και δεν ανήκουν στον συγκεκριμένο τύπο εικόνας. Ένας ανιχνευτής νευρωνικού δικτύου χρησιμοποιήθηκε για την ανίχνευση μιας εικόνας προσώπου στην εικόνα εισόδου. Η εικόνα σαρώθηκε με ένα παράθυρο 20x20 pixel, το οποίο τροφοδοτήθηκε στην είσοδο του δικτύου, το οποίο αποφασίζει εάν μια δεδομένη περιοχή ανήκει στην κατηγορία προσώπων. Η εκπαίδευση πραγματοποιήθηκε χρησιμοποιώντας τόσο θετικά παραδείγματα (διάφορες εικόνες προσώπων) όσο και αρνητικά παραδείγματα (εικόνες που δεν είναι πρόσωπα). Για να αυξηθεί η αξιοπιστία της ανίχνευσης, χρησιμοποιήθηκε μια ομάδα νευρωνικών δικτύων, εκπαιδευμένων με διαφορετικά αρχικά βάρη, με αποτέλεσμα τα νευρωνικά δίκτυα να κάνουν σφάλματα με διαφορετικούς τρόπους και η τελική απόφαση να λαμβάνεται με ψηφοφορία ολόκληρης της ομάδας.

Εικόνα 5. Κύρια στοιχεία (ιδιοπρόσωπα) και αποσύνθεση εικόνας σε κύρια συστατικά

Ένα νευρωνικό δίκτυο χρησιμοποιείται επίσης για την εξαγωγή βασικών χαρακτηριστικών εικόνας, τα οποία στη συνέχεια χρησιμοποιούνται για μεταγενέστερη ταξινόμηση. Στο , παρουσιάζεται μια μέθοδος υλοποίησης νευρωνικού δικτύου της μεθόδου ανάλυσης του κύριου στοιχείου. Η ουσία της μεθόδου ανάλυσης του κύριου συστατικού είναι να ληφθούν όσο το δυνατόν πιο διακοσμημένοι συντελεστές που χαρακτηρίζουν τις εικόνες εισόδου. Αυτοί οι συντελεστές ονομάζονται κύρια συστατικά και χρησιμοποιούνται για στατιστική συμπίεση εικόνας, στην οποία χρησιμοποιείται ένας μικρός αριθμός συντελεστών για την αναπαράσταση ολόκληρης της εικόνας. Ένα νευρωνικό δίκτυο με ένα κρυφό στρώμα που περιέχει Ν νευρώνες (ο οποίος είναι πολύ μικρότερος από τη διάσταση της εικόνας), που εκπαιδεύεται χρησιμοποιώντας τη μέθοδο backpropagation για να επαναφέρει την εικόνα εξόδου που τροφοδοτείται στην είσοδο, δημιουργεί τους συντελεστές των πρώτων Ν βασικών στοιχείων στην έξοδο των κρυμμένων νευρώνων, που χρησιμοποιούνται για σύγκριση. Συνήθως, χρησιμοποιούνται από 10 έως 200 κύρια εξαρτήματα. Καθώς ο αριθμός ενός συστατικού αυξάνεται, η αντιπροσωπευτικότητά του μειώνεται πολύ και δεν έχει νόημα να χρησιμοποιούνται στοιχεία με μεγαλύτερους αριθμούς. Όταν χρησιμοποιούνται μη γραμμικές συναρτήσεις ενεργοποίησης νευρικών στοιχείων, είναι δυνατή η μη γραμμική αποσύνθεση σε κύρια συστατικά. Η μη γραμμικότητα επιτρέπει να αντικατοπτρίζονται με μεγαλύτερη ακρίβεια οι παραλλαγές στα δεδομένα εισόδου. Εφαρμόζοντας την ανάλυση των κύριων συνιστωσών στην αποσύνθεση των εικόνων προσώπων, λαμβάνουμε τα κύρια στοιχεία που ονομάζονται ιδιοπρόσωπα, τα οποία επίσης χαρακτηρίζονται από χρήσιμη ιδιότητα– υπάρχουν στοιχεία που αντικατοπτρίζουν κυρίως ουσιώδη χαρακτηριστικά ενός ατόμου όπως το φύλο, η φυλή, τα συναισθήματα. Όταν αποκατασταθούν, τα εξαρτήματα έχουν όψη σαν πρόσωπο, με τα πρώτα να αντικατοπτρίζουν περισσότερο γενικό σχήμαπρόσωπα, το τελευταίο – διάφορες μικρές διαφορές μεταξύ προσώπων (Εικ. 5). Αυτή η μέθοδος είναι κατάλληλη για αναζήτηση παρόμοιες εικόνεςάτομα σε μεγάλες βάσεις δεδομένων. Παρουσιάζεται επίσης η δυνατότητα περαιτέρω μείωσης της διάστασης των κύριων εξαρτημάτων χρησιμοποιώντας NN. Αξιολογώντας την ποιότητα της ανακατασκευής της εικόνας εισόδου, μπορείτε να προσδιορίσετε με μεγάλη ακρίβεια τη συμμετοχή της στην κατηγορία προσώπων.

Νευρωνικά δίκτυα υψηλής τάξης.Τα νευρωνικά δίκτυα υψηλής τάξης (HANN) διαφέρουν από τα MNN στο ότι έχουν μόνο ένα στρώμα, αλλά οι είσοδοι νευρώνων λαμβάνουν επίσης όρους υψηλής τάξης, οι οποίοι είναι το γινόμενο δύο ή περισσότερων συστατικών του διανύσματος εισόδου. Τέτοια δίκτυα μπορούν επίσης να σχηματίσουν πολύπλοκες διαχωριστικές επιφάνειες.

Νευρωνικά δίκτυα Hopfield.Το Hopfield NN (HNS) είναι μονοστρωματικό και πλήρως συνδεδεμένο (δεν υπάρχουν συνδέσεις μεταξύ των νευρώνων στον εαυτό τους), οι έξοδοι του συνδέονται με τις εισόδους. Σε αντίθεση με το MNS, το NSC είναι χαλάρωση - δηλ. όταν έχει οριστεί στην αρχική κατάσταση, λειτουργεί μέχρι να φτάσει σε μια σταθερή κατάσταση, που θα είναι η τιμή εξόδου του. Για την αναζήτηση ενός συνολικού ελάχιστου σε σχέση με προβλήματα βελτιστοποίησης, χρησιμοποιούνται στοχαστικές τροποποιήσεις του NSC.

Η χρήση του NSH ως συσχετιστικής μνήμης σάς επιτρέπει να επαναφέρετε με ακρίβεια τις εικόνες για τις οποίες έχει εκπαιδευτεί το δίκτυο όταν τροφοδοτείται μια παραμορφωμένη εικόνα στην είσοδο. Σε αυτήν την περίπτωση, το δίκτυο θα «θυμάται» την πλησιέστερη (με την έννοια της τοπικής ελάχιστης ενέργειας) εικόνα, και έτσι θα την αναγνωρίσει. Αυτή η λειτουργία μπορεί επίσης να αναπαρασταθεί ως η διαδοχική εφαρμογή της αυτόματης συσχέτισης μνήμης που περιγράφεται παραπάνω. Σε αντίθεση με την αυτόματη συσχέτιση μνήμης, το NSC θα επαναφέρει ιδανικά την εικόνα με ακρίβεια. Για να αποφύγετε τα ελάχιστα παρεμβολές και να αυξήσετε τη χωρητικότητα του δικτύου, χρησιμοποιήστε διάφορες μεθόδους.

Αυτοοργάνωση νευρωνικών δικτύων Kohonen.Τα αυτοοργανωμένα νευρωνικά δίκτυα Kohonen (KONN) παρέχουν τοπολογική διάταξη του χώρου της εικόνας εισόδου. Επιτρέπουν μια τοπολογικά συνεχή αντιστοίχιση ενός n-διάστατου χώρου εισόδου σε ένα m-διάστατο χώρο εξόδου, m<

Cognitron.Η αρχιτεκτονική του Cognitron είναι παρόμοια με τη δομή του οπτικού φλοιού· έχει μια ιεραρχική πολυστρωματική οργάνωση στην οποία οι νευρώνες μεταξύ των στρωμάτων συνδέονται μόνο τοπικά. Μάθηση με ανταγωνιστική μάθηση (χωρίς δάσκαλο). Κάθε στρώμα του εγκεφάλου εφαρμόζει διαφορετικά επίπεδα γενίκευσης. το επίπεδο εισόδου είναι ευαίσθητο σε απλά μοτίβα, όπως γραμμές, και τον προσανατολισμό τους σε ορισμένες περιοχές του οπτικού τομέα, ενώ η απόκριση άλλων επιπέδων είναι πιο περίπλοκη, αφηρημένη και ανεξάρτητη από τη θέση του μοτίβου. Παρόμοιες λειτουργίες υλοποιούνται στο cognitron διαμορφώνοντας την οργάνωση του οπτικού φλοιού.

Το Neocognitron είναι μια περαιτέρω ανάπτυξη της ιδέας του cognitron και αντικατοπτρίζει με μεγαλύτερη ακρίβεια τη δομή του οπτικού συστήματος, σας επιτρέπει να αναγνωρίζετε εικόνες ανεξάρτητα από τους μετασχηματισμούς, τις περιστροφές, τις παραμορφώσεις και τις αλλαγές στην κλίμακα τους.

Το Cognitron είναι ένα ισχυρό εργαλείο αναγνώρισης εικόνων, αλλά απαιτεί υψηλό υπολογιστικό κόστος, το οποίο είναι επί του παρόντος ανέφικτο.

Οι θεωρούμενες μέθοδοι νευρωνικών δικτύων παρέχουν γρήγορη και αξιόπιστη αναγνώριση εικόνων, αλλά όταν χρησιμοποιούνται αυτές οι μέθοδοι, προκύπτουν προβλήματα στην αναγνώριση τρισδιάστατων αντικειμένων. Ωστόσο, αυτή η προσέγγιση έχει πολλά πλεονεκτήματα.

      συμπέρασμα

Επί του παρόντος, υπάρχει αρκετά μεγάλος αριθμός συστημάτων αυτόματης αναγνώρισης προτύπων για διάφορες εφαρμοζόμενες εργασίες.

Η αναγνώριση προτύπων με επίσημες μεθόδους ως θεμελιώδης επιστημονική κατεύθυνση είναι ανεξάντλητη.

Οι μαθηματικές μέθοδοι επεξεργασίας εικόνας έχουν μεγάλη ποικιλία εφαρμογών: επιστήμη, τεχνολογία, ιατρική, κοινωνική σφαίρα. Στο μέλλον, ο ρόλος της αναγνώρισης προτύπων στην ανθρώπινη ζωή θα αυξηθεί ακόμη περισσότερο.

Οι μέθοδοι νευρωνικών δικτύων παρέχουν γρήγορη και αξιόπιστη αναγνώριση εικόνων. Αυτή η προσέγγιση έχει πολλά πλεονεκτήματα και είναι ένα από τα πιο ελπιδοφόρα.

Βιβλιογραφία

    D.V. Brilyuk, V.V. Σταροβοΐτοφ. Μέθοδοι νευρωνικών δικτύων για την αναγνώριση εικόνων // /

    Kuzin L.T. Βασικές αρχές της κυβερνητικής: Βασικές αρχές κυβερνητικών μοντέλων. Τ.2. - Μ.: Ενέργεια, 1979. - 584 σελ.

    Peregudov F.I., Tarasenko F.P. Εισαγωγή στην ανάλυση συστημάτων: Σχολικό βιβλίο. – Μ.: Ανώτατο Σχολείο, 1997. - 389 σελ.

    Temnikov F.E., Afonin V.A., Dmitriev V.I. Θεωρητικά θεμέλια της πληροφορικής. - Μ.: Ενέργεια, 1979. - 511 σελ.

    Tu J., Gonzalez R. Αρχές αναγνώρισης προτύπων. /Μετ. από τα Αγγλικά - Μ.: Μιρ, 1978. - 410 σελ.

    Winston P. Τεχνητή νοημοσύνη. /Μετ. από τα Αγγλικά - Μ.: Μιρ, 1980. - 520 σελ.

    Fu K. Δομικές μέθοδοι στην αναγνώριση προτύπων: Μετάφραση από τα αγγλικά. - Μ.: Μιρ, 1977. - 320 σελ.

    Tsypkin Ya.Z. Βασικές αρχές της θεωρίας της πληροφορίας της ταυτοποίησης. - Μ.: Nauka, 1984. - 520 σελ.

    Ποσπελόφ Γ.Σ. Η τεχνητή νοημοσύνη είναι η βάση της νέας τεχνολογίας πληροφοριών. - Μ.: Nauka, 1988. - 280 σελ.

    Yu. Lifshits, Στατιστικές μέθοδοι αναγνώρισης προτύπων ///modern/07modernnote.pdf

    Bohr N. Ατομική φυσική και ανθρώπινη γνώση. /Μετάφραση από τα αγγλικά - Μ.: Μιρ, 1961. - 151 σελ.

    Butakov E.A., Ostrovsky V.I., Fadeev I.L. Επεξεργασία εικόνας σε υπολογιστή.1987.-236σ.

    Duda R., Hart P. Αναγνώριση προτύπων και ανάλυση σκηνής. /Μετάφραση από τα αγγλικά - Μ.: Μιρ, 1978. - 510 σελ.

    Duke V.A. Ψυχοδιαγνωστική Η/Υ. - Αγία Πετρούπολη: Brotherhood, 1994. - 365 p.

    Aizenberg I. N., Aizenberg N. N. και Krivosheev G. A. Multi-valued and Universal Binary Neurons: Learning Algorithms, Applications to Image Processing and Recognition. Σημειώσεις Διαλέξεων στην Τεχνητή Νοημοσύνη – Μηχανική Μάθηση και Εξόρυξη Δεδομένων στην Αναγνώριση Προτύπων, 1999, σελ. 21-35.

    Ranganath S. and Arun K. Αναγνώριση προσώπου με χρήση χαρακτηριστικών μετασχηματισμού και νευρωνικών δικτύων. Pattern Recognition 1997, Vol. 30, σελ. 1615-1622.

    Golovko V.A. Νευρονοημοσύνη: Θεωρία και εφαρμογές. Βιβλίο 1. Οργάνωση και εκπαίδευση νευρωνικών δικτύων με άμεσες και ανατροφοδοτούμενες συνδέσεις - Brest: BPI, 1999, - 260 pp.

    Vetter T. και Poggio T. Γραμμικές τάξεις αντικειμένων και σύνθεση εικόνας από μια ενιαία εικόνα παραδείγματος. IEEE Transactions on Pattern Analysis and Machine Intelligence 1997, Vol. 19, σσ. 733-742.

    Golovko V.A. Νευρονοημοσύνη: Θεωρία και εφαρμογές. Βιβλίο 2. Αυτο-οργάνωση, ανοχή σφαλμάτων και εφαρμογή νευρωνικών δικτύων - Brest: BPI, 1999, - 228 p.

    Lawrence S., Giles C. L., Tsoi A. C. and Back A. D. Face Recognition: A Convolutional Neural Network Approach. IEEE Transactions on Neural Networks, Special Issue on Neural Networks and Pattern Recognition, pp. 1-24.

    Wasserman F. Τεχνολογία νευροϋπολογιστών: Θεωρία και πρακτική, 1992 – 184 σελ.

    Rowley, H. A., Baluja, S. and Kanade, T. Ανίχνευση προσώπου με βάση το νευρωνικό δίκτυο. IEEE Transactions on Pattern Analysis and Machine Intelligence 1998, Vol. 20, σελ. 23-37.

    Valentin D., Abdi H., O"Toole A. J. and Cottrell G. W. Connectionist models of face processing: a research. IN: Pattern Recognition 1994, Vol. 27, σελ. 1209-1230.

    Εγγραφο

    Συνθέτουν αλγόριθμους αναγνώρισηεικόνες. ΜέθοδοιαναγνώρισηεικόνεςΌπως σημειώθηκε παραπάνω... η πραγματικότητα δεν είναι υπάρχει«οικοσυστήματα γενικά», και υπάρχειμόνο μεμονωμένα... συμπεράσματα από αυτό αναλυτικά ανασκόπησημεθόδουςαναγνώρισηπαρουσιάσαμε στο...

  1. Ανασκόπηση μεθόδων αναγνώρισης ατόμων βάσει εικόνων προσώπων, λαμβάνοντας υπόψη τα χαρακτηριστικά της οπτικής αναγνώρισης

    Ανασκόπηση

    ... αναγνώρισηαπό άτομο με αντικείμενα χαμηλής αντίθεσης, συμπ. πρόσωπα Δεδομένος ανασκόπησηκοινός μεθόδους ... Υπάρχειολόκληρη γραμμή μεθόδους ... τρόπος, ως αποτέλεσμα της έρευνας, μια πλατφόρμα για την ανάπτυξη μέθοδοςαναγνώριση ...

  2. Με το όνομα Glazkova Valentina Vladimirovna ΕΡΕΥΝΑ ΚΑΙ ΑΝΑΠΤΥΞΗ ΜΕΘΟΔΩΝ ΚΑΤΑΣΚΕΥΗΣ ΕΡΓΑΛΕΙΩΝ ΛΟΓΙΣΜΙΚΟΥ ΓΙΑ ΤΑΞΙΝΟΜΗΣΗ ΠΟΛΥΘΕΜΑΤΩΝ ΥΠΕΡΚΕΙΜΕΝΩΝ ΕΓΓΡΑΦΩΝ Ειδικότητα 05

    Περίληψη της διατριβής

    Έγγραφα υπερκειμένου. Το κεφάλαιο παρέχει ανασκόπησηυπάρχονμεθόδουςλύσεις στο υπό εξέταση πρόβλημα, περιγραφή... με αποκοπή των λιγότερο σχετικών τάξεων // Μαθηματικά μεθόδουςαναγνώρισηεικόνες: 13ο Πανρωσικό Συνέδριο. Περιφέρεια Λένινγκραντ...

  3. Διαφάνεια 0 Ανασκόπηση εργασιών βιοπληροφορικής που σχετίζονται με την ανάλυση και την επεξεργασία γενετικών κειμένων

    Διάλεξη

    Αλληλουχίες DNA και πρωτεϊνών. Ανασκόπησηοι εργασίες βιοπληροφορικής ως εργασίες... σήματα απαιτούν τη χρήση σύγχρονων μεθόδουςαναγνώρισηεικόνες, στατιστικές προσεγγίσεις και... με χαμηλή γονιδιακή πυκνότητα. ΥπάρχονΤα προγράμματα πρόβλεψης γονιδίων δεν είναι...

Σελίδα 2


Κατά την εκμάθηση της αναγνώρισης μοτίβων, μερικές t εικόνες και το ότι ανήκουν στην εικόνα είναι γνωστές. Το πρόβλημα της αναγνώρισης προτύπων είναι η κατασκευή ενός αλγόριθμου χρησιμοποιώντας μια ακολουθία εκπαίδευσης που καθορίζει την τιμή του y για οποιοδήποτε σύνολο από το πεδίο ορισμού της συνάρτησης.

Το σύστημα αναγνώρισης, με βάση τα δεδομένα της διαδικασίας και τις εξωτερικές επιρροές σε αυτή τη διαδικασία, αξιολογεί την κατάσταση παραγωγής και εκδίδει εντολές για τον έλεγχο της διαδικασίας. Στενά συνδεδεμένο με το πρόβλημα της αναγνώρισης προτύπων είναι το πρόβλημα της δημιουργίας μαθησιακών αυτομάτων που θα πρέπει να είναι σε θέση να αξιολογούν την τρέχουσα κατάσταση και, με βάση αυτό, να λαμβάνουν την καλύτερη απόφαση. Επομένως, οι περισσότερες από τις εργασίες για τα αυτόματα προπονητικά μπορούν να περιοριστούν σε εργασίες αναγνώρισης προπονητικών προτύπων.

Υπάρχουν πολλά πραγματικά μεγάλα, πραγματικά συναρπαστικά προβλήματα πάνω στα οποία εργάζονται χιλιάδες επιστήμονες αυτή τη στιγμή. Αυτό είναι το πρόβλημα της αναγνώρισης εικόνας, της επεξεργασίας πληροφοριών, των γλωσσικών προβλημάτων και πολλών άλλων.

Η αποτελεσματικότητα της επίλυσης ενός προβλήματος αναγνώρισης καθορίζεται τελικά από το πόσο αποτελεσματικά έχει εκπαιδευτεί η συσκευή αναγνώρισης στη διαδικασία ταξινόμησης. Επομένως, η κύρια εστίαση στο πρόβλημα της αναγνώρισης προτύπων είναι στο έργο της αναγνώρισης μάθησης.

Φαίνεται λογικό να μελετάμε αρχιτεκτονικές που αντιστοιχούν στην κατανόησή μας για την οργάνωση και τη λειτουργία του εγκεφάλου. Ο ανθρώπινος εγκέφαλος παρέχει υπάρχουσες ενδείξεις ότι είναι δυνατή μια λύση στο πρόβλημα της αναγνώρισης προτύπων. Φαίνεται λογικό να μιμηθούμε τον εγκέφαλο αν θέλουμε να αναπαράγουμε τον τρόπο λειτουργίας του. Ωστόσο, το αντεπιχείρημα είναι το ιστορικό πτήσεων. Ο άνθρωπος δεν μπόρεσε να κατέβει από το έδαφος μέχρι που σταμάτησε να μιμείται τις κινήσεις των φτερών και το πέταγμα των πουλιών.

Η χρήση τοπογραφικών αρχών μας επιτρέπει να δημιουργήσουμε την ταχύτερη και πιο μεγάλη μνήμη υπολογιστή. Η μνήμη ολογράμματος αναζητά τις απαραίτητες πληροφορίες σύμφωνα με τους νόμους του συσχετισμού, που είναι χαρακτηριστικό της ανθρώπινης μνήμης. Η ολογραφία μπορεί να λύσει το πρόβλημα της αναγνώρισης προτύπων, με το οποίο η κυβερνητική παλεύει εδώ και πολλά χρόνια. Εάν ένα ολόγραμμα παρουσιαστεί με μια ομάδα αντικειμένων, θα ανταποκριθεί αμέσως (με αναγνώριση) σε εκείνα των οποίων τις εικόνες αποθηκεύει. Επιπλέον, όσο πιο περίπλοκο είναι το αντικείμενο, τόσο πιο αξιόπιστα το αναγνωρίζει το ολόγραμμα.

Το τέταρτο κεφάλαιο σκιαγραφεί τα θεμέλια της θεωρίας των διακριτών συστημάτων αυτο-οργάνωσης. Καθορίζεται ένα ποσοτικό μέτρο αυτοοργάνωσης και αυτομάθησης, μελετάται η συμπεριφορά τυχαίων αυτομάτων και αυτομάτων που λειτουργούν υπό συνθήκες τυχαίων εξωτερικών επιρροών. Ιδιαίτερη προσοχή δίνεται στο πρόβλημα της αναγνώρισης προτύπων και στη θεωρία μιας κατηγορίας συσκευών (τα λεγόμενα α-περσεπτόνια) που έχουν σχεδιαστεί για να λύσουν αυτό το πρόβλημα. Εξετάζονται ορισμένα ζητήματα μοντελοποίησης εξαρτημένων αντανακλαστικών, καθώς και οι διαδικασίες μάθησης για την αναγνώριση νοήματος και την ανάπτυξη νέων εννοιών.

Στο Σχ. Το Σχήμα 12.11 δείχνει ένα παράδειγμα στο οποίο το κεφαλαίο γράμμα Α επιλέγεται ως εικόνα. Είναι εύκολο να διαπιστωθεί ότι εάν διατηρείται η κατάλληλη χωρητικότητα μνήμης, μετά από πολλά βήματα χαλάρωσης, εμφανίζεται μια καθαρή εικόνα, αρχικά καταγεγραμμένη στη μνήμη, από γράμματα παραμορφωμένα από θόρυβο. Αυτή ακριβώς είναι η σχέση μεταξύ της συνειρμικής μνήμης του τύπου που περιγράφηκε παραπάνω και του προβλήματος της αναγνώρισης εικόνας. Προς το παρόν, δεν υπάρχει ακριβής ιδέα για το πώς θα μπορούσε να γενικευτεί και να επεκταθεί το μοντέλο spin glass της συνειρμικής μνήμης που περιγράφηκε παραπάνω για να εφαρμοστεί στο περίπλοκο πρόβλημα της αναγνώρισης περιστρεφόμενων ή μετατοπισμένων εικόνων. Όπως το παράδειγμα εικόνας στο Σχ. 12.11, το γράμμα Α, γυρισμένο ανάποδα, δεν θα αναγνωριστεί, καθώς ακόμη και η μετατόπιση μιας μη παραμορφωμένης εικόνας από αρκετούς κόμβους πλέγματος (raster) μετατρέπει την αναγνώρισή του σε πρόβλημα, η λύση του οποίου υπερβαίνει τις συνειρμικές δυνατότητες του μοντέλου Hopfydd . Το μέλλον θα δείξει εάν αυτή η κατηγορία προβλημάτων μπορεί επίσης να λυθεί με τη βοήθεια συσχετιστικών συσκευών αποθήκευσης.

Η πολυπλοκότητα των περιβαλλοντικών προβλημάτων απαιτεί την επεξεργασία μεγάλων ποσοτήτων δεδομένων. Απαιτείται έρευνα για να διευκολυνθεί η ερμηνεία και η συνετή χρήση των συσσωρευμένων πληροφοριών. Η εργασία στον τομέα της τεχνητής νοημοσύνης που σχετίζεται με το πρόβλημα της αναγνώρισης προτύπων μπορεί να προσφέρει σημαντική βοήθεια από αυτή την άποψη. Τα τελευταία επιτεύγματα της τεχνολογίας μικροεπεξεργαστών και μικροϋπολογιστών αρχίζουν να χρησιμοποιούνται στο σχεδιασμό ευφυών οργάνων μέτρησης. Είναι απαραίτητο να δοθεί προσοχή στην οργάνωση, τη συσσώρευση και τη συλλογή περιβαλλοντικών δεδομένων.

Όπως βλέπουμε, η έννοια της συμμετρίας αποκτά ένα πραγματικά παγκόσμιο νόημα. Ωστόσο, μπορούμε να πάμε ακόμη παραπέρα και να επιστήσουμε την προσοχή στο γεγονός ότι, σε γενικές γραμμές, αντιμετωπίζουμε τη συμμετρία κάθε φορά που λύνουμε το πρόβλημα της αναγνώρισης προτύπων, το πρόβλημα της διάγνωσης.

Η αναγνώριση προτύπων είναι μια από τις μορφές επεξεργασίας πληροφοριών που προέρχονται από ένα σύστημα ή ένα αντικείμενο. Οι κλάσεις χαρακτηρίζονται από το γεγονός ότι τα αντικείμενα που ανήκουν σε αυτές έχουν κάποια κοινά στοιχεία (ομοιότητα), για παράδειγμα, χαρακτηρίζονται από την ίδια δομή του λειτουργικού τελεστή. Αυτό το κοινό πράγμα που ενώνει αντικείμενα σε μια κλάση ονομάζεται συνήθως εικόνα. Το πρόβλημα της κατασκευής μιας μαθηματικής περιγραφής ενός αντικειμένου ή συστήματος από τη σκοπιά του προβλήματος της αναγνώρισης προτύπων μπορεί να προσεγγιστεί με δύο τρόπους. Μία από τις προσεγγίσεις είναι ότι ο ίδιος ο λειτουργικός τελεστής FHS λειτουργεί ως η εικόνα που πρέπει να προσδιοριστεί. Από την άλλη πλευρά, αντί για τον λειτουργικό τελεστή Ф, κατασκευάζεται μια συσκευή κυβερνητικής αναγνώρισης που προβλέπει τη συμπεριφορά του συστήματος με τον ίδιο τρόπο που θα έκανε ο αντίστοιχος λειτουργικός τελεστής.

Από τα παραπάνω, είναι προφανές ότι υπάρχουν πολλοί αλγόριθμοι για τον εντοπισμό χαρακτηριστικών στη διαδικασία της προκαταρκτικής επεξεργασίας πληροφοριών. ο αριθμός τους αυξάνεται συνεχώς και γρήγορα, αφού η επιλογή των μεθόδων για την επίλυση ενός συγκεκριμένου προβλήματος καθορίζεται σε μεγάλο βαθμό από τη φύση του ίδιου του προβλήματος. Η επιτυχία ολόκληρης της μελέτης για το πρόβλημα της αναγνώρισης προτύπων καθορίζεται από το πόσο καλά εκτελείται το στάδιο εξαγωγής χαρακτηριστικών. Η άποψη έχει γίνει γενική αποδοχή σύμφωνα με την οποία θα πρέπει να αναμένονται νέα σημαντικά επιτεύγματα στον τομέα αυτό ακριβώς στο στάδιο της εξαγωγής χαρακτηριστικών κατά την προκαταρκτική επεξεργασία πληροφοριών.

Προσωπικά πιστεύω ότι αυτή η ερμηνεία δίνει στον σύγχρονο κυβερνητικό επιστήμονα το κλειδί για μια βαθύτερη μελέτη του προβλήματος της μνήμης, το οποίο συζητείται σε άλλη ενότητα αυτού του βιβλίου. Επιπλέον, αν και ο Leibniz απέτυχε να δημιουργήσει σχετικιστική λογική, οι φιλοσοφικές του απόψεις για το πρόβλημα της αντίληψης (που είναι ένα από τα πιο σημαντικά ζητήματα στην κυβερνητική) ήταν περίπου τρεις αιώνες μπροστά από την εποχή του. Εξάλλου, μόνο με την έλευση του έργου του Whitehead στον αιώνα μας τεκμηριώθηκε η άποψη ότι κάποιο αντικείμενο, που δεν έχει συνείδηση ​​από μόνο του, είναι σε θέση να αντιδράσει με μια ορισμένη έννοια στα γεγονότα που σχετίζονται με αυτό. Τέλος, είναι ιδιαίτερα χαρακτηριστικό ότι στις μελέτες του για όλες αυτές τις συνδέσεις, ο Leibniz στάθηκε στις θεμελιώδεις θέσεις της θεωρίας της επιχειρησιακής έρευνας. Ενδιαφερόταν πολύ λιγότερο για την ερμηνεία αιτίου-αποτελέσματος των σχέσεων παρά για τη δυναμική, και πίστευε ότι ένα μέρος είναι έκφραση του συνόλου και όχι απλώς περιέχεται σε αυτό. Αυτή η προσέγγιση είναι σε καλή συμφωνία με τα προβλήματα Gestalt στη σύγχρονη ψυχολογία, με την προσέγγιση για την επίλυση όλων των προβλημάτων της βιομηχανικής κυβερνητικής από τη θέση της οργανικής ενότητας, καθώς και με τη σύγχρονη κυβερνητική έρευνα στο πρόβλημα της αναγνώρισης προτύπων.