Επίλυση του προβλήματος της κατανομής πόρων χρησιμοποιώντας τη μέθοδο δυναμικού προγραμματισμού. Βέλτιστη κατανομή πόρων με χρήση μεθόδου δυναμικού προγραμματισμού

ΠΕΡΙΛΗΨΗ


Εισαγωγή


Δυναμικός προγραμματισμός- μια μέθοδος βελτιστοποίησης προσαρμοσμένη σε λειτουργίες στις οποίες η διαδικασία λήψης αποφάσεων μπορεί να χωριστεί σε στάδια (βήματα). Τέτοιες πράξεις ονομάζονται πολλαπλά βήματα.

Έναρξη ανάπτυξης δυναμικός προγραμματισμόςχρονολογείται στη δεκαετία του '50 του εικοστού αιώνα. και συνδέεται με το όνομα του Richard Ernest Bellman.

Εάν τα μοντέλα γραμμικού προγραμματισμού μπορούν να χρησιμοποιηθούν στα οικονομικά για τη λήψη αποφάσεων σχεδιασμού μεγάλης κλίμακας δύσκολες καταστάσεις, τότε χρησιμοποιούνται μοντέλα δυναμικού προγραμματισμού για την επίλυση προβλημάτων πολύ μικρότερης κλίμακας:

ü κατά την ανάπτυξη κανόνων διαχείρισης αποθεμάτων·

ü κατά την κατανομή των επενδυτικών πόρων μεταξύ εναλλακτικών έργων·

ü κατά τη σύνταξη ημερολογιακά σχέδιατρέχουσα και γενική επισκευή σύνθετου εξοπλισμού και αντικατάστασή του κ.λπ.


1. Γενική διατύπωση του προβλήματος δυναμικού προγραμματισμού

δυναμικός προγραμματισμός εξισώσεων bellman

Ως ελεγχόμενη διαδικασία θεωρείται, για παράδειγμα, η διαδικασία διανομής κεφαλαίων μεταξύ επιχειρήσεων, η χρήση πόρων επί σειρά ετών, η αντικατάσταση εξοπλισμού κ.λπ. Ως αποτέλεσμα του ελέγχου, το σύστημα (αντικείμενο ελέγχου) S μεταφέρεται από την αρχική κατάσταση s 0να δηλώνει s n . Αφήστε το στοιχείο ελέγχου να χωριστεί σε n βήματα, π.χ. η απόφαση λαμβάνεται διαδοχικά σε κάθε βήμα και ο έλεγχος που μεταφέρει το σύστημα S από την αρχική κατάσταση στην τελική κατάσταση είναι ένα σύνολο n βήμα προς βήμα αποφάσεις διαχείρισης.

Ας συμβολίσουμε με Χ κ απόφαση της διοίκησης για kth βήμα(k=1, 2, …, n). Μεταβλητές Χ κ ικανοποιούν ορισμένους περιορισμούς και υπό αυτή την έννοια ονομάζονται παραδεκτοί (Χ κ μπορεί να είναι ένας αριθμός, ένα σημείο σε ν-διάστατο χώρο ή ένα ποιοτικό χαρακτηριστικό).

Έστω X=(X 1, Χ 2,…, Χ n ) - έλεγχος που μεταφέρει το σύστημα S από την κατάσταση s 0να δηλώνει s n . Ας υποδηλώσουμε με s κ κατάσταση του συστήματος (χαρακτηρίζεται από ένα ορισμένο σύνολοπαραμέτρους και τις συγκεκριμένες τιμές τους) μετά το k-ο βήμα ελέγχου. Επιπλέον, η κατάσταση του συστήματος s κ στο τέλος του kth βήματος εξαρτάται μόνο από την προηγούμενη κατάσταση s κ-1 και απόφαση διαχείρισης στο k-ο βήμα Χ κ (δηλαδή δεν εξαρτάται άμεσα από προηγούμενες συνθήκες και αποφάσεις διαχείρισης). Αυτή η απαίτησηονομάζεται "καμία συνέπεια" και μπορεί να εκφραστεί με τις ακόλουθες εξισώσεις κατάστασης:



Έτσι, λαμβάνουμε μια ακολουθία καταστάσεων s0, s1, …, sk-1, sk, …, sn-1, sn. Στη συνέχεια n-βήμα διαδικασία διαχείρισηςμπορεί να απεικονιστεί σχηματικά ως εξής:


Αφήστε τον δείκτη απόδοσης του kth βήματος να εκφραστεί με κάποια συνάρτηση:



και η αποτελεσματικότητα ολόκληρης της διαδικασίας πολλαπλών σταδίων που εξετάζουμε είναι η ακόλουθη αθροιστική συνάρτηση:



Στη συνέχεια, το βήμα προς βήμα πρόβλημα βελτιστοποίησης (πρόβλημα δυναμικού προγραμματισμού) διατυπώνεται ως εξής: προσδιορίστε έναν αποδεκτό έλεγχο X που μεταφέρει το σύστημα S από την κατάσταση s0 στην κατάσταση sn, στην οποία η αντικειμενική συνάρτηση Z παίρνει τη μεγαλύτερη (μικρότερη) τιμή.

Το πρόβλημα δυναμικού προγραμματισμού έχει τα ακόλουθα χαρακτηριστικά:

Το πρόβλημα βελτιστοποίησης ερμηνεύεται ως διαδικασία ελέγχου n-βημάτων.

Η αντικειμενική συνάρτηση είναι ίση με το άθροισμα των αντικειμενικών συναρτήσεων κάθε βήματος.

Η επιλογή του ελέγχου στο kth βήμα εξαρτάται μόνο από την κατάσταση του συστήματος σε αυτό το βήμα και δεν επηρεάζει τα προηγούμενα βήματα (απουσία ανατροφοδότηση).

Η κατάσταση sk μετά το kth βήμα ελέγχου εξαρτάται μόνο από την προηγούμενη κατάσταση sk-1 και τον έλεγχο Xk («καμία συνέπεια»).

Σε κάθε βήμα, ο έλεγχος Xk εξαρτάται από έναν πεπερασμένο αριθμό μεταβλητών ελέγχου και η κατάσταση sk εξαρτάται από έναν πεπερασμένο αριθμό παραμέτρων.


2. Αρχή βελτιστοποίησης και εξισώσεις Bellman


Αρχή βελτιστοποίησηςδιατυπώθηκε για πρώτη φορά από τον Richard Ernest Bellman το 1953 (όπως ερμηνεύεται από τον E.S. Wentzel):

Όποια και αν είναι η κατάσταση του συστήματος ως αποτέλεσμα οποιουδήποτε αριθμού βημάτων, στο επόμενο βήμα είναι απαραίτητο να επιλέξετε τον έλεγχο με τέτοιο τρόπο ώστε, μαζί με τον βέλτιστο έλεγχο σε όλα τα επόμενα βήματα, να οδηγεί σε βέλτιστο κέρδος σε όλα τα υπόλοιπα βήματα, συμπεριλαμβανομένου αυτού.

ΣΧΕΤΙΚΑ ΜΕ. Ο Bellman διατύπωσε επίσης τις συνθήκες κάτω από τις οποίες ισχύει η αρχή. Η κύρια απαίτηση είναι ότι η διαδικασία ελέγχου πρέπει να είναι χωρίς ανάδραση, δηλ. διαχείριση σε αυτό το βήμαδεν πρέπει να επηρεάζει τα προηγούμενα βήματα.

Ας αναλογιστούμε κοινή εργασίαδυναμικός προγραμματισμός που δίνεται παραπάνω. Σε κάθε βήμα εκτός από το τελευταίο για οποιαδήποτε κατάσταση του συστήματος s κ-1 διαχειριστική απόφαση Χ κ είναι απαραίτητο να επιλέξετε "με προσοχή", καθώς αυτή η επιλογή επηρεάζει την επακόλουθη κατάσταση του συστήματος sk .

Στο τελευταίο βήμα, με βάση την κατάσταση του συστήματος s n-1 διαχειριστική απόφαση Χ n μπορεί να προγραμματιστεί τοπικά βέλτιστα, δηλ. με βάση μόνο τις εκτιμήσεις αυτού του βήματος.

Ας αναλογιστούμε το τελευταίο ντο βήμα:

μικρό n-1 - κατάσταση του συστήματος στην αρχή του nου βήματος.

μικρό n - τελική κατάσταση του συστήματος.

Χ n - Έλεγχος στο nο βήμα.

φά n (μικρό n-1 , Χ n ) είναι η αντικειμενική συνάρτηση (απόδοση) του ν ου βήματος.

Σύμφωνα με την αρχή της βελτιστότητας, το X n πρέπει να επιλέγεται με τέτοιο τρόπο ώστε για οποιεσδήποτε καταστάσεις του συστήματος s n-1 πάρει το βέλτιστο αντικειμενική λειτουργίασε αυτό το βήμα.

Ας υποδηλώσουμε με το βέλτιστο (για βεβαιότητα θα πάρουμε το μέγιστο) της αντικειμενικής συνάρτησης - δείκτη της αποτελεσματικότητας του nου βήματος, με την προϋπόθεση ότι στην αρχή του τελευταίου βήματος το σύστημα S ήταν σε αυθαίρετη κατάσταση sn-1 , και στο τελευταίο βήμα ο έλεγχος ήταν βέλτιστος.

ονομάζεται το υπό συνθήκη μέγιστο της αντικειμενικής συνάρτησης στο nο βήμα και προσδιορίζεται από τον ακόλουθο τύπο:



Η μεγιστοποίηση πραγματοποιείται σε όλους τους αποδεκτούς ελέγχους Xn.

Η λύση Xn στην οποία επιτυγχάνεται αυτό εξαρτάται επίσης από το sn-1 και ονομάζεται βέλτιστη υπό συνθήκη λύση στο nο βήμα. Ας το χαρακτηρίσουμε με.

Έχοντας λύσει το μονοδιάστατο πρόβλημα τοπικής βελτιστοποίησης χρησιμοποιώντας την εξίσωση (5), ορίζουμε δύο συναρτήσεις και για όλες τις πιθανές καταστάσεις sn-1.

Ας εξετάσουμε ένα πρόβλημα δύο βημάτων: προσθέστε το (n-1) -ο στο ν-ο βήμα.

Για οποιεσδήποτε καταστάσεις sn-2, αυθαίρετες αποφάσεις διαχείρισης Xn-1 και βέλτιστο έλεγχο στο nο βήμα, η τιμή της αντικειμενικής συνάρτησης στα δύο τελευταία βήματα υπολογίζεται από τον τύπο:


Σύμφωνα με την αρχή της βελτιστότητας του Bellman για κάθε s n-2 η λύση πρέπει να επιλεγεί έτσι ώστε, μαζί με τον βέλτιστο έλεγχο στο τελευταίο (ν) βήμα, να οδηγεί στο βέλτιστο της αντικειμενικής συνάρτησης στα δύο τελευταία βήματα. Επομένως, είναι απαραίτητο να βρεθεί η βέλτιστη έκφραση (6) για όλες τις αποδεκτές αποφάσεις διαχείρισης Xn-1 :



Ονομάζεται το υπό όρους μέγιστο της αντικειμενικής συνάρτησης υπό βέλτιστο έλεγχο στα δύο τελευταία βήματα. Πρέπει να σημειωθεί ότι η έκφραση σε σγουρά τιράντεςστον τύπο (6), εξαρτάται μόνο από τα sn-2 και Xn-1, αφού το sn-1 μπορεί να βρεθεί από την εξίσωση των καταστάσεων (1) με:



Ο αντίστοιχος έλεγχος Xn-1 στο (n-1) βήμα συμβολίζεται με και ονομάζεται βέλτιστος έλεγχος υπό όρους στο (n-1) βήμα.

Τα βέλτιστα υπό όρους της αντικειμενικής συνάρτησης προσδιορίζονται ομοίως για βέλτιστο έλεγχο σε βήματα (n-k+1), ξεκινώντας από το k-ο έως το τέλος, με την προϋπόθεση ότι στην αρχή του k-ου βήματος το σύστημα ήταν σε κατάσταση sk -1:



Ο έλεγχος Xk στο kth βήμα, στο οποίο επιτυγχάνεται το μέγιστο στο (8), συμβολίζεται και ονομάζεται βέλτιστος έλεγχος υπό όρους στο kth βήμα.

Οι εξισώσεις (5) και (8) ονομάζονται επαναλαμβανόμενες εξισώσεις Bellman (αντίστροφο σχήμα). Η διαδικασία επίλυσης αυτών των εξισώσεων ονομάζεται περιορισμένη βελτιστοποίηση.

Ως αποτέλεσμα βελτιστοποίηση υπό όρουςπαίρνουμε δύο ακολουθίες:

, …, - υπό όρους μέγιστα της αντικειμενικής συνάρτησης στα τελευταία, δύο τελευταία, …, στα n βήματα.

, …, - βέλτιστα στοιχεία ελέγχου υπό όρους στο nth, (n-1) - th, …, στο 1ο βήμα.

Χρησιμοποιώντας αυτές τις ακολουθίες, μπορούμε να βρούμε μια λύση στο πρόβλημα δυναμικού προγραμματισμού με τα n και s0:

Ως αποτέλεσμα, παίρνουμε τη βέλτιστη λύση στο πρόβλημα δυναμικού προγραμματισμού: .

Χρησιμοποιώντας παρόμοιο σκεπτικό, μπορούμε να δημιουργήσουμε ένα σχήμα άμεσης βελτιστοποίησης υπό όρους:



Η βέλτιστη λύση στο πρόβλημα σε αυτή την περίπτωση βρίσκεται σύμφωνα με το ακόλουθο σχήμα:


Έτσι, η κατασκευή ενός δυναμικού μοντέλου προγραμματισμού και η επίλυση ενός προβλήματος με βάση αυτό γενική άποψημπορεί να αναπαρασταθεί με τη μορφή των παρακάτω σταδίων:

Επιλέξτε μια μέθοδο για τη διαίρεση της διαδικασίας διαχείρισης σε βήματα.

Ορίστε τις παραμέτρους κατάστασης s κ Και μεταβλητές ελέγχουΧ κ Σε κάθε βήμα γράφονται εξισώσεις κατάστασης.

3. Εισαγάγετε τις αντικειμενικές συναρτήσεις του k-ου βήματος και τη συνολική αντικειμενική συνάρτηση, καθώς και το βέλτιστο υπό συνθήκη και τον βέλτιστο υπό όρους έλεγχο στο k-ο βήμα ().

Οι επαναλαμβανόμενες εξισώσεις Bellman γράφονται σύμφωνα με το αντίστροφο ή το άμεσο σχήμα και, μετά την εκτέλεση βελτιστοποίησης υπό όρους, λαμβάνονται δύο ακολουθίες: () και ().

Καθορίζεται η βέλτιστη τιμή της αντικειμενικής συνάρτησης και η βέλτιστη λύση.


3. Πρόβλημα κατανομής πόρων


Υπάρχει ένα ορισμένο ποσό πόρων s0 που πρέπει να διανεμηθεί σε n επιχειρηματικές οντότητες για τρέχουσες δραστηριότητες κατά την υπό εξέταση περίοδο (μήνας, τρίμηνο, εξάμηνο, έτος κ.λπ.) προκειμένου να επιτευχθεί ένα συνολικό μέγιστο κέρδος. Το μέγεθος των επενδύσεων πόρων xi (;) στις δραστηριότητες κάθε οικονομικής οντότητας είναι πολλαπλάσιο μιας ορισμένης τιμής h. Είναι γνωστό ότι κάθε οικονομική οντότητα, ανάλογα με τον όγκο των κεφαλαίων που χρησιμοποιήθηκαν xi για την υπό εξέταση περίοδο, αποφέρει κέρδος ύψους fi(xi) (δεν εξαρτάται από την επένδυση πόρων σε άλλες οικονομικές οντότητες).

Ας φανταστούμε τη διαδικασία κατανομής πόρων μεταξύ των επιχειρηματικών οντοτήτων ως μια διαδικασία διαχείρισης n-βημάτων (ο αριθμός βήματος συμπίπτει με τον υπό όρους αριθμό της επιχειρηματικής οντότητας). Έστω η sk() παράμετρος κατάστασης, δηλ. το ποσό των διαθέσιμων κεφαλαίων μετά το ιιατό βήμα για διανομή μεταξύ των υπόλοιπων (n - k) επιχειρηματικών οντοτήτων. Τότε οι εξισώσεις κατάστασης μπορούν να γραφτούν με την ακόλουθη μορφή:



Ας εισαγάγουμε υπόψη τη συνάρτηση - το υπό όρους βέλτιστο συνολικό κέρδος που λαμβάνεται από τις k-th, (k+1) - th, ..., n-th οικονομικές οντότητες, εάν οι πόροι στο ποσό του sk-1 () ήταν βέλτιστα κατανεμημένα μεταξύ τους. Το σύνολο των πιθανών αποφάσεων διαχείρισης σχετικά με το μέγεθος των κατανεμημένων πόρων στο k-ο βήμα μπορεί να παρουσιαστεί ως εξής: .

Τότε οι επαναλαμβανόμενες εξισώσεις της R.E. Bellman (αντίστροφο διάγραμμα) θα μοιάζει με:



Παράδειγμα.Υπάρχει ένα ορισμένο ποσό πόρων s0=100, οι οποίοι πρέπει να κατανεμηθούν σε n=4 επιχειρηματικές οντότητες για τρέχουσες δραστηριότητες κατά την υπό εξέταση περίοδο (μήνας) προκειμένου να επιτευχθεί το συνολικό μέγιστο κέρδος. Το μέγεθος της επένδυσης των πόρων xi (;) στις δραστηριότητες κάθε οικονομικής οντότητας είναι πολλαπλάσιο της τιμής h=20 και προσδιορίζεται από το διάνυσμα Q. Είναι γνωστό ότι κάθε οικονομική οντότητα, ανάλογα με τον όγκο των κεφαλαίων που χρησιμοποιεί xi για την υπό εξέταση περίοδο, αποφέρει κέρδος ύψους fi(xi) () (δεν εξαρτάται από την επένδυση πόρων σε άλλες οικονομικές οντότητες):

Είναι απαραίτητο να καθοριστεί πόσοι πόροι θα πρέπει να διατεθούν σε κάθε επιχείρηση προκειμένου το συνολικό κέρδος να είναι μεγαλύτερο.

Διάλυμα.Ας δημιουργήσουμε τις επαναλαμβανόμενες εξισώσεις του Bellman (αντίστροφο σχήμα):



Ας προσδιορίσουμε τα μέγιστα υπό όρους σύμφωνα με το (13), τα αποτελέσματα υπολογισμού παρουσιάζονται στον Πίνακα 1.


Πίνακας 1. Υπολογισμός βέλτιστου υπό όρους

μικρό κ-1 x κ μικρό κ k=3k=2k=1 123456789101112000000000000200200+20=20 22 200+22=22 2200+22=22 22020022+0=22 17+0=1714+0=14400400+33=33 42 200+42=42 4200+42=42 420202022+20=42 17+22=3914+22=3640021+0=2120+0=2026+0=26600600+46=46 55 200+55=55 59 20 0+59=59 590204022+33=5517+42=59 14+42=56402021+20=4120+22=4226+22=4860037+0=3732+0=3235+0=35800800+30=30 68 200+68=68 72 200+72=72 73 20206022+46=6817+55=7214+59=73 404021+33=5420+42=6426+42=68602037+20=5732+22=5435+22=5780067+0=6761+0=6152+0=5210001000+42=42 87 800+87=87 8700+87=87 870208022+30=5217+68=8514+72=86406021+46=6720+55=7526+59=85604037+33=7032+42=7435+42=77802067+20=87 61+22=8352+22=74100058+0=5872+0=7261+0=61Με βάση τα αποτελέσματα της βελτιστοποίησης υπό όρους, θα προσδιορίσουμε τη βέλτιστη κατανομή των πόρων:

Έτσι, η βέλτιστη κατανομή πόρων είναι:



που θα αποφέρει το μεγαλύτερο κέρδος στο ποσό των 87 συμβατικών μονάδων. φωλιά. μονάδες

Απάντηση:βέλτιστη κατανομή πόρων: που παρέχει το μεγαλύτερο κέρδος από 87 συμβατικές μονάδες. φωλιά. μονάδες


Σύναψη


Ο δυναμικός προγραμματισμός είναι ένας τομέας μαθηματικού προγραμματισμού που περιλαμβάνει ένα σύνολο τεχνικών και εργαλείων για την εύρεση της βέλτιστης λύσης, καθώς και τη βελτιστοποίηση κάθε βήματος στο σύστημα και την ανάπτυξη μιας στρατηγικής ελέγχου, δηλαδή η διαδικασία ελέγχου μπορεί να αναπαρασταθεί ως διαδικασία πολλαπλών βημάτων. Ο δυναμικός προγραμματισμός, χρησιμοποιώντας τον προγραμματισμό βήμα προς βήμα, επιτρέπει όχι μόνο την απλοποίηση της λύσης του προβλήματος, αλλά και την επίλυση εκείνων των προβλημάτων για τα οποία δεν μπορούν να εφαρμοστούν μέθοδοι μαθηματική ανάλυση. Η απλούστευση της λύσης επιτυγχάνεται με τη σημαντική μείωση του αριθμού των υπό μελέτη επιλογών, καθώς αντί να επιλύεται ένα σύνθετο πολυμεταβλητό πρόβλημα μία φορά, η μέθοδος προγραμματισμού βήμα προς βήμα περιλαμβάνει την επίλυση σχετικά απλών προβλημάτων πολλές φορές. Όταν σχεδιάζουμε μια διαδικασία βήμα προς βήμα, προχωράμε από τα συμφέροντα ολόκληρης της διαδικασίας στο σύνολό της, δηλ. Όταν παίρνετε μια απόφαση σε ένα συγκεκριμένο στάδιο, είναι πάντα απαραίτητο να έχετε κατά νου τον τελικό στόχο. Ωστόσο, ο δυναμικός προγραμματισμός έχει και τα μειονεκτήματά του. Σε αντίθεση με τον γραμμικό προγραμματισμό, στον οποίο μέθοδο simplexείναι καθολική, δεν υπάρχει τέτοια μέθοδος στον δυναμικό προγραμματισμό. Κάθε εργασία έχει τις δικές της δυσκολίες και σε κάθε περίπτωση είναι απαραίτητο να βρεθεί η καταλληλότερη μέθοδος λύσης. Το μειονέκτημα του δυναμικού προγραμματισμού είναι επίσης η πολυπλοκότητα της επίλυσης πολυδιάστατων προβλημάτων. Ένα πρόβλημα δυναμικού προγραμματισμού πρέπει να πληροί δύο προϋποθέσεις. Η πρώτη συνθήκη συνήθως ονομάζεται συνθήκη απουσίας επακόλουθου αποτελέσματος και η δεύτερη είναι η συνθήκη προσθετικότητας της αντικειμενικής συνάρτησης του προβλήματος. Στην πράξη, υπάρχουν προβλήματα σχεδιασμού στα οποία τυχαίοι παράγοντες παίζουν σημαντικό ρόλο, επηρεάζοντας τόσο την κατάσταση του συστήματος όσο και το κέρδος. Υπάρχει διαφορά μεταξύ ντετερμινιστικών και στοχαστικών προβλημάτων δυναμικού προγραμματισμού. Σε ένα ντετερμινιστικό πρόβλημα, ο βέλτιστος έλεγχος είναι μοναδικός και προσδιορίζεται εκ των προτέρων ως ένα άκαμπτο πρόγραμμα ενεργειών. Σε ένα στοχαστικό πρόβλημα, ο βέλτιστος έλεγχος είναι τυχαίος και επιλέγεται κατά τη διάρκεια της ίδιας της διαδικασίας, ανάλογα με την τυχαία κατάσταση. ΣΕ ντετερμινιστικό σχήμα, περνώντας τη διαδικασία σταδιακά από το τέλος στην αρχή, υπάρχει επίσης μια ολόκληρη σειρά βέλτιστων ελέγχων υπό όρους σε κάθε στάδιο, αλλά από όλους αυτούς τους ελέγχους, μόνο ένας πραγματοποιήθηκε τελικά. Αυτό δεν συμβαίνει σε ένα στοχαστικό σχήμα. Κάθε ένας από τους βέλτιστους ελέγχους υπό όρους μπορεί πραγματικά να εφαρμοστεί εάν η προηγούμενη πορεία της τυχαίας διαδικασίας οδηγήσει το σύστημα στην αντίστοιχη κατάσταση. Η αρχή της βελτιστοποίησης είναι η βάση για τη σταδιακή επίλυση προβλημάτων δυναμικού προγραμματισμού. Τυπικοί εκπρόσωποι των οικονομικών προβλημάτων του δυναμικού προγραμματισμού είναι τα λεγόμενα προβλήματα παραγωγής και αποθήκευσης, προβλήματα διανομής επενδύσεων κεφαλαίου, προβλήματα προγραμματισμού παραγωγής και άλλα. Τα προβλήματα δυναμικού προγραμματισμού χρησιμοποιούνται στον προγραμματισμό των δραστηριοτήτων μιας επιχείρησης, λαμβάνοντας υπόψη τις αλλαγές στην ανάγκη για προϊόντα με την πάροδο του χρόνου. Στη βέλτιστη κατανομή των πόρων μεταξύ των επιχειρήσεων σε κατεύθυνση ή χρόνο. Η περιγραφή των χαρακτηριστικών του δυναμικού προγραμματισμού και των τύπων προβλημάτων που μπορούν να διατυπωθούν στο πλαίσιό του πρέπει απαραίτητα να είναι πολύ γενική και κάπως ασαφής, αφού υπάρχει μια τεράστια ποικιλία διαφορετικών προβλημάτων που ταιριάζουν στο σχήμα δυναμικού προγραμματισμού. Μόνο μελέτη μεγάλο αριθμόΤα παραδείγματα παρέχουν μια σαφή κατανόηση της δομής του δυναμικού προγραμματισμού.


Αναφορές

  1. Οικονομικά και μαθηματικά μοντέλα και μέθοδοι. Γραμμικός προγραμματισμός: Φροντιστήριογια φοιτητές οικονομικών ειδικοτήτων / Συντάχθηκε από: Smirnov Yu.N., Shibanova E.V., Naberezhnye Chelny: KamPI Publishing House, 2004, 81 σελ.
  2. Επιχειρησιακή Έρευνα στα Οικονομικά: Εγχειρίδιο. εγχειρίδιο για πανεπιστήμια / N.Sh. Kremer, Β.Α. Πούτκο, Ι.Μ. Trishin, Μ.Ν. Friedman; Εκδ. καθ. N.Sh. Κρέμερ. - Μ.: ΕΝΟΤΗΤΑ, 2000. - 407 σελ.
  3. Kuznetsov A.V. και άλλα Ανώτερα μαθηματικά: Μαθηματικά. προγραμματισμός: Textbook/A.V. Kuznetsov, V.A. Σάκοβιτς, Ν.Ι. Κρύο; Υπό γενική εκδ. A.V. Κουζνέτσοβα. - Μν.: Πιο ψηλά. σχολείο, 1994. - 286 σελ.: ill.
Φροντιστήριο

Χρειάζεστε βοήθεια για τη μελέτη ενός θέματος;

Οι ειδικοί μας θα συμβουλεύσουν ή θα παρέχουν υπηρεσίες διδασκαλίας σε θέματα που σας ενδιαφέρουν.
Υποβάλετε την αίτησή σαςυποδεικνύοντας το θέμα αυτή τη στιγμή για να ενημερωθείτε σχετικά με τη δυνατότητα λήψης μιας διαβούλευσης.

Σκοπός της υπηρεσίας. Αυτή η υπηρεσίαπροορίζεται για επίλυση του προβλήματος της βέλτιστης κατανομής των επενδύσεων V online λειτουργία. Τα αποτελέσματα υπολογισμού παρουσιάζονται σε μια αναφορά Μορφή Word(δείτε παράδειγμα σχεδίασης).
Προβλήματα αυτού του είδους βασίζονται στη συνάρτηση Bellman και επιλύονται χρησιμοποιώντας τη μέθοδο σάρωσης προς τα πίσω (βλ. Τυπικές εργασίες). Μπορείτε επίσης να χρησιμοποιήσετε τη διαδικασία άμεσης εκτέλεσης υπηρεσίας.

Οδηγίες. Επιλέξτε τον αριθμό των επιχειρήσεων και τον αριθμό των γραμμών (τον αριθμό των αποτελεσματικών επενδυτικών επιλογών), κάντε κλικ στο Επόμενο (δείτε Παράδειγμα συμπλήρωσης). Εάν τα έσοδα και τα υπόλοιπα των επιχειρήσεων δίνονται με τη μορφή των συναρτήσεων f(x) και g(x), το πρόβλημα λύνεται μέσω αυτής της αριθμομηχανής.

Αριθμός επιχειρήσεων 2 3 4 5 6 7 8 9 10
Αριθμός σειρών (αριθμός αποτελεσματικών επιλογών ένθεσης) 2 3 4 5 6 7 8 9 10

Παράδειγμα Νο. 1. Καθορίζω βέλτιστο σχέδιοεπέκταση της παραγωγής τριών επιχειρήσεων, εάν το ετήσιο κέρδος τους είναι γνωστό ελλείψει επενδύσεων και με επένδυση 1, 2, 3 ή 4 εκατομμυρίων.

στ1στ2f3x i
40 30 35 0
90 110 95 1
395 385 270 2
440 470 630 3
620 740 700 4

Στάδιο Ι. Βελτιστοποίηση υπό όρους.
1ο βήμα. k = 3.

ε 2u 3e 3 = e 2 - u 3f 3 (u 3)F* 3 (e 3)u 3 (ε 3)
1 0 1 35
1 0 95 95 1
2 0 2 35
1 1 95
2 0 270 270 2
3 0 3 35
1 2 95
2 1 270
3 0 630 630 3
4 0 4 35
1 3 95
2 2 270
3 1 630
4 0 700 700 4

2ο βήμα. k = 2.

ε 1u 2e 2 = e 1 - u 2f 2 (u 2)F* 2 (e 1)F 1 (u 2 ,e 1)F* 2 (e 2)u 2 (ε 2)
1 0 1 30 95 125 125 0
1 0 110 0 110
2 0 2 30 270 300
1 1 110 95 205
2 0 385 0 385 385 2
3 0 3 30 630 660 660 0
1 2 110 270 380
2 1 385 95 480
3 0 470 0 470
4 0 4 30 700 730
1 3 110 630 740 740 1
2 2 385 270 655
3 1 470 95 565
4 0 740 0 740

3ο βήμα. k = 1.

ε 0u 1e 1 = e 0 - u 1f 1 (u 1)F* 1 (e 0)F 0 (u 1 ,e 0)F* 1 (e 1)u 1 (ε 1)
1 0 1 40 125 165 165 0
1 0 90 0 90
2 0 2 40 385 425 425 0
1 1 90 125 215
2 0 395 0 395
3 0 3 40 660 700 700 0
1 2 90 385 475
2 1 395 125 520
3 0 440 0 440
4 0 4 40 740 780 780 0
1 3 90 660 750
2 2 395 385 780
3 1 440 125 565
4 0 620 0 620

Σημείωμα: Οι στήλες 1 (επενδυμένα κεφάλαια), 2 (έργο) και 3 (υπόλοιπο κεφαλαίων) είναι ίδιες και για τους τρεις πίνακες, επομένως θα μπορούσαν να γίνουν κοινοί. Η στήλη 4 συμπληρώνεται με βάση τα αρχικά δεδομένα για τις συναρτήσεις εισοδήματος, οι τιμές στη στήλη 5 λαμβάνονται από τη στήλη 7 του προηγούμενου πίνακα, η στήλη 6 συμπληρώνεται με το άθροισμα των τιμών των στηλών 4 και 5 (στον πίνακα του 3ου βήματος λείπουν οι στήλες 5 και 6).
Η στήλη 7 καταγράφει τη μέγιστη τιμή της προηγούμενης στήλης για μια σταθερή αρχική κατάσταση και η στήλη 8 καταγράφει το στοιχείο ελέγχου από τη στήλη 2, το οποίο φτάνει το μέγιστο 7.
Στάδιο II. Βελτιστοποίηση χωρίς όρους.
Από τον πίνακα του 3ου βήματος έχουμε F* 1 (e 0 = 4 εκατομμύρια ρούβλια) = 780 χιλιάδες ρούβλια, δηλαδή το μέγιστο κέρδος από την επένδυση e 0 = 4 εκατομμύρια ρούβλια. ίσο με 780 χιλιάδες ρούβλια.
Από τον ίδιο πίνακα διαπιστώνουμε ότι η πρώτη επιχείρηση πρέπει να κατανεμηθεί u* 1 (e 0 = 4 εκατομμύρια ρούβλια) = 0 εκατομμύρια ρούβλια.
Σε αυτή την περίπτωση, το υπόλοιπο των κεφαλαίων θα είναι: e 1 = e 0 - u 1, e 1 = 4 - 0 = 4 εκατομμύρια ρούβλια.
Από τον πίνακα του 2ου βήματος έχουμε F* 2 (e 1 = 4 εκατομμύρια ρούβλια) = 740 χιλιάδες ρούβλια, δηλ. μέγιστο κέρδος σε e 1 = 4 εκατομμύρια ρούβλια. ίσο με 740 χιλιάδες ρούβλια.
Από τον ίδιο πίνακα διαπιστώνουμε ότι η δεύτερη επιχείρηση πρέπει να κατανεμηθεί u* 2 (e 1 = 4 εκατομμύρια ρούβλια) = 1 εκατομμύριο ρούβλια.
Σε αυτή την περίπτωση, το υπόλοιπο των κεφαλαίων θα είναι: e 2 = e 1 - u 2, e 2 = 4 - 1 = 3 εκατομμύρια ρούβλια.
Η τελευταία επιχείρηση λαμβάνει 3 εκατομμύρια ρούβλια. Έτσι, μια επένδυση 4 εκατομμυρίων ρούβλια. πρέπει να διανεμηθεί ως εξής: στην πρώτη επιχείρηση δεν πρέπει να διατεθεί τίποτα, στη δεύτερη επιχείρηση θα πρέπει να διατεθούν 1 εκατομμύριο ρούβλια, στην τρίτη επιχείρηση θα πρέπει να διατεθούν 3 εκατομμύρια ρούβλια, γεγονός που θα εξασφαλίσει μέγιστο κέρδος 780 χιλιάδων ρούβλια.

Παράδειγμα Νο. 2. Υπάρχουν 4 επιχειρήσεις, μεταξύ των οποίων είναι απαραίτητο να διανεμηθούν 100 χιλιάδες συμβατικές μονάδες. μονάδες χρήματα. Οι αξίες της αύξησης της παραγωγής στην επιχείρηση, ανάλογα με τα διατεθέντα κεφάλαια X, παρουσιάζονται στον πίνακα. Καταρτίστε ένα βέλτιστο σχέδιο για την κατανομή κεφαλαίων για τη μεγιστοποίηση της συνολικής αύξησης της παραγωγής.

1. Βασικές έννοιες

1.1. Μοντέλο δυναμικού προγραμματισμού

1.2. Η αρχή της βελτιστοποίησης. Εξίσωση Bellman

2. Βέλτιστη κατανομήπόροι

2.1 Δήλωση προβλήματος

2.2 Δισδιάστατο μοντέλο κατανομής πόρων

2.3 Διακριτικό δυναμικό μοντέλοβέλτιστη κατανομή πόρων

2.4 Λαμβάνοντας υπόψη τις επακόλουθες επιπτώσεις σε προβλήματα βέλτιστης κατανομής πόρων

Σύναψη

Κατάλογος πηγών που χρησιμοποιήθηκαν

Παράρτημα 1. Κατάλογος του προγράμματος για την επίλυση του προβλήματος της βέλτιστης κατανομής πόρων με δεδομένων παραμέτρων. Αποτελέσματα προγράμματος

Εισαγωγή

Σε όλη την ιστορία, οι άνθρωποι έχουν καταφύγει σε περίπλοκες τελετουργίες όταν αντιμετωπίζουν αποφάσεις. Έκαναν επίσημες τελετές, θυσίαζαν ζώα, έλεγαν περιουσίες από τα αστέρια και παρακολουθούσαν το πέταγμα των πτηνών. Βασίστηκαν σε λαϊκά σημάδια και προσπάθησαν να ακολουθήσουν πρωτόγονους κανόνες, διευκολύνοντας τους το δύσκολο έργο της λήψης αποφάσεων. Επί του παρόντος, ένα νέο και, προφανώς, πιο επιστημονικό «τελετουργικό» χρησιμοποιείται για τη λήψη αποφάσεων, με βάση τη χρήση ηλεκτρονικού υπολογιστή. Χωρίς μοντέρνα τεχνικά μέσαΤο ανθρώπινο μυαλό πιθανότατα δεν μπορεί να λάβει υπόψη τους πολλούς και ποικίλους παράγοντες που συναντώνται κατά τη λειτουργία μιας επιχείρησης, το σχεδιασμό ενός πυραύλου ή τη ρύθμιση της κυκλοφορίας. Υπάρχουν πολλά επί του παρόντος μαθηματικές μεθόδουςΟι βελτιστοποιήσεις έχουν ήδη αναπτυχθεί αρκετά, γεγονός που καθιστά δυνατή την αποτελεσματική χρήση των δυνατοτήτων ψηφιακών και υβριδικών υπολογιστών. Μία από αυτές τις μεθόδους είναι ο μαθηματικός προγραμματισμός, ο οποίος περιλαμβάνει και τα δύο ειδική περίπτωσηδυναμικός προγραμματισμός.

Πλειοψηφία πρακτικά προβλήματαέχει πολλά (και μερικά ίσως ακόμη άπειρος αριθμός) λύσεις. Ο στόχος της βελτιστοποίησης είναι η εύρεση η καλύτερη λύσημεταξύ πολλών δυνητικά δυνατών σύμφωνα με κάποιο κριτήριο αποτελεσματικότητας ή ποιότητας. Ένα πρόβλημα που επιτρέπει μόνο μία λύση δεν απαιτεί βελτιστοποίηση. Η βελτιστοποίηση μπορεί να επιτευχθεί χρησιμοποιώντας πολλές στρατηγικές, που κυμαίνονται από εξαιρετικά πολύπλοκες αναλυτικές και αριθμητικές μαθηματικές διαδικασίες έως την έξυπνη χρήση απλής αριθμητικής.

Ο δυναμικός προγραμματισμός είναι μια μέθοδος βελτιστοποίησης προσαρμοσμένη σε λειτουργίες στις οποίες η διαδικασία λήψης αποφάσεων μπορεί να αναλυθεί σε ξεχωριστά στάδια (βήματα). Τέτοιες πράξεις ονομάζονται πολλαπλών βημάτων.

Ως κλάδος του μαθηματικού προγραμματισμού, ο δυναμικός προγραμματισμός (DP) άρχισε να αναπτύσσεται στη δεκαετία του '50 του 20ου αιώνα. χάρη στο έργο του R. Bellman και των συνεργατών του. Για πρώτη φορά, επιλύθηκαν προβλήματα βέλτιστης διαχείρισης αποθεμάτων χρησιμοποιώντας αυτή τη μέθοδο και στη συνέχεια η κατηγορία των προβλημάτων επεκτάθηκε σημαντικά. Πως πρακτική μέθοδοςβελτιστοποίηση, η μέθοδος δυναμικού προγραμματισμού κατέστη δυνατή μόνο με τη χρήση σύγχρονης τεχνολογίας υπολογιστών.

Η μέθοδος δυναμικού προγραμματισμού βασίζεται στην αρχή της βελτιστοποίησης που διατυπώθηκε από τον Bellman. Αυτή η αρχή και η ιδέα της ένταξης συγκεκριμένο έργοβελτιστοποιήσεις σε μια οικογένεια παρόμοιων προβλημάτων πολλαπλών βημάτων οδηγούν σε επαναλαμβανόμενες σχέσεις - λειτουργικές εξισώσεις - σε σχέση με βέλτιστη τιμήλειτουργία στόχου. Η λύση τους μας επιτρέπει να αποκτούμε με συνέπεια βέλτιστο έλεγχο για το αρχικό πρόβλημα βελτιστοποίησης.

1. Βασικές έννοιες

1.1 Μοντέλο δυναμικού προγραμματισμού

Ας δώσουμε γενική περιγραφήμοντέλα δυναμικού προγραμματισμού.

Υπό εξέταση ελεγχόμενο σύστημα, το οποίο, υπό την επίδραση του ελέγχου, μετακινείται από την αρχική κατάσταση

στην τελική κατάσταση. Ας υποθέσουμε ότι η διαδικασία διαχείρισης συστήματος μπορεί να χωριστεί σε nβήματα. Έστω , ,…, οι καταστάσεις του συστήματος μετά το πρώτο, το δεύτερο,..., n-ο βήμα. Αυτό φαίνεται σχηματικά στο Σχ. 1.

Εικόνα 1

Κατάσταση

συστήματα μετά kthβήμα ( κ = 1,2 …,n) χαρακτηρίζεται από παραμέτρους , ,…, που ονομάζονται συντεταγμένες φάσης.Η κατάσταση μπορεί να αναπαρασταθεί από ένα σημείο στον s-διάστατο χώρο που ονομάζεται χώρος φάσης.Ο συνεπής μετασχηματισμός του συστήματος (βήμα προς βήμα) επιτυγχάνεται με τη βοήθεια ορισμένων δραστηριοτήτων, ,…, που αποτελούν τη διαχείριση του συστήματος , πού είναι ενεργοποιημένος ο έλεγχος κ-βήμα, μεταφορά του συστήματος από κατάσταση σε κατάσταση (Εικ. 1). Διαχείριση σε κΤο βήμα είναι να επιλέξετε τις τιμές ορισμένων μεταβλητών ελέγχου.

Υποθέτουμε στο εξής ότι η κατάσταση του συστήματος στο τέλος kthβήμα εξαρτάται μόνο από την προηγούμενη κατάσταση του συστήματος

και έλεγχος σε αυτό το βήμα (Εικ. 1). Αυτή η ιδιότητα ονομάζεται κανένα αποτέλεσμα.Ας υποδηλώσουμε αυτή την εξάρτηση ως , (1.1)

Οι ισότητες (1.1) λέγονται εξισώσεις καταστάσεων.Λειτουργίες

υποθέτουμε δεδομένο.

Μεταβλητός έλεγχος U , θα αποκτήσουμε διαφορετικές «αποτελεσματικότητες» της διαδικασίας, τις οποίες θα αξιολογήσουμε ποσοτικά με την αντικειμενική συνάρτηση Ζ , ανάλογα με την αρχική κατάσταση του συστήματος

και από το επιλεγμένο στοιχείο ελέγχου U : . (1.2)

Δείκτης απόδοσης kthβήμα της διαδικασίας ελέγχου, το οποίο εξαρτάται από την κατάσταση

στην αρχή αυτού του βήματος και του ελέγχου που επιλέχθηκε σε αυτό το βήμα, δηλώνουμε με το βήμα προς βήμα πρόβλημα βελτιστοποίησης που εξετάζεται η αντικειμενική συνάρτηση (1.2) πρέπει να είναι προσθετική, δηλ. . (1.3)

Εάν η ιδιότητα προσθετικότητας της αντικειμενικής συνάρτησης Z δεν ικανοποιείται, τότε αυτό μπορεί μερικές φορές να επιτευχθεί με κάποιους μετασχηματισμούς της συνάρτησης. Για παράδειγμα, αν το Z είναι μια πολλαπλασιαστική συνάρτηση που δίνεται ως

, τότε μπορούμε να θεωρήσουμε μια συνάρτηση που είναι προσθετική.

Συνήθως, οι συνθήκες διεργασίας ελέγχονται σε κάθε βήμα

ισχύουν ορισμένοι περιορισμοί. Έλεγχοι που ικανοποιούν αυτούς τους περιορισμούς ονομάζονται παραδεκτά .

Το βήμα προς βήμα πρόβλημα βελτιστοποίησης μπορεί να διατυπωθεί ως εξής: προσδιορίστε το σύνολο των εφικτών ελέγχων

Σκοπός της υπηρεσίας. Η ηλεκτρονική αριθμομηχανή έχει σχεδιαστεί για επίλυση του προβλήματος της βέλτιστης κατανομής των πόρωνδίνονται ως συναρτήσεις f(x) . Τα αποτελέσματα υπολογισμού παρουσιάζονται σε μια αναφορά του Word (βλ.).

Οδηγίες. Επιλέξτε τον αριθμό των επιχειρήσεων.

Αριθμός επιχειρήσεων 2 3

Παράδειγμα Νο. 1. Η λειτουργία δύο επιχειρήσεων προγραμματίζεται για n έτη. Οι αρχικοί πόροι είναι ίσοι με s0. Τα κεφάλαια x που επενδύθηκαν στην 1η επιχείρηση στην αρχή του έτους δίνουν κέρδος f1(x) στο τέλος του έτους και επιστρέφονται στο ποσό του g1(x). Τα κεφάλαια y που επενδύθηκαν στη 2η επιχείρηση στην αρχή του έτους δίνουν κέρδος f2(y) στο τέλος του έτους και επιστρέφονται στο ποσό των g2(y). Στο τέλος του έτους, τα επιστρεφόμενα κεφάλαια αναδιανέμονται μεταξύ των βιομηχανιών. Προσδιορίστε το βέλτιστο σχέδιο διανομής κεφαλαίων και βρείτε το μέγιστο κέρδος.

Ας λύσουμε το πρόβλημα χρησιμοποιώντας τη μέθοδο δυναμικού προγραμματισμού. Λειτουργία ελέγχου διαδικασία παραγωγήςΑς το χωρίσουμε σε στάδια. Σε καθένα από αυτά θα επιλέξουμε τον έλεγχο έτσι ώστε να οδηγεί σε κέρδη και τα δύο σε αυτό το στάδιο, και σε όλα τα επόμενα μέχρι το τέλος της επέμβασης. Αυτό είναι αρχή της βελτιστοποίησης, που διατύπωσε ο Αμερικανός μαθηματικός A. Bellman.
Ας χωρίσουμε όλη την περίοδο σε τρία στάδια ανά έτος και ας τα αριθμήσουμε ξεκινώντας από το πρώτο.
Ας υποδηλώσουμε με x kΚαι y kτο ποσό των κεφαλαίων που διατέθηκαν σε κάθε επιχείρηση στο k-ο στάδιο και μετά x k + y k = ένα κ- το συνολικό ποσό των κεφαλαίων σε αυτό το στάδιο. Στη συνέχεια, η πρώτη επιχείρηση φέρνει 3 σε αυτό το στάδιο x k, και το δεύτερο είναι 4 y kμονάδες εισοδήματος. Συνολικό εισόδημα στο k-ο στάδιο 3 x k + 4y k.
Ας υποδηλώσουμε με φάκ ( έναια) είναι το μέγιστο εισόδημα που λαμβάνει ο κλάδος και από τις δύο επιχειρήσεις στο kth και από όλες τις επόμενες. Στη συνέχεια, η συναρτησιακή εξίσωση που αντικατοπτρίζει την αρχή της βελτιστότητας Bellman παίρνει τη μορφή:
f k (α κ)=μέγ.(3x k + 4y k +f k +1 (a k +1)).(1)
Επειδή x k + y k = a k , τότεy k = a k - x k και3x k + 4y k = 3x k + 4(a k - x k) = - x k + 4a k . Γι' αυτόf k (a k) = max(-x k + 4a k + f k+1 (ak+1)). (2)
0 ≤ x k ≤ a k
Επιπλέον, ak είναι τα κεφάλαια που κατανέμονται στις επιχειρήσεις στο k-ο στάδιο και καθορίζονται από το υπόλοιπο των κεφαλαίων που ελήφθησαν στο προηγούμενο στάδιο (k-1). Επομένως, σύμφωνα με τις συνθήκες του προβλήματος, βέλτιστος έλεγχος σε κάθε στάδιο
ak = 0,5x k -1 + 0,2y k -1 = 0,5x k -1 +0,2(a k -1 -x k-1) = 0,3x k -1 +0,2α κ -1 . (3)

ΕΓΩ. Συνθήκες βελτιστοποίησης
Ξεκινάμε τον προγραμματισμό από το τελευταίο τρίτο στάδιο

Στο κ= 3 λαμβάνουμε από το (2)
f 3 (a 3) = max (- x 3 + 4a 3 + f 4 (a 4))
0 ≤ x 3 ≤ a 3
Αφού λοιπόν δεν υπάρχει τέταρτο στάδιο f 4 (α 4)=0Και
f 3 (a 3) = max (- x 3 + 4a 3 )=4a 3
0 ≤ x 3 ≤ a 3
(μέγιστη έκφραση ( - x 3 + 4α 3) θα είναι στο x 3 =0)).

Για το τρίτο λοιπόν τελευταίο στάδιοέχουμε: f 3 (α 3) = 4ένα 3,x 3 = 0,y 3 =ένα 3 -x 3 =ένα 3,
Οπου ένα 3 = 0,3x 2 + 0,2α 2,που προκύπτει από τον τύπο (3).

Στο k = 2από τις (2) και (3) παίρνουμε:
f(a 2) = max (-x 2 + 4a 2 + f 3 (a 3))=
0 ≤ x ≤ a 2
=max (-x 2 + 4a 2 + 4a 3 )= max (-x 2 + 4a 2 + 4( 0,3x 2 + 0,2a 2)) max(0,2x 2 + 4,8a 2 ) 5a
0 ≤ x ≤ α 2
επειδή το μέγιστο της έκφρασης ( 0,2 x 2 + 4,8α 2) θα είναι στο x 2 =α 2.
Τότε για το δεύτερο στάδιο έχουμε: f 2 (a 2) = 5a 2, x 2 = a 2, y 2 = a 2 x 2 = 0, ενώ
a 2 = 0,3x 1 + 0,2a 1 λαμβάνοντας υπόψη το (3).
Στο k = 1Λαμβάνοντας υπόψη τις (2) και (3) παίρνουμε:
f 1 (a 1) = max (-x 1 + 4a 1 + f 2 (a 2))=
0 ≤ x ≤ a 1
= max (-x 1 + 4a 1 + 5a 2 )= max (-x 1 + 4a 2 + 5(0,3x 1 + 0,2a 2))= max (0,5x 1 + 5a 1 )=5, 5a 1
0 ≤ x ≤ α 1
στο x 1 = a 1.
Έτσι για το πρώτο στάδιο f 1 (α 1) = 5,5ένα 1,x 1 =ένα 1,y 1 = 0.
Η διαδικασία έχει τελειώσει. Στο πρώτο στάδιο, το συνολικό ποσό των διανεμημένων κεφαλαίων είναι γνωστό - α 1= 900 μονάδες Τότε θα είναι το μέγιστο εισόδημα που λαμβάνουν και οι δύο επιχειρήσεις σε τρία χρόνια f 1 (a 1) = 5,5*900 = 4950 den. μονάδες

II. Βελτιστοποίηση χωρίς όρους
Ας μάθουμε ποια θα πρέπει να είναι η βέλτιστη διαχείριση της διαδικασίας κατανομής κεφαλαίων μεταξύ της πρώτης και της δεύτερης επιχείρησης προκειμένου να λάβουν μέγιστο εισόδημαστο ποσό των 4950 δεν. μονάδες
1ο έτος.Επειδή x 1 =α 1Και , y 1 = 0,τότε όλα τα ταμεία στο ποσό των 900 δεν. μονάδες δίνονται στην πρώτη επιχείρηση.
2ο έτος.Τα κεφάλαια κατανέμονται a 2 = 0,3x 1 + 0,2a 1 = 0,5 α 1=450 μονάδες, x 2 = a 2, y 2 = 0.
Όλα μεταφέρονται στην πρώτη επιχείρηση.
3ο έτος. Διατίθενται κονδύλια ένα 3 = 0,3x 2 + 0,2α 2 = 0,5 α 2= 225 μονάδες, x 3 = 0,y 3 =α 3. Όλα μεταφέρονται στη δεύτερη επιχείρηση.
Παρουσιάζουμε τα αποτελέσματα της λύσης σε μορφή πίνακα.

Περίοδος Μέσα Επιχείρηση Νο 1 Επιχείρηση Νο 2 Υπόλοιπο Εισόδημα
1 900 900 0 450 2700
2 450 450 0 225 1350
3 225 0 225 45 900
4950

Παράδειγμα Νο. 2. Βέλτιστη σταδιακή κατανομή των κεφαλαίων μεταξύ των επιχειρήσεων κατά την περίοδο προγραμματισμού.
Η διοίκηση της εταιρείας, η οποία έχει συμφωνία συνεργασίας με τρεις μικρές επιχειρήσεις, έχει διαθέσει κεφάλαιο κίνησης για αυτές ύψους 100.000 USD για την προγραμματισμένη ετήσια περίοδο. Για κάθε επιχείρηση, οι συναρτήσεις του τριμηνιαίου εισοδήματος και του τριμηνιαίου υπολοίπου κεφαλαίου κίνησης είναι γνωστές, ανάλογα με το ποσό x που κατανεμήθηκε για το τρίμηνο. Στην αρχή του τριμήνου, τα κεφάλαια κατανέμονται εξ ολοκλήρου μεταξύ τριών επιχειρήσεων (το εισόδημα υπολογίζεται από αυτά τα επενδυμένα κεφάλαια) και στο τέλος του τριμήνου, τα υπόλοιπα κεφάλαια συσσωρεύονται από τη διοίκηση της εταιρείας και διανέμονται ξανά πλήρως μεταξύ των επιχειρήσεις.
Καταρτίστε ένα σχέδιο για την τριμηνιαία κατανομή των κεφαλαίων για το έτος (4 τρίμηνα), επιτρέποντάς σας να επιτύχετε το μέγιστο συνολικό εισόδημα για το έτος.
f 1 (x)=1,2x, f 2 (x)=1,5x, f 3 (x)=2x; g 1 (x)=0,7x, g 2 (x)=0,6x, g 3 (x)=0,1x

Ο δυναμικός προγραμματισμός (DP) είναι μια μέθοδος για την εύρεση βέλτιστων λύσεων σε προβλήματα με δομή πολλαπλών βημάτων (πολλαπλών σταδίων).

Ας παρουσιάσουμε τη γενική διατύπωση του προβλήματος DP. Εξετάζεται μια ελεγχόμενη διαδικασία (κατανομή κεφαλαίων μεταξύ επιχειρήσεων, χρήση πόρων επί σειρά ετών κ.λπ.). Ως αποτέλεσμα του ελέγχου, το σύστημα (αντικείμενο ελέγχου) μεταφέρεται από την αρχική κατάσταση στην κατάσταση . Ας υποθέσουμε ότι ο έλεγχος μπορεί να αναλυθεί σε
βήματα. Σε κάθε βήμα, επιλέγεται ένας από τους πολλούς αποδεκτούς ελέγχους
, μεταφέροντας το σύστημα σε μία από τις καταστάσεις του συνόλου
. Στοιχεία του σετ
Και καθορίζεται από τις συνθήκες μιας συγκεκριμένης εργασίας. Η ακολουθία των καταστάσεων του συστήματος μπορεί να απεικονιστεί ως γράφημα καταστάσεων που φαίνεται στο Σχ. 3.1.

Σε κάθε βήμα nτο αποτέλεσμα επιτυγχάνεται
. Ας υποθέσουμε ότι το συνολικό αποτέλεσμα είναι το άθροισμα των αποτελεσμάτων που επιτυγχάνονται σε κάθε βήμα. Στη συνέχεια, το πρόβλημα DP διατυπώνεται ως εξής: προσδιορίστε έναν τέτοιο αποδεκτό έλεγχο
, που μεταφέρει το σύστημα από το κράτος σε μια κατάσταση
, στην οποία λειτουργεί ο στόχος
παίρνει τη μεγαλύτερη (μικρότερη) τιμή, δηλ.

Η επίλυση προβλημάτων με τη μέθοδο DP πραγματοποιείται με βάση την αρχή της βελτιστοποίησης, η οποία διατυπώθηκε από τον Αμερικανό επιστήμονα R. Bellman: όποια και αν είναι η κατάσταση του συστήματος ως αποτέλεσμα οποιουδήποτε αριθμού βημάτων, στο επόμενο βήμα είναι απαραίτητο να επιλέξετε τον έλεγχο έτσι ώστε, σε συνδυασμό με τον βέλτιστο έλεγχο σε όλα τα επόμενα βήματα, να οδηγήσουν σε βέλτιστα κέρδη σε όλα τα υπόλοιπα βήματα, συμπεριλαμβανομένου αυτού.

Ας υποδηλώσουμε με
υπό όρους βέλτιστη τιμή της αντικειμενικής συνάρτησης στο διάστημα από το βήμα nμέχρι το τελευταίο
-ο βήμα συμπεριλαμβανομένου, υπό την προϋπόθεση ότι πριν nΣτο 3ο βήμα, το σύστημα βρισκόταν σε μία από τις καταστάσεις του σετ
, και σε nΣτο βήμα, επιλέχθηκε ένας τέτοιος έλεγχος από το σετ
, το οποίο παρείχε στην αντικειμενική συνάρτηση μια υπό όρους βέλτιστη τιμή, τότε
υπό όρους βέλτιστη τιμή της αντικειμενικής συνάρτησης στο εύρος από ( n+1 )ο προς
-ο βήμα συμπεριλαμβανομένου.

Στην αποδεκτή σημείωση, η αρχή της βελτιστοποίησης Bellman μπορεί να γραφτεί σε μαθηματική μορφή ως εξής

Η ισότητα (3.1) ονομάζεται η κύρια συναρτησιακή εξίσωση του δυναμικού προγραμματισμού. Για κάθε συγκεκριμένο πρόβλημα, η εξίσωση έχει μια ειδική μορφή.

Η υπολογιστική διαδικασία της μεθόδου DP χωρίζεται σε δύο στάδια: βελτιστοποίηση υπό όρους και άνευ όρων.

Στη σκηνή υποθετικός βελτιστοποίησησύμφωνα με τη λειτουργική εξίσωση, καθορίζονται οι βέλτιστοι έλεγχοι για όλες τις πιθανές καταστάσεις σε κάθε βήμα, ξεκινώντας από το τελευταίο.

Στη σκηνή άνευ όρων βελτιστοποίησητα βήματα θεωρούνται ξεκινώντας από το πρώτο. Από την αρχική κατάσταση γνωστό, ο βέλτιστος έλεγχος επιλέγεται από το σετ . Επιλεγμένος βέλτιστος έλεγχος φέρνει το σύστημα σε μια πολύ συγκεκριμένη κατάσταση . Λόγω του ότι η αρχική κατάσταση είναι γνωστό στην αρχή του δεύτερου βήματος, καθίσταται δυνατή η επιλογή του βέλτιστου ελέγχου στο δεύτερο βήμα και τα λοιπά. Έτσι, δημιουργείται μια αλυσίδα διασυνδεδεμένων λύσεων άνευ όρων βελτιστοποίησης.

3.1. Πρόβλημα βέλτιστης κατανομής πόρων

Ας διατεθεί στον σύλλογο ένα ορισμένο ποσό υλικών πόρων για την ανασυγκρότηση και τον εκσυγχρονισμό της κύριας παραγωγής Χ. Διαθέσιμος Νεπιχειρήσεις μεταξύ των οποίων είναι απαραίτητο να γίνει διανομή αυτόν τον πόρο. Ας υποδηλώσουμε με
το κέρδος που αποφέρει η κατανομή στην εθνική οικονομία ι-η επιχείρηση
μονάδες πόρων. Υποτίθεται ότι το περιθώριο κέρδους εξαρτάται τόσο από το κατανεμημένο ποσό των πόρων όσο και από την επιχείρηση. Επιπλέον, το κέρδος που εισπράττουν οι επιχειρήσεις μετράται στις ίδιες μονάδες και συνολικό κέρδοςοι ενώσεις αποτελούνται από τα κέρδη μεμονωμένων επιχειρήσεων. Είναι απαραίτητο να βρεθεί το βέλτιστο σχέδιο για την κατανομή πόρων μεταξύ των επιχειρήσεων, στο οποίο το συνολικό κέρδος της ένωσης θα είναι μέγιστο.

Η παρούσα εργασία πρέπει να θεωρηθεί ως πολλαπλών βημάτων.

Στο στάδιο της βελτιστοποίησης υπό όρους, θα εξετάσουμε την αποτελεσματικότητα της επένδυσης σε μία (για παράδειγμα, στην πρώτη επιχείρηση), σε δύο επιχειρήσεις μαζί (στην πρώτη και στη δεύτερη), σε τρεις επιχειρήσεις μαζί (στην πρώτη, δεύτερη και τρίτη ), κ.λπ., και τέλος, καθόλου Νεπιχειρήσεις από κοινού. Το καθήκον είναι να προσδιοριστεί η μεγαλύτερη τιμή της συνάρτησης
υπό τον όρο
.

Ας χρησιμοποιήσουμε τη σχέση επανάληψης Bellman (3.1), η οποία για αυτό το πρόβλημα οδηγεί στις ακόλουθες συναρτησιακές εξισώσεις για
:

Εδώ είναι η λειτουργία
καθορίζει το μέγιστο κέρδος της πρώτης επιχείρησης κατά την κατανομή του xμονάδες πόρων, λειτουργία
καθορίζει το μέγιστο κέρδος της πρώτης και της δεύτερης επιχείρησης μαζί κατά την κατανομή τους xμονάδες πόρων, λειτουργία
καθορίζει το μέγιστο κέρδος της πρώτης, δεύτερης και τρίτης επιχείρησης μαζί κατά την κατανομή τους xμονάδες πόρων, κ.λπ., και τέλος, η συνάρτηση
καθορίζει το μέγιστο κέρδος όλων των επιχειρήσεων μαζί κατά την κατανομή τους xμονάδες πόρων.

Στο στάδιο της άνευ όρων βελτιστοποίησης, καθορίζεται το βέλτιστο σχέδιο για τη διανομή πόρων μεταξύ των επιχειρήσεων.

Παράδειγμα 3.1.

Για να αυξηθεί ο όγκος της παραγωγής προϊόντων που έχουν υψηλή ζήτηση, διατέθηκαν κεφάλαια ύψους 50 εκατομμυρίων ρούβλια σε τέσσερις επιχειρήσεις της ένωσης παραγωγής. Κάθε επιχείρηση μπορεί να διατεθεί: 0, 10, 20, 30, 40 ή 50 εκατομμύρια ρούβλια. Ταυτόχρονα, η ετήσια αύξηση της παραγωγής παραγωγής από κάθε μία από τις επιχειρήσεις
ανάλογα με την επένδυση είναι γνωστό και φαίνεται στον πίνακα. 3.1.

Πίνακας 3.1

Όγκος διατεθέντων κεφαλαίων x(εκατομμύρια ρούβλια)

Ετήσια αύξηση της παραγωγής προϊόντος (εκατομμύρια ρούβλια), ανάλογα με τον όγκο των διατεθέντων κεφαλαίων

Βρείτε το βέλτιστο σχέδιο για την κατανομή των κεφαλαίων μεταξύ των επιχειρήσεων, διασφαλίζοντας τη μέγιστη ετήσια αύξηση της παραγωγής από την ένωση παραγωγής.