Μέθοδοι που χρησιμοποιούνται για ψηφιακή συμπίεση ήχου: Audio MPEG, PASC, ATRAC. Πώς λειτουργεί η συμπίεση ήχου

Ορισμένες μέθοδοι συμπίεσης δεδομένων ήχου (προσθήκη στη Διάλεξη 2)

    Κωδικοποίηση χωρίς απώλειες είναι μια μέθοδος κωδικοποίησης ήχου που επιτρέπει την 100% ανάκτηση δεδομένων από μια συμπιεσμένη ροή. Αυτή η μέθοδος συμπίεσης δεδομένων χρησιμοποιείται σε περιπτώσεις όπου η διατήρηση της αρχικής ποιότητας δεδομένων είναι κρίσιμης σημασίας. Για παράδειγμα, μετά την μίξη ήχου σε στούντιο ηχογράφησης, τα δεδομένα πρέπει να αποθηκευτούν σε ένα αρχείο στην αρχική τους ποιότητα για πιθανή μεταγενέστερη χρήση. Οι αλγόριθμοι κωδικοποίησης χωρίς απώλειες που υπάρχουν σήμερα (για παράδειγμα, Monkeys Audio) μπορούν να μειώσουν τον όγκο που καταλαμβάνουν τα δεδομένα κατά 20-50%, αλλά ταυτόχρονα να εξασφαλίζουν 100% αποκατάσταση των αρχικών δεδομένων από τα δεδομένα που λαμβάνονται μετά τη συμπίεση. Τέτοιοι κωδικοποιητές είναι ένα είδος αρχειοθέτησης δεδομένων (όπως ZIP, RAR και άλλοι), σχεδιασμένοι μόνο για συμπίεση ήχου.

    Απώλεια κωδικοποίησης. Ο σκοπός αυτής της κωδικοποίησης είναι η χρήση οποιουδήποτε μέσου για την επίτευξη της ομοιότητας του ήχου του σήματος που έχει αποκατασταθεί με το πρωτότυπο με όσο το δυνατόν λιγότερη ποσότητα συσκευασμένων δεδομένων. Αυτό επιτυγχάνεται με τη χρήση διάφορων αλγορίθμων που «απλοποιούν» το αρχικό σήμα (εκτινάσσοντας «περιττές» δυσδιάκριτες λεπτομέρειες από αυτό), γεγονός που οδηγεί στο γεγονός ότι το αποκωδικοποιημένο σήμα στην πραγματικότητα παύει να είναι πανομοιότυπο με το αρχικό, αλλά μόνο ακούγεται παρόμοιο.

Υπάρχουν πολλές μέθοδοι συμπίεσης, καθώς και προγράμματα που υλοποιούν αυτές τις μεθόδους. Τα πιο διάσημα είναι τα MPEG-1 Layer I,II,III (το τελευταίο είναι το γνωστό MP3), MPEG-2 AAC (προηγμένη κωδικοποίηση ήχου), Ogg Vorbis, Windows MediaΉχος (WMA), TwinVQ (VQF), MPEGPlus, TAC και άλλα.

Κατά μέσο όρο, ο λόγος συμπίεσης που παρέχεται από τέτοιους κωδικοποιητές κυμαίνεται από 10-14 (φορές).

Ορισμένες μορφές αρχείων ήχου :

Μορφή AU . Αυτή είναι μια απλή και κοινή μορφή σε συστήματα Sun και NeXT (στην τελευταία περίπτωση, ωστόσο, το αρχείο θα έχει την επέκταση SND). Το αρχείο αποτελείται από μια σύντομη κεφαλίδα υπηρεσίας (τουλάχιστον 28 byte), η οποία ακολουθείται αμέσως από δεδομένα ήχου. Χρησιμοποιείται ευρέως σε συστήματα τύπου Unix και χρησιμεύει ως βάση για τη μηχανή Java.

Μορφή WAVE (WAV). Τυπική μορφή αρχείου για αποθήκευση ήχου στα Windows. Είναι ένας ειδικός τύπος άλλης, πιο γενικής μορφής RIFF (Resource Interchange File Format). Μια άλλη παραλλαγή του RIFF είναι τα αρχεία βίντεο AVI. Ένα αρχείο RIFF αποτελείται από μπλοκ, μερικά από τα οποία μπορεί με τη σειρά τους να περιέχουν άλλα ένθετα μπλοκ. Κάθε μπλοκ δεδομένων προηγείται από ένα αναγνωριστικό και μήκος τεσσάρων χαρακτήρων. Τα αρχεία ήχου WAV τείνουν να είναι πιο απλά και έχουν μόνο ένα μπλοκ μορφής και ένα μπλοκ δεδομένων. Το πρώτο περιέχει γενικές πληροφορίεςσχετικά με τον ψηφιοποιημένο ήχο (αριθμός καναλιών, συχνότητα δειγματοληψίας, φύση της εξάρτησης της έντασης κ.λπ.), και στο δεύτερο - τα ίδια τα αριθμητικά δεδομένα. Κάθε δείγμα καταλαμβάνει έναν ακέραιο αριθμό byte (για παράδειγμα, 2 byte στην περίπτωση αριθμών 12 bit, τα πιο σημαντικά bit περιέχουν μηδενικά). Στη στερεοφωνική εγγραφή, οι αριθμοί ομαδοποιούνται σε ζεύγη για το αριστερό και το δεξί κανάλι, αντίστοιχα, με κάθε ζεύγος να σχηματίζει ένα πλήρες μπλοκ - για το παράδειγμά μας, το μήκος του θα είναι 4 byte. Αυτή η φαινομενικά υπερβολική δομή επιτρέπει στο λογισμικό να βελτιστοποιεί τη διαδικασία μεταφοράς δεδομένων κατά την αναπαραγωγή, αλλά, όπως συμβαίνει πάντα σε τέτοιες περιπτώσεις, το κέρδος χρόνου οδηγεί σε σημαντική αύξηση του μεγέθους του αρχείου.

Μορφή MP3 (MPEG Layer3) . Είναι μία από τις μορφές αποθήκευσης ήχου που υιοθετήθηκαν αργότερα ως μέρος των προτύπων συμπιεσμένου βίντεο. Η φύση της απόκτησης αυτής της μορφής είναι από πολλές απόψεις παρόμοια με τη συμπίεση δεδομένων γραφικών με χρήση τεχνολογίας JPEG που έχουμε ήδη συζητήσει. Δεδομένου ότι τα αυθαίρετα δεδομένα ήχου δεν συμπιέζονται αρκετά καλά με αναστρέψιμες μεθόδους, πρέπει να προχωρήσουμε σε μη αναστρέψιμες μεθόδους: με άλλα λόγια, με βάση τη γνώση για τις ιδιότητες της ανθρώπινης ακοής, οι ηχητικές πληροφορίες «διορθώνονται» έτσι ώστε οι παραμορφώσεις που προκύπτουν στο αυτί είναι απαρατήρητα, αλλά τα δεδομένα που προκύπτουν συμπιέζονται καλύτερα χρησιμοποιώντας παραδοσιακές μεθόδους. Αυτό ονομάζεται προσαρμοστική κωδικοποίηση και σας επιτρέπει να εξοικονομείτε τις λιγότερο σημαντικές λεπτομέρειες ήχου από την άποψη της ανθρώπινης αντίληψης. Οι τεχνικές που χρησιμοποιούνται στο MP3 δεν είναι εύκολο να κατανοηθούν και βασίζονται σε αρκετά πολύπλοκα μαθηματικά, αλλά παρέχουν ένα πολύ σημαντικό αποτέλεσμα συμπίεσης στις πληροφορίες ήχου. Οι επιτυχίες της τεχνολογίας MP3 οδήγησαν στο γεγονός ότι χρησιμοποιείται πλέον σε πολλές οικιακές συσκευές ήχου, για παράδειγμα, συσκευές αναπαραγωγής και κινητά τηλέφωνα.

Μορφή MIDI. Το όνομα MIDI είναι συντομογραφία του Musical Instrument Digital Interface, δηλ. ψηφιακή διεπαφήγια μουσικά όργανα. Πρόκειται για ένα αρκετά παλιό (1983) πρότυπο που συνδυάζει μια ποικιλία μουσικού εξοπλισμού (συνθεσάιζερ, ντραμς, φωτισμός). Το MIDI βασίζεται σε πακέτα δεδομένων, καθένα από τα οποία αντιστοιχεί σε ένα συμβάν, όπως το πάτημα ενός πλήκτρου ή η ρύθμιση μιας λειτουργίας ήχου. Οποιοδήποτε συμβάν μπορεί να ελέγχει ταυτόχρονα πολλά κανάλια, καθένα από τα οποία σχετίζεται με ένα συγκεκριμένο κομμάτι του εξοπλισμού. Παρά τον αρχικό του σκοπό, η μορφή αρχείου έχει γίνει ένα πρότυπο για δεδομένα μουσικής που μπορούν, εάν το επιθυμείτε, να αναπαραχθούν χρησιμοποιώντας την κάρτα ήχου ενός υπολογιστή χωρίς εξωτερικό εξοπλισμό MIDI. Το κύριο πλεονέκτημα των αρχείων MIDI είναι το πολύ μικρό τους μέγεθος, καθώς δεν είναι λεπτομερείς εγγραφές ήχου, αλλά στην πραγματικότητα είναι κάποιου είδους προηγμένο ηλεκτρονικό ισοδύναμο της παραδοσιακής μουσικής σημειογραφίας. Αλλά αυτή η ίδια ιδιότητα είναι επίσης ένα μειονέκτημα: καθώς ο ήχος δεν είναι λεπτομερής, ο διαφορετικός εξοπλισμός θα τον αναπαράγει διαφορετικά, κάτι που, κατ 'αρχήν, μπορεί ακόμη και να παραμορφώσει αισθητά τη μουσική πρόθεση του συγγραφέα.

Μορφή MOD. Αντιπροσωπεύει μια περαιτέρω ανάπτυξη της ιδεολογίας των αρχείων MIDI. Γνωστές ως "μονάδες αναπαραγωγής", αποθηκεύουν όχι μόνο "ηλεκτρονικές παρτιτούρες", αλλά και ψηφιοποιημένα δείγματα ήχου που χρησιμοποιούνται ως πρότυπα για μεμονωμένες νότες. Με αυτόν τον τρόπο επιτυγχάνεται η μονοσήμαντη αναπαραγωγή ήχου. Στα μειονεκτήματα της μορφής περιλαμβάνεται ο μεγάλος χρόνος που χρειάζεται για την υπέρθεση μοτίβων ταυτόχρονων νότων η μία πάνω στην άλλη.

Ο ψηφιακός ήχος, εκτός εάν πρόκειται για μουσική που μπορεί να κωδικοποιηθεί ως MIDI, είναι εξίσου δύσκολο να συμπιεστεί με μια εικόνα. Το ηχητικό σήμα σπάνια έχει πλεονασμό, π.χ. έχει επαναλαμβανόμενα τμήματα (κυρίως λόγω θορύβου). Αυτό σημαίνει ότι συμπιέζεται ελάχιστα χρησιμοποιώντας αλγόριθμους συμπίεσης χωρίς απώλειες παρόμοιους με τον LZW ή τη μέθοδο Huffman.

Το 1940, ο Χάρβεϊ Φλέτσερ, ένας εξαιρετικός Αμερικανός φυσικός, ο πατέρας του στερεοφωνικού ήχου, εισήχθη για έρευνα για την ανθρώπινη ακοή μεγάλο αριθμόθέματα. Ανέλυσε την εξάρτηση του απόλυτου ορίου ακοής από τη συχνότητα του σήματος, δηλ. σε ποιο πλάτος είναι ο ήχος ορισμένη συχνότηταδεν ακούγεται στον άνθρωπο. Στην καμπύλη που κατασκευάστηκε από πειράματα, οι μέγιστες τιμές είναι, όπως αναμενόταν, στα όρια του εύρους ακουστότητας (περίπου 20 Hz και πιο κοντά στα 20 kHz) και η ελάχιστη είναι περίπου 5 kHz. Αλλά το κύριο πράγμα στο οποίο έδωσε προσοχή ήταν η ικανότητα της ακοής να προσαρμόζεται στην εμφάνιση νέων ήχων, η οποία εκφράζεται σε αύξηση του ορίου της ακουστικότητας. Με άλλα λόγια, ορισμένοι ήχοι μπορούν να κάνουν άλλους μη ακούγονται, κάτι που ονομάζεται συγκάλυψη ενός ήχου με έναν άλλο.

Η τελευταία ιδιότητα της ακοής κατά τη συμπίεση επιτρέπει, μετά από ένα δυνατό ηχητικό σήμα, να μην αναπαράγεται καθόλου για κάποιο σύντομο χρονικό διάστημα, και επομένως να μην αποθηκεύεται κανένας ήχος. Για παράδειγμα, ένα δυνατό κλικ διάρκειας 0,1 δευτερολέπτων μπορεί να κρύψει τους επόμενους ήχους για 0,5 δευτερόλεπτα που δεν χρειάζεται να αποθηκευτούν. Η αναλογία συμπίεσης σε αυτό το παράδειγμα λέγεται ότι φτάνει και η διαδικασία συμπίεσης που περιγράφεται συνήθως ονομάζεται κάλυψη τομέα χρόνου.

Στο κάλυψη τομέα συχνότηταςένα ημιτονοειδές σήμα καλύπτει πιο αθόρυβα σήματα με κοντινή συχνότητα, συμπεριλαμβανομένων ημιτονοειδών σημάτων πολύ χαμηλότερου πλάτους. Είναι βολικό να χρησιμοποιήσετε τη διαίρεση του φάσματος σε ζώνες διαφορετικού πλάτους, με βάση τα χαρακτηριστικά της ακοής ενός ατόμου. Συνήθως υπάρχουν 27 λεγόμενες κρίσιμες ζώνες: 0η από 50 έως 95 Hz, 1η από 95 έως 140 Hz, ..., 26η από 20250 Hz και άνω.

Για την εκτέλεση του αλγόριθμου συμπίεσης, το αρχικό σήμα χωρίζεται σε πλαίσια, τα οποία υποβάλλονται σε ανάλυση συχνότητας. Ο αλγόριθμος συμπίεσης μοιάζει κάπως έτσι:

1. Χρησιμοποιώντας ειδικούς αλγόριθμους (μπορεί να είναι γρήγορος μετασχηματισμός Fourier ή παρόμοια), τα σήματα χωρίζονται σε 32 ίσες ζώνες φάσματος και πολλές κρίσιμες ζώνες μπορούν να πέσουν σε μια προκύπτουσα ζώνη ταυτόχρονα.

2. Χρησιμοποιώντας το λεγόμενο ψυχοακουστικό μοντέλο (το οποίο, κατά κανόνα, περιλαμβάνει κάλυψη συχνότητας), καθορίστε το επίπεδο κάλυψης των γειτονικών ζωνών.

3. Το επίπεδο στη ζώνη που δεν υπερβαίνει το υπολογιζόμενο όριο θεωρείται ίσο με μηδέν και δεν αποθηκεύεται. Αντίθετα, το επίπεδο χωρίς μάσκα εγγράφεται στα δεδομένα εξόδου.


Στη συνέχεια, ένας ορισμένος αριθμός bit εκχωρείται σε κάθε επίπεδο που δεν είναι μηδενικό, επαρκές για την κατά προσέγγιση αναπαράστασή του. Έτσι, σε εκείνο το τμήμα του φάσματος όπου το ανθρώπινο αυτί έχει το χαμηλότερο ουδό ακοής, οι πληροφορίες κωδικοποιούνται με δεκαέξι bits και στις άκρες, όπου το αυτί είναι λιγότερο ευαίσθητο στην παραμόρφωση, με έξι ή λιγότερα bits. Για παράδειγμα, ο αλγόριθμος συμπίεσης Huffman μπορεί να εφαρμοστεί στη ροή bit που προκύπτει.

Υπάρχουν τρεις εκδόσεις του αλγορίθμου που περιγράφεται από τη συμπίεση ήχου MPEG. Σε κάθε έκδοση, τα δεδομένα χωρίζονται σε πλαίσια, δηλ. ένα μόνο πλαίσιο αποτελείται από 32 λωρίδες των 12 τιμών η καθεμία.

Στο επίπεδο MPEG1 (κυριολεκτικά "στρώμα 1") το φίλτρο συχνότητας χρησιμοποιεί ένα μόνο πλαίσιο και αλγόριθμους που βασίζονται σε διακριτό μετασχηματισμό συνημιτόνου (DCT). Το ψυχοακουστικό μοντέλο περιλαμβάνει μόνο κάλυψη συχνότητας. Ο αλγόριθμος επιτρέπει τη συσκευασία σε αναλογία 1:4 με ροή 384 Kbps.

Το MPEG layer2 χρησιμοποιεί τρία καρέ στο φίλτρο συχνότητας (προηγούμενο, τρέχον και επόμενο) για συνολικά 32 ζώνες 12 τιμών σε 3 καρέ. Το μοντέλο χρησιμοποιεί επίσης προσωρινή κάλυψη. Συσκευασίες με αναλογία από 1:6 έως 1:8.

Συμπίεση ήχου (συμπίεση ήχου) - ένας τύπος συμπίεσης δεδομένων, κωδικοποίησης, που χρησιμοποιείται για τη μείωση του μεγέθους των αρχείων ήχου ή για τη μείωση του εύρους ζώνης για ροή ήχου. Οι αλγόριθμοι συμπίεσης αρχείων ήχου υλοποιούνται στο προγράμματα υπολογιστώναχ, που ονομάζονται κωδικοποιητές ήχου. Η εφεύρεση ειδικών αλγορίθμων για τη συμπίεση δεδομένων ήχου έχει ως κίνητρο το γεγονός ότι γενικούς αλγόριθμουςΗ συμπίεση είναι αναποτελεσματική για την εργασία με ήχο και καθιστά αδύνατη την εργασία σε πραγματικό χρόνο.

Όπως και στη γενική περίπτωση, υπάρχουν συμπιέσεις ήχου χωρίς απώλειες, κάτι που κάνει πιθανή αποκατάστασηπρωτότυπα δεδομένα χωρίς παραμόρφωση και συμπίεση με απώλειες, στα οποία μια τέτοια αποκατάσταση είναι αδύνατη. Οι αλγόριθμοι συμπίεσης με απώλειες παρέχουν υψηλό βαθμό συμπίεσης, για παράδειγμα, ένα CD ήχου δεν μπορεί να χωρέσει περισσότερο από μία ώρα "ασυμπίεστης" μουσικής με συμπίεση χωρίς απώλειες, ένα CD μπορεί να κρατήσει σχεδόν 2 ώρες μουσικής και με συμπίεση με απώλειες κατά μέσο όρο bitrate - 7-10 ώρες.

Συμπίεση χωρίς απώλειες

Η δυσκολία με τη συμπίεση ήχου χωρίς απώλειες είναι ότι οι ηχογραφήσεις είναι εξαιρετικά περίπλοκες στη δομή τους. Μια μέθοδος συμπίεσης είναι να βρείτε μοτίβα και να τα επαναλάβετε, αλλά αυτή η μέθοδος δεν είναι αποτελεσματική για πιο χαοτικά δεδομένα, όπως ψηφιοποιημένο ήχο ή φωτογραφίες. Είναι ενδιαφέρον ότι, ενώ τα γραφικά που δημιουργούνται από υπολογιστή είναι πολύ πιο εύκολο να συμπιεστούν χωρίς απώλεια, ο συνθετικός ήχος δεν έχει κανένα πλεονέκτημα από αυτή την άποψη. Αυτό συμβαίνει επειδή ακόμη και ο ήχος που δημιουργείται από υπολογιστή είναι συνήθως πολύ πολύπλοκο σχήμα, που αποτελεί πρόκληση για την εφεύρεση ενός αλγορίθμου.

Μια άλλη δυσκολία είναι ότι ο ήχος αλλάζει συνήθως πολύ γρήγορα και αυτός είναι επίσης ο λόγος που οι διατεταγμένες ακολουθίες byte εμφανίζονται πολύ σπάνια.

Οι πιο συνηθισμένες μορφές συμπίεσης χωρίς απώλειες είναι:
Δωρεάν Lossless Audio Codec (FLAC), Apple Lossless, MPEG-4 ALS, Monkey's Audio και TTA.

Συμπίεση με απώλεια

Η συμπίεση με απώλεια έχει εξαιρετικά ευρείες εφαρμογές. Εκτός από τα προγράμματα υπολογιστών, η συμπίεση με απώλειες χρησιμοποιείται στη ροή ήχου DVD, ψηφιακή τηλεόρασηκαι το ραδιόφωνο και ροή πολυμέσωνστο Διαδίκτυο.

Η καινοτομία αυτής της μεθόδου συμπίεσης ήταν η χρήση ψυχοακουστικής για την ανίχνευση ηχητικών στοιχείων που δεν γίνονται αντιληπτά από το ανθρώπινο αυτί. Ένα παράδειγμα θα ήταν είτε οι υψηλές συχνότητες, οι οποίες γίνονται αντιληπτές μόνο όταν η ισχύς τους είναι επαρκής, είτε ήσυχοι ήχοι, που εμφανίζεται ταυτόχρονα ή αμέσως μετά δυνατούς ήχουςκαι επομένως καλύπτονται από αυτά - τέτοια εξαρτήματα ήχου μπορούν να μεταδοθούν με μικρότερη ακρίβεια ή να μην μεταδοθούν καθόλου.

Για την υλοποίηση της κάλυψης, το σήμα από μια χρονική ακολουθία δειγμάτων πλάτους μετατρέπεται σε μια ακολουθία φασμάτων ήχου, στην οποία κάθε στοιχείο φάσματος κωδικοποιείται χωριστά. Για να πραγματοποιηθεί ένας τέτοιος μετασχηματισμός, χρησιμοποιούνται οι μέθοδοι γρήγορου μετασχηματισμού Fourier, MDCT, φίλτρα τετραγωνικού καθρέφτη ή άλλες. Ο συνολικός όγκος πληροφοριών κατά τη διάρκεια αυτής της επανακωδικοποίησης παραμένει αμετάβλητος. Η συμπίεση σε έναν συγκεκριμένο τομέα συχνότητας μπορεί να σημαίνει ότι τα καλυμμένα ή μηδενικά στοιχεία δεν αποθηκεύονται καθόλου ή κωδικοποιούνται σε χαμηλότερη ανάλυση. Για παράδειγμα, στοιχεία συχνότητας έως 200 Hz και άνω των 14 kHz μπορούν να κωδικοποιηθούν στα 4 bit, ενώ τα στοιχεία στο μεσαίο εύρος κωδικοποιούνται στα 16 bit. Το αποτέλεσμα μιας τέτοιας λειτουργίας θα είναι κωδικοποίηση με μέσο βάθος bit 8 bit, αλλά το αποτέλεσμα θα είναι σημαντικά καλύτερο από ό,τι όταν κωδικοποιείται ολόκληρο το εύρος συχνοτήτων με bit 8 bit. Ωστόσο, είναι προφανές ότι θραύσματα του φάσματος που έχουν επανακωδικοποιηθεί με χαμηλή ανάλυση δεν μπορούν πλέον να αποκατασταθούν ακριβώς, και έτσι χάνονται για πάντα.
Η κύρια παράμετρος της συμπίεσης με απώλειες είναι το bitrate, το οποίο καθορίζει τον βαθμό συμπίεσης του αρχείου και, κατά συνέπεια, την ποιότητα. Υπάρχουν συμπιέσεις με σταθερό bitrate (eng. Σταθερός ρυθμός μετάδοσης bit- CBR), μεταβλητός ρυθμός bit (Αγγλικά) Μεταβλητός ρυθμός μετάδοσης δεδομένων- VBR) και μέσο όρο του bitrate (eng. Μέσος Ρυθμός Bit- ABR).

Οι πιο κοινές μορφές συμπίεσης με απώλειες είναι: AAC, ADPCM, ATRAC, Dolby AC-3, MP2, MP3, Musepack Ogg Vorbis, WMA και άλλες.

3.2. Mp3 - τεχνολογία συμπίεσης ήχου

Το ίδιο το όνομα MP3 εμφανίστηκε ως αποτέλεσμα της συντομογραφίας MPEG-1 Layer3.

Το MPEG (Motion Pictures Expert Group) είναι μια ομάδα υπό τον Διεθνή Οργανισμό Τυποποίησης και τη Διεθνή Επιτροπή Ηλεκτρολογίας που αναπτύσσει πρότυπα για ψηφιακή συμπίεση πληροφοριών βίντεο και ήχου. Γιατί να συμπιέσετε αυτές τις πληροφορίες; Πρώτον, για εξοικονόμηση οικονομικών και υλικών πόρων κατά τη μετάδοση πληροφοριών από απόσταση μέσω καναλιών επικοινωνίας (συμπεριλαμβανομένου του δορυφόρου) και, δεύτερον, για την αποθήκευση τους.

Το πρότυπο MPEG-1 έλαβε επίσημη έγκριση το 1992, αλλά μέχρι πρόσφατα η ανακάλυψη δεν ήταν σε πλήρη ζήτηση. Μόνο με την έλευση του αρκετά ισχυρού Επεξεργαστές Pentium(Με συχνότητες ρολογιούαπό 300 MHz και άνω, γεγονός που μπορεί να μειώσει δραματικά το χρόνο για κωδικοποίηση/αποκωδικοποίηση σήματος) και μόντεμ υψηλής ταχύτητας, το πρότυπο έχει κερδίσει ευρεία αναγνώριση.

Το πρότυπο MPEG-1 είναι μορφή ροής και αποτελείται από ήχο, βίντεο και εξαρτήματα συστήματος. Τελευταίο μέροςπεριέχει πληροφορίες σχετικά με το συνδυασμό και το συγχρονισμό των δύο πρώτων.

Η μετάδοση δεδομένων λαμβάνει χώρα σε μια ροή ανεξάρτητων ξεχωριστών μπλοκ δεδομένων - πλαισίων, που λαμβάνονται με «κόψιμο» σε τμήματα ίσης διάρκειας, τα οποία κωδικοποιούνται ανεξάρτητα το ένα από το άλλο.

Επί του παρόντος υπάρχουν πέντε τύποι (αριθμοί) προτύπων MPEG:

1) MPEG1 - συμπίεση ήχου και βίντεο με συνολική ταχύτηταέως 150 KB/sec (ήχος 38, 44,1, 48 kilohertz).

2) MPEG2 - συμπίεση ήχου και εικόνας με συνολική ταχύτητα έως 300 Kb/sec (ήχος 38, 44,1, 48 kilohertz), η συμπίεση ήχου είναι ΙΔΙΑΙΤΙΑ με το MPEG1.

3) MPEG2.5 - συμπίεση ήχου με μειωμένη ανάλυση (ήχος 16.22.05.24 kilohertz). Είναι ενδιαφέρον να σημειωθεί ότι το πρότυπο MPEG2.5 (επίσης γνωστό ως MPEG2 LSF - LOW SAPLE FREQUENCY - χαμηλή συχνότητασάρωση ήχου) που εισήχθη από το IIS Fraunhofer (ινστιτούτο πληροφορικήςπήρε το όνομά του από τον Fraunhofer από τη Γερμανία). Αυτό το πρότυπο είναι μια επέκταση του "καθαρού" ήχου MPEG2 (δηλαδή MPEG1!) σε ρυθμό σάρωσης ήχου στο ήμισυ του κανονικού ρυθμού.

4) MPEG3 - πολυκαναλικό MPEG1+MPEG2. Αυτό το πρότυπο πρακτικά δεν χρησιμοποιείται.

5) Το MPEG4 είναι ένα νέο πρότυπο στο εξωτερικό. Το χαρακτηριστικό του: μπορεί να χωρέσει έως και 8 κανάλια ήχου (δηλαδή AC-3 - ψηφιακή επέκτασηΣυστήματα Surround.

Όσο υψηλότερος είναι ο δείκτης επιπέδου, τόσο υψηλότερη είναι η πολυπλοκότητα και η απόδοση του αλγορίθμου κωδικοποίησης ανάλογα, οι απαιτήσεις για πόρους του συστήματος.

Εδώ, ο όρος "κωδικοποίηση" αναφέρεται σε μια διαδικασία που σας επιτρέπει να λαμβάνετε ένα αρχείο σε συμπιεσμένη μορφή, η οποία καταλαμβάνει λιγότερο χώρο στο δίσκο και, κατά συνέπεια, μεταδίδεται ταχύτερα μέσω καναλιών επικοινωνίας. Το αρχείο δεν μπορεί να χρησιμοποιηθεί στη συμπιεσμένη του μορφή, επομένως πρέπει να αποκωδικοποιηθεί πριν από τη χρήση. Η συμπίεση αρχείων δεν συμβαίνει πάντα με θετικό αποτέλεσμα. Το αποτέλεσμα εξαρτάται άμεσα από τη μέθοδο συμπίεσης και από τα περιεχόμενα του ίδιου του αρχείου.

Η αρχή της κωδικοποίησης σήματος στο MPEG Audio βασίζεται στη χρήση του ψυχο-ακουστικού μοντέλου, η ουσία του οποίου είναι η εξής.

Υπάρχουν ένας αριθμός συχνότητες ήχου, που το ανθρώπινο αυτί δεν μπορεί να αντιληφθεί. Μερικοί ήχοι καλύπτονται από άλλους, τόσο με μεγαλύτερο πλάτος όσο και με παρόμοια συχνότητα. Έτσι, για παράδειγμα, εάν εκπέμπεται ένας δυνατός ήχος με συχνότητα 1000 Hz (απόκρυψη), τότε ένας πιο αδύναμος ήχος με συχνότητα 1100 Hz (απόκρυψη) δεν θα ανιχνευθεί από το ανθρώπινο αυτί λόγω των χαρακτηριστικών του ορίου ακοής του ανθρώπινου αυτιού. Το κατώφλι ακοής στα άκρα του εύρους συχνοτήτων (16-20 Hz και 16-20 kHz) αυξάνεται σημαντικά, επειδή Σε αυτές τις συχνότητες, η ακοή έχει σημαντικά χαμηλότερη ευαισθησία σε σύγκριση με την περιοχή της μεγαλύτερης ευαισθησίας της ακοής (εύρος 1-5 kHz). Είναι επίσης γνωστό ότι ο χρόνος ανάκτησης της ευαισθησίας ακοής μετά από ένα δυνατό σήμα είναι περίπου 100 ms και ο χρόνος καθυστέρησης για την αντίληψη του ίδιου σήματος είναι περίπου 5 ms.

Έτσι, μεταδίδεται μόνο εκείνη η ηχητική πληροφορία που μπορεί να γίνει επαρκώς αντιληπτή από τη συντριπτική πλειοψηφία των ακροατών, και όλα τα υπόλοιπα, δυστυχώς, χάνονται ανεπανόρθωτα.

Όπως ήδη αναφέρθηκε, όλα τα επίπεδα έχουν το ίδιο βασική δομή, στο οποίο ο κωδικοποιητής αναλύει το αρχικό σήμα, υπολογίζει μια τράπεζα φίλτρων για αυτό (32 ζώνες) και εφαρμόζει ένα ψυχοακουστικό μοντέλο. Με μια προεπιλεγμένη συχνότητα κβαντισμού, ρυθμό ροής και τιμή κάλυψης, ο κωδικοποιητής κβαντίζει και κωδικοποιεί το σήμα.

Συγκριτικά χαρακτηριστικάΟι μέθοδοι κωδικοποίησης για ένα κανάλι σε συχνότητα κβαντισμού 32 kHz παρουσιάζονται στον Πίνακα 2.

Πίνακας 2.

Μέθοδος κωδικοποίησης Ρυθμός Baud (kbps) Αναλογία Συμπίεσης
Στρώμα 1 192 1:4
Στρώμα 2 128-96 1:6...8
Στρώμα 3 64-56 1:10...12

Πριν από την κωδικοποίηση, το σήμα πηγής χωρίζεται σε πλαίσια, καθένα από τα οποία κωδικοποιείται χωριστά με διαφορετικές παραμέτρους και τοποθετείται στο τελικό αρχείο ανεξάρτητα από τα άλλα. Η σειρά αναπαραγωγής καθορίζεται από τη σειρά των καρέ. Όλες οι πληροφορίες σχετικά με ένα πλαίσιο περιέχονται στην κεφαλίδα του και οι πληροφορίες σχετικά με τα πλαίσια περιέχονται στην κεφαλίδα του αρχείου. Για πληροφορίες σχετικά με τον καλλιτέχνη, το άλμπουμ, τον τίτλο του τραγουδιού, το είδος κ.λπ., παρέχεται μια κεφαλίδα ετικέτας ID3/ID2. Η συντριπτική πλειοψηφία των υπαρχόντων παικτών χρησιμοποιεί αυτόν τον τίτλογια κύλιση σε αυτές τις πληροφορίες ενώ παίζει ένα μουσικό κομμάτι.

Μεταξύ των πλαισίων μπορεί να υπάρχουν αυθαίρετες πληροφορίες, για παράδειγμα, πνευματικά δικαιώματα, που βρίσκονται σε ομοιόμορφο επίπεδο σε όλο το αρχείο. Η κύρια απαίτηση για τα διαδοχικά καρέ είναι να μην υπάρχει αντιστοιχία με την υπογραφή της αρχής του καρέ.

Η συχνότητα των καρέ ονομάζεται bitrate (BIT RATE - bit rate, όσο μεγαλύτερη είναι, τόσο πιο κοντά θα είναι το τελικό αποτέλεσμα στο αρχικό).

Κάθε bitrate έχει τη δική του περιοχή εφαρμογής. Για να δημιουργήσετε ένα αντίγραφο υψηλής ποιότητας που ταιριάζει με την ποιότητα του πρωτοτύπου, χρησιμοποιούνται μόνο υψηλοί ρυθμοί bit περίπου 256 kbit/s. Σε bitrate ποιότητα 128 kbps τελικό προϊόνφαίνεται αρκετά φυσιολογικό, αλλά πολλοί άνθρωποι είναι ήδη σε θέση να παρατηρήσουν τη διαφορά μεταξύ του αντιγράφου και του πρωτοτύπου. Το Διαδίκτυο περιέχει τις περισσότερες φορές αρχεία MP3 κωδικοποιημένα με ρυθμό μετάδοσης bit 128 kbit/s. Αλλά για να δημιουργήσετε ένα αντίγραφο πραγματικά υψηλής ποιότητας, πρέπει να χρησιμοποιήσετε ταχύτητα κωδικοποίησης 320 kbps, αν και το τελικό αρχείο είναι μόνο 4,3 φορές μικρότερο σε σύγκριση με 10,8 φορές στα 128 kbps και 5,4 φορές στα 256 kbps. Επομένως, πρέπει να επιλέξετε μόνοι σας το bitrate, με βάση τις ανάγκες σας.

Μετά τη σήμανση πλαισίου, το αρχικό σήμα χωρίζεται σε εξαρτήματα που αντιπροσωπεύουν μεμονωμένα εύρη συχνοτήτων, δίνοντας συνολικά το επεξεργασμένο σήμα. Για κάθε τέτοιο εύρος, προσδιορίζονται το δικό του ψυχοακουστικό μοντέλο και τμήματα πλαισίου που «πέφτουν έξω» από τη διαδικασία κωδικοποίησης. Για τα υπόλοιπα δεδομένα, προσδιορίζεται η μέγιστη επιτρεπόμενη συχνότητα κβαντισμού, η οποία θα πρέπει να διασφαλίζει απώλειες κάτω από την τιμή του φαινομένου κάλυψης.

Μετά την επεξεργασία όλων των πλαισίων, δημιουργείται μια τελική ροή, η οποία κωδικοποιείται επιπλέον με τη μέθοδο Huffman. Αυτός ο αλγόριθμος χρησιμοποιείται επίσης στον αρχειοθέτη ARJ, αλλά με έναν δυναμικό, συνεχώς μεταβαλλόμενο πίνακα Huffman, ο οποίος απαιτεί δύο περάσματα από τα δεδομένα. με έναν σταθερό πίνακα Layer 3, η συμπίεση πραγματοποιείται σε ένα πέρασμα. Αυτή η μέθοδος σάς επιτρέπει να "συμπιέσετε" έως και το 20 τοις εκατό του συνολικού όγκου. Το αποτέλεσμα είναι μια τελική ροή κωδικοποιημένων δεδομένων ήχου.


Μαζί μου" με την απλή άτεχνη μελωδία του Γκλίνκα, που ακούγεται από τον Γκριμπόεντοφ, και μια πιο σύνθετη δραματική λύση στο ειδύλλιο - το ανατολίτικο ποίημα του Ραχμανίνοφ, γεμάτο ελεγειακή μελαγχολία και μοναξιά. Το μιούζικαλ Πούσκιν του 20ου αιώνα είναι επίσης πολύ εκτενές και ενδιαφέρον. Ανάμεσα στα σημαντικότερα έργα είναι τα μπαλέτα «Copper Horman» του Gliere, ένα από τα κύρια θέματα των οποίων έγινε πραγματικά «ένας ύμνος στον μεγάλο...

Τραγούδια, ανέκδοτα, ρίμες για το παίξιμο μουσικών οργάνων. για νοριολοποίηση της προσωδιακής πλευράς του λόγου κατά τον αυτοσχεδιασμό μελωδικών και ρυθμικών τραγουδιών. Όταν εργάζεστε με μαθητές πρωτοβάθμιας εκπαίδευσης στη σωφρονιστική και αναπτυξιακή εκπαίδευση, μόνο τα περισσότερα απλά εργαλεία. Πρόκειται για μουσικά όργανα της ομάδας κρουστών ως αμιγώς ρυθμικά, χωρίς συγκεκριμένο ύψος...

Οι ηθικές ιδιότητες της προσωπικότητας ενός παιδιού θέτουν τα αρχικά θεμέλια για τη γενική κουλτούρα του μελλοντικού ανθρώπου. II. Παιδαγωγικές προϋποθέσεις για την υλοποίηση των δραστηριοτήτων των παιδιών σε νηπιαγωγείο 2.1 Μέθοδοι μουσικής εκπαίδευσης στο νηπιαγωγείο Ο κύριος τύπος μουσικής δραστηριότητας, που παίζει πρωταγωνιστικό ρόλο στην υλοποίηση της γνωστικής και επικοινωνιακής λειτουργίας της μουσικής, είναι η αντίληψή της...

Εργαστείτε μουσικό κομμάτι, επίπεδο συναισθηματικών και συμπεριφορικών διαταραχών. 2. Ιδιαιτερότητες της μουσικής εργασίας σε ορφανοτροφείο για ορφανά με νοητική υστέρηση και παιδιά που στερούνται γονικής μέριμνας Η επίλυση των προβλημάτων της μουσικής εκπαίδευσης βοηθά στη χρήση διαφόρων μορφών οργάνωσης μουσικής δραστηριότητας, καθεμία από τις οποίες έχει ορισμένες δυνατότητες (βλ. διάγραμμα). ...

1. Μια προφανής τεχνική συμπίεσης που μπορεί να εφαρμοστεί στον λόγο είναι η αφαίρεση των παύσεων, ᴛ.ᴇ. Αντί να χρησιμοποιηθούν 44.100 δείγματα μηδενικής αξίας για την εγγραφή κάθε δευτερολέπτου σιωπής (ρυθμός δειγματοληψίας 44,1 kHz), η διάρκεια της παύσης προσδιορίζεται απλώς - ϶ᴛᴏ συμπίεση χωρίς απώλειες.

2. Αν το πλάτος του ήχου δεν φτάσει στο μέγιστο επίπεδο που μπορεί να φανταστεί κανείς όταν δεδομένου μεγέθουςδείγματα, η κωδικοποίηση Huffman (Hoffman) θα πρέπει να είναι αποτελεσματική. Σε αυτή την περίπτωση, το σήμα αντιπροσωπεύεται από δείγματα μικρότερο μέγεθος. Αυτός είναι ένας αλγόριθμος συμπίεσης χωρίς απώλειες - απλώς ειδική περίπτωσησυμπίεση.

3. Η τεχνική companding (expansion) έχει συμβάλει επίσης στις τεχνολογίες συμπίεσης ομιλίας. Βασίζεται στην ανθρώπινη αντίληψη διαφορετικά επίπεδαόγκο και αποτελείται από τη χρήση μη γραμμικών επιπέδων κβαντισμού. Αν η απόσταση μεταξύ των υψηλότερων επιπέδων μεγαλύτερη απόστασημεταξύ των χαμηλών, τότε οι ήσυχοι ήχοι παρουσιάζονται με περισσότερες λεπτομέρειες από τους δυνατούς.

4. Μια άλλη τεχνική συμπίεσης είναι η διαμόρφωση κώδικα διαφορικού παλμού. Αυτό το σχήμα σχετίζεται με τη συμπίεση μεταξύ των πλαισίων και βασίζεται στην καταγραφή των διαφορών διαδοχικών δειγμάτων και όχι στις απόλυτες τιμές τους.

5. Η αποτελεσματική συμπίεση με απώλειες συνίσταται στον εντοπισμό δεδομένων που δεν είναι σημαντικά (ᴛ.ᴇ. δεν επηρεάζει την αντίληψη του σήματος) και την απόρριψή τους. Εάν το ηχητικό σήμα ψηφιοποιηθεί με απλό τρόπο (σε υπολογιστή), ενδέχεται να συμπεριληφθούν στην ψηφιοποιημένη έκδοση δεδομένα που αντιστοιχούν σε μη ακουστικούς ήχους. Αυτό εξηγείται από το γεγονός ότι το σήμα καταγράφει όλες τις φυσικές διακυμάνσεις της πίεσης του αέρα που προκαλούν ήχο, αλλά η αντίληψη του ήχου είναι ευθύνη του εγκεφάλου, ο οποίος (μαζί με το αυτί) δεν αντιδρά τόσο εύκολα στα ηχητικά κύματα.

Ο ήχος χρησιμοποιείται συχνά ως μέρος μιας παραγωγής βίντεο ή κινουμένων σχεδίων. Σε αυτή την περίπτωση, είναι απαραίτητος ο συγχρονισμός ήχου και εικόνας. Για την επίλυση αυτού του προβλήματος, χρησιμοποιείται μια γραμμή χρόνου για την οργάνωση ήχου και βίντεο σε ορισμένες εφαρμογές επεξεργασίας βίντεο, όπως το Final Cut Pro. Μελετώντας τα σήματα, ο επεξεργαστής μπορεί να προσδιορίσει σημεία ελέγχουηχητικό κομμάτι (η αρχή των συλλαβών ή των τονισμένων γραμμών στη μουσική), κατά μήκος του οποίου χτίζονται κατάλληλες εικόνες.

Υπάρχουν δύο τρόποι δημιουργίας κινούμενων εικόνων σε ψηφιακή μορφή για προϊόντα πολυμέσων.

Πρώτα απ 'όλα, χρησιμοποιώντας μια βιντεοκάμερα μπορείτε να εγγράψετε μια ακολουθία καρέ πραγματική κίνησηστον πραγματικό κόσμο.

Δεύτερον, μπορείτε να δημιουργήσετε όλα τα καρέ ξεχωριστά, είτε χρησιμοποιώντας υπολογιστή είτε εγγράφοντας σταθερές εικόνες μία κάθε φορά.

Στην πρώτη περίπτωση θα δημιουργήσουμε βίντεοκαι στο δεύτερο - εμψύχωση.

Ακολουθία βίντεοαποτελείται από ένα σύνολο πλαισίων, καθένα από τα οποία είναι μια ξεχωριστή εικόνα.

n Πιστεύεται ότι για επαρκή μετάδοση πρωτότυπη εικόναΑπαιτούνται 16 εκατομμύρια αποχρώσεις και επομένως χρησιμοποιείται μια μορφή αποθήκευσης έγχρωμης εικόνας 24 bit. Εάν το μέγεθος της εικόνας είναι 640 pixel (πλάτος) επί 480 pixel (ύψος) και το βάθος χρώματος είναι 24 bit, τότε κάθε καρέ θα απαιτεί 640x480x3=900 KB.

n Εγγραφή μιας ακολουθίας καρέ σε ψηφιακή μορφήαπαιτεί από τον υπολογιστή μεγάλους όγκουςεξωτερική μνήμη. Ένα δευτερόλεπτο ασυμπίεστου βίντεο Πρότυπο NTSC(Βόρεια Αμερική, Ιαπωνία) περιέχει 30 καρέ. Κάθε δευτερόλεπτο βίντεο θα απαιτεί περισσότερα από 26 MB μνήμης. Και για το πρότυπο βίντεο PAL (Δυτική Ευρώπη και Αυστραλία, 24 καρέ), χρειάζονται 21 MB μνήμης για την εγγραφή ενός δευτερολέπτου και 1,25 GB για ένα λεπτό.

n Αλλά δεν αρκεί απλώς να θυμάστε τη σειρά των καρέ, πρέπει επίσης να εμφανίζεται στην οθόνη με τον κατάλληλο ρυθμό. Καμία από τις υπάρχουσες εξωτερικές συσκευές αποθήκευσης δεν έχει παρόμοια ταχύτητα μεταφοράς πληροφοριών - περίπου 30 MB/s. Με τέτοιους αριθμούς, η εγγραφή (αναπαραγωγή) βίντεο σε CD, DVD και η μετάδοση μέσω δικτύων είναι προβληματική. Η εγγραφή βίντεο είναι δυνατή για στούντιο βίντεο και τηλεόρασης.

n Για να μειωθεί ο όγκος των δεδομένων, απαιτούνται σχήματα συμπίεσης βίντεο, καθώς και η χρήση άλλων μεθόδων.

Για να εμφανίσετε ψηφιοποιημένο βίντεο σε οθόνη υπολογιστή, πρέπει να μειώσετε την ποσότητα των μεταδιδόμενων δεδομένων, κάτι που επιτυγχάνεται χρησιμοποιώντας:

n εμφάνιση της μικρογραφίας εικόνας μικρό παράθυρο

n μείωση του ρυθμού καρέ σε 10-15 καρέ/δευτ

n μείωση του αριθμού των bit/pixel

Αυτό έχει ως αποτέλεσμα κακή ποιότητα εικόνας.

Υπάρχουν διάφορες μορφές βίντεο: WMA, ASF, RM, SWF, DVC, VOB, αλλά χρησιμοποιούνται σπάνια, καθώς είτε έχουν σοβαρά μειονεκτήματα είτε είναι ελάχιστα συμβατά με τα συμβατικά εργαλεία δημιουργίας εφαρμογές πολυμέσων(αλλά μπορεί να μετατραπεί σε άλλη μορφή χρησιμοποιώντας οποιοδήποτε πρόγραμμα επεξεργασίας βίντεο).

n Οι πιο κοινές μορφές είναι οι AVI και MPEG.

n Audio Video Interleaved (AVI)– «εγγενής» μορφή για Windows Media από τη Microsoft. Σύστημα Windowsχρησιμοποιεί έναν πατενταρισμένο κωδικοποιητή. Κατά την εγγραφή σε αυτή τη μορφήΧρησιμοποιούνται αρκετοί διαφορετικοί αλγόριθμοι συμπίεσης βίντεο. Μεταξύ αυτών: Cinepak, Indeo video, Motion-JPEG (M-JPEG) κ.λπ.
Δημοσιεύτηκε στο ref.rf
Αλλά μόνο το M-JPEG αναγνωρίστηκε μεταξύ τους ως

διεθνές πρότυπογια συμπίεση βίντεο. Αρχικά, οι δυνατότητες της σουίτας λογισμικού Video χρησιμοποιήθηκαν για τη λήψη και την αναπαραγωγή βίντεο για Windows, που αναπτύχθηκε από τη Microsoft, αλλά τώρα ο χρήστης έχει για αυτό καλύτερες ευκαιρίες. Ένα αρχείο AVI δεν μπορεί να είναι μεγαλύτερο από 2 GB. Συνειδητοποιώντας αυτό, εταιρεία Microsoftανακοίνωσε την ανάπτυξη νέων μορφών που έχουν σχεδιαστεί για να αντικαταστήσουν τη μορφή AVI:

n Ο Α.Σ.Φ.(Προηγμένη μορφή κραυγών)

n AAF(Προηγμένη μορφή συγγραφής)

Η υποστήριξη για αυτές τις μορφές ξεκίνησε το 1999. Συγχρόνως παλιάς μορφήςΧρησιμοποιείται επίσης AVI και υπάρχουν εργαλεία για τη μετατροπή αυτών των μορφών.

Η μορφή AVI δεν είναι μόνο βίντεο, αλλά και ήχος συγχρονισμένος με αυτό. Συνήθως το στοιχείο ήχου ονομάζεται soundtrack ή ηχητικό κομμάτι. Για AVI, αυτός είναι ήχος σε μορφή WAV. Σε οποιοδήποτε πρόγραμμα επεξεργασίας βίντεο μπορείτε να επιλέξετε ηχητική ζώνη ταινίας, αποθήκευση ως αρχείο ήχου, επεξεργασία επεξεργαστής ήχου

n Windows Media Video (WMV)νέα μορφήβίντεο από τη Microsoft, το οποίο αντικαθιστά Μορφή AVI. Βασίζεται σε Windows Video Codec, που αναπτύχθηκε με βάση το πρότυπο MPEG-4.

n Ταινία Quick Time (MOV)– η πιο κοινή μορφή για εγγραφή και αναπαραγωγή βίντεο, που αναπτύχθηκε από την Apple για υπολογιστές Macintoshστην τεχνολογία QuickTime . Περιλαμβάνει υποστήριξη όχι μόνο για βίντεο, αλλά και για ήχο, κείμενο, ροές MPEG, ένα εκτεταμένο σύνολο εντολών MIDI, διανυσματικά γραφικά, πανοράματα και αντικείμενα (QT VR) και τρισδιάστατα μοντέλα. Υποστηρίζει πολλαπλά διάφορες μορφέςσυμπίεση βίντεο, συμπ. MPEG και Indeo, καθώς και τη δική του μέθοδο συμπίεσης.

n MPEG (MPG, MPEG) είναι μια μορφή εγγραφής και αναπαραγωγής βίντεο, που αναπτύχθηκε το 1992. Ομάδα ειδικών κινούμενων εικόνων (MPEG). Σχεδιασμένο για τη συμπίεση αρχείων ήχου και βίντεο για λήψη ή αποστολή, για παράδειγμα, μέσω Διαδικτύου.

MPEG-4– ένα πρότυπο που περιγράφει τους κανόνες για την κωδικοποίηση ψηφιακών πληροφοριών πολυμέσων. Κατά την ανάπτυξη αυτό το πρότυποΗ κύρια εστίαση ήταν στη δυνατότητα συμπίεσης δεδομένων βίντεο πολύ περισσότερο από ό,τι προβλέπεται, για παράδειγμα, από το πρότυπο MPEG-2. Αυτό επιτρέπει τη μεταφορά δεδομένων σε χαμηλές ταχύτητες, λιγότερο από 1 Mbit/s. Τέτοιες ταχύτητες είναι τυπικές για τους περισσότερους χρήστες του Διαδικτύου και αφορούν χρήστες κινητών ασύρματες συσκευές. Οι εγγραφές MPEG-4 είναι μικρότερες και σημαντικά φθηνότερες από τα αρχεία πολυμέσων που κωδικοποιούνται με MPEG-2. Επίσης, τα εργαλεία κωδικοποίησης και αποκωδικοποίησης MPEG-4 είναι απλούστερα