Sunet stereo sau surround. Ce este sunetul 3D? Procesare digitală a semnalului DSP

Vrei să obții calitate Sunet ambientalîn căști sau pe home theater complet gratuit? Citiți acest manual.

Cu fiecare nouă lansare (actualizare) sistem de operare Dezvoltatorii Windows 10 nu încetează să uimească utilizatorii cu diverse mini-funcții utile. Nu trebuie decât să mergeți la orice parametri ai sistemului, dispozitive, personalizare, confidențialitate etc., cu siguranță veți găsi setări care la prima vedere nu sunt foarte vizibile, dar foarte utile.

Și indiferent cine o spune, Microsoft își dezvoltă sistemul de operare, în primul rând, pentru tine și pentru mine. Toate aceste afirmații că ei colectează date confidențiale și ne spionează sunt o prostie!

Un utilizator competent va configura sistemul astfel încât transmisia informatie clasificata cealaltă parte va fi redusă la minimum. Dacă nu doriți să fie colectate date despre preferințele dvs., dezactivați această opțiune. Obosit de publicitate - blocați-i afișarea. frică de viruși și altele aplicații rău intenționate- utilizați software oficial, nu piratat!

Și, în sfârșit, dacă nu vă place Windows în sine, găsiți un înlocuitor în formă sau MacOS. Dar să nu mai vorbim despre asta acum!

Cea mai recentă actualizare de sistem vine cu o nouă funcție Spatial Sound. Dacă îl activezi, cu siguranță vei avea senzația că sunetul se aude în jurul tău, și nu prin căști. Pentru a spune puțin diferit, va fi 3D sau tridimensional.

După cum puteți vedea, Microsoft nu forțează această funcție asupra utilizatorului aici, deoarece este dezactivată în mod implicit. Și apoi vom afla cum să-l activăm.

SUNET AMBIENTAL

Windows 10 poate difuza sunet spațial folosind o combinație șofer special, aplicații și căști. Această tehnologie este concepută pentru a îmbunătăți calitatea sunetului, în primul rând, a căștilor dumneavoastră.

Pentru a-l activa aveți nevoie de:

  • faceți clic dreapta pe pictograma din bara de sistem și faceți clic pe „Dispozitive de redare”;
  • selectați „Difuzoare” și faceți clic pe butonul „Proprietăți”;
  • accesați fila „Spatial Sound” și selectați formatul acestuia din lista verticală (Windows Sonic sau Dolby Atmos pentru căști).

DOLBY ATMOS

Este o tehnologie de sunet surround pentru crearea de medii de sunet redate dinamic în timp real. Este nevoie de o aplicație specială din Magazin pentru a funcționa. Dacă selectați această opțiune și faceți clic pe butonul Aplicați, se va instala automat aplicația Dolby Access.

Un avantaj semnificativ al aplicației este că acceptă îmbunătățirea sunetului pentru home theater, dacă hardware-ul acceptă tehnologia Dolby.

Configurarea nu va forța utilizatorul să se adâncească în jungla parametrilor complecși. Pur și simplu selectați profilul corespunzător pe ecranul de pornire și aplicația va configura automat echipamentul.

WINDOWS SONIC

Permite audio spațial integrat pe Xbox și Windows, cu suport atât pentru semnale surround, cât și pentru înălțime. Audio va putea fi transmis fără a fi nevoie să schimbați codul.

Acum rezultatul! În cazul meu, chiar și cele mai simple și ieftine căști, atunci când au ales formatul Dolby Atmos, și-au schimbat sunetul, cu un ordin de mărime mai bun decât cel original. Ce s-a intamplat pentru tine? Astept raspunsul tau in comentarii.

Vă îndemn să aruncați o privire la . Grupul nostru de Facebook vă așteaptă.

Interesant articol pe tema „sunet surround”. Istorie, hardware, software, teorie, cap artificial, stereo, quad, 3D.

Orez. 1. Panoramă stereo


Cele mai multe dispozitive moderne, ieftine și nu foarte reproducătoare de sunet, inclusiv plăcile de sunet pentru computerele multimedia personale, vă permit să reproduceți sunetul în modul „Sunet 3D” sau „Surround”, care poate fi tradus ca „sunet surround”.

Ce este și pentru ce este? Sistemele de reproducere a sunetului surround au fost dezvoltate deoarece calitatea sunetului oferită de sistemele stereo convenționale sau de căștile nu mai era satisfăcătoare pentru ascultătorii exigenți. Cu toate că sisteme stereoși creați un efect de sunet spațial prin sintetizarea unei panorame de surse de sunet imaginare (ISS) între două difuzoare (Fig. 1), dar sunetul stereo are dezavantaj semnificativ. Panorama stereo este plată și limitată de unghiul dintre direcțiile către difuzoare. Un astfel de sunet este în mare parte lipsit de naturalețea inerentă a ceea ce se realizează într-un câmp sonor real, atunci când o persoană este capabilă să perceapă surse reale din aproape toate direcțiile, atât orizontale, cât și verticale, și să estimeze, deși uneori cu erori, distanța până la sunet. surse.

Se crede că percepția sunetelor din diferite direcții și distanțe este importantă nu numai ca un fapt al locației lor spațiale. Creează în ascultător o senzație de volum sonor (câmp sonor tridimensional), îmbogățește semnificativ timbrele instrumentelor muzicale și vocilor, restabilind procesul de reverberație caracteristic sălii primare (sala de concerte). Stereofonia convențională creează un efect de sunet spațial într-o zonă foarte limitată în fața ascultătorului, nu permite ca caracteristicile de percepție a sunetului menționate mai sus să fie dezvăluite pe deplin într-un câmp sonor real și, prin urmare, reduce calitatea sunetului.

De asemenea, sistemele cvadrafonice nu oferă o simulare completă a unui câmp sonor real. În primul rând, cu quadrafonie, nu se obține o panoramă stereo circulară - ascultătorul simte panorama stereo obișnuită în fața lui și panorama stereo din spate în spatele lui. În al doilea rând, toate sursele de sunet imaginare sunt situate în același plan și pe linia dintre difuzoare, adică. nu există adâncime și, de fapt, nu există sunet surround de dimensiunea 3 și tridimensional (Fig. 2).


Orez. 2. Panoramă quad

De asemenea, căștile stereo nu vă permit să obțineți un sunet natural din fonograma reprodusă. Ideea este că impresia care apare latime infinita imaginile stereo și localizarea clară a imaginii sonore în interiorul capului ascultătorului nu pot satisface iubitorii de muzică pretențioși. Pentru a elimina efectul de localizare a sunetului în interiorul capului, se folosesc circuite similare cu cele prezentate în Fig. 3.


Orez. 3. Schema bloc a unui dispozitiv pentru crearea de sunet surround pentru telefoane stereo

Aici, semnalele canalelor stânga și dreapta prin dispozitivele de intrare A1 și A2 sunt furnizate respectiv divizoarelor de tensiune A3 și A6 și, respectiv, intrărilor canalelor transversale constând din linii de întârziere (LZ) A4, A5, dispozitive potrivite A8, A9 și filtre trece-jos (LPF) Z1, Z2. De la divizoarele A3, A6, semnalele sunt transmise corectoarelor de răspuns în frecvență A7 și A10 și apoi la una dintre intrările sumatoarelor, iar de la acestea la intrările amplificatoarelor de putere pentru telefoane stereo. Astfel, la ieșirea fiecărui canal, se generează un semnal constând dintr-un semnal slăbit și corectat al canalului său și un semnal întârziat și corect corectat al celuilalt canal.

Mulți oameni sunt echipați în prezent cu dispozitive similare, realizate sub formă de set-top box-uri sau dispozitive încorporate. centre muzicale. Interesant este că astfel de dispozitive pot fi implementate și folosind metode pur software, folosind procesarea semnalului digital în timp real. Cititorii care au Calculator personal cu o placă de sunet full-duplex (din păcate, programul nu funcționează bine cu plăcile produse de compania Creative Labs din Singapore.), pot descărca unul dintre programe similare de pe Internet de pe serverul www.geocities.com/SunsetStrip/Palladium/2932/v108.zip. Programul de pe acest server vă permite, de asemenea, să adăugați efecte de reverb pentru camere mici, medii și mari, ecou, ​​chorus, flanger și are un egalizator destul de bun care îmbunătățește semnificativ reproducerea frecvențelor joase (20..60 Hz) prin calitatea medie. telefoane stereo. Toate efectele funcționează în timp real chiar și la foarte ieftine plăci de sunet fără procesoare DSP, de exemplu pe OPTi-931 sau Acer S23.

Cea mai avansată metodă de simulare a unui câmp de sunet tridimensional real este transmisia binaurală a sunetului. Metoda binaurală constă în faptul că informația sonoră este percepută de microfoanele plasate în urechile unei persoane sau de un „cap artificial” - un model care simulează percepția auditivă umană. Semnalele care provin de la fiecare microfon sunt amplificate de amplificatoare separate de joasă frecvență și reproduse de telefoane stereo. În mod ideal, un astfel de sistem vă permite să creați iluzia completă a sunetului natural.

Se pare că transportă ascultătorul din camera de ascultare în camera din care se realizează transmisia. Cu toate acestea, îl puteți asculta pe deplin folosind telefoane stereo și cu condiția ca capul să fi fost folosit ca probă pentru a crea un cap artificial. Cititorii pot asculta demonstrații binaurale WAV-uri audio fișiere prin descărcarea lor prin internet de pe serverele www.lakedsp.com, www.wa.com.au/lake, www.3daudio.com, www.geocities.com/SiliconValley/Pines/7899, www.geocities.com/ SunsetStrip/ Palladium/2932/3d_audio.htm

Când redați un semnal binaural prin difuzoare de sunet Datorită semnalului canalului drept care intră în urechea stângă a ascultătorului și invers, apare o distorsiune încrucișată, anulând în cele din urmă toate beneficiile reproducerii sunetului binaural. Aceste dezavantaje pot fi în mare măsură eliminate folosind un dispozitiv special de procesare. semnale sonore, care vă permite să obțineți un efect binaural atunci când ascultați înregistrări binaurale prin difuzoare. Astfel de dispozitive se numesc procesoare bifonice. Înregistrarea este realizată din microfoane situate în capul artificial și este redată după procesare de către un procesor bifonic, în care o cantitate calculată cu precizie de semnal al canalului stâng, întârziat și corectat la frecvență, este scăzută din semnalul canalului drept și invers. . Schema structurala procesorul bifonic, dezvoltat pentru prima dată de JVC, este prezentat în Fig. 4.


Orez. 4. Schema bloc a unui procesor binaural

Se compune din amplificatoare de semnal ale canalelor stânga și dreapta A1, A2, semnale de amplificare de la microfoanele instalate în capul artificial A0, linii de întârziere D1, D2, defazatoare U1, U2 și sumatori E1, E2. După procesarea de către un procesor bifonic, semnalele care vin de la difuzoare către urechile ascultătorului sunt însumate astfel încât urechea stângă să audă doar semnalele de la canalul stâng, iar urechea dreaptă doar semnalele de la canalul drept. Astfel, putem spune că efectul bifonic este asemănător cu cel binaural și diferă de acesta doar prin modul în care este reprodusă înregistrarea binaurală.

Și deși zona în care apare clar este mică, fiind în limitele sale, ascultătorul își poate face o idee despre distanța până la sursele de sunet și locația relativă a acestora în spațiu în momentul înregistrării, ceea ce nu poate fi realizat cu sunet stereofonic. reproducere, care dă o idee doar despre locația surselor de sunet pe linia dintre difuzoare. O altă proprietate interesantă a procesorului bifonic este capacitatea de a extinde baza stereo a înregistrărilor stereo convenționale cu ajutorul acestuia.

Aceasta este ceea ce se înțelege de obicei prin „3DSound”. Și dacă sistemul vă permite să creșteți unghiul imaginar dintre direcțiile către difuzoarele de sunet (Fig. 1) la 180 de grade, atunci un astfel de sistem se numește „Surround” și panorama sonoră creată pentru acesta va fi aceeași ca atunci când ascultați. la telefoane stereo, dar fără concentrarea surselor de sunet imaginare în capul ascultătorului. Desigur, un procesor bifonic poate fi implementat exclusiv în software folosind tehnici de procesare a semnalului digital în timp real.

Cititorii care au un computer personal cu o placă de sunet full-duplex pot descărca unul dintre aceste programe de pe Internet.

Dezvoltarea sistemelor de sunet surround - de la monofonie la 3D

În prezent, stereofonia cu două canale a devenit în mod clasic transmiterea și redarea sunetului. Scopul reproducerii sunetului stereofon este de a transmite imaginea sonoră cât mai precis posibil. Localizarea sunetului este doar un mijloc de a obține un sunet mai bogat și mai natural. Cu toate acestea, transmiterea informațiilor spațiale de către cele mai comune sisteme „clasice” cu două canale are o serie de dezavantaje, ceea ce încurajează designerii să creeze diverse sisteme de sunet surround.

Un ascultător într-o sală de concert aude nu numai sunetul direct care emană de la instrumentele individuale ale orchestrei, ci și sunetul difuz provenit din diverse direcții (inclusiv din spate) reflectat de pereții și tavanul camerei, care creează efectul de spațiu și completează. impresia de imagine de ansamblu. Întârzierea cu care sunetul difuz ajunge la urechile ascultătorului și compoziția sa spectrală depind de mărimea și proprietățile acustice ale încăperii. Cu transmisia pe două canale, informațiile create de sunetul difuz se pierd în mare măsură, iar în cazul înregistrării în studio, este posibil să nu fie prezentă de la început.

Urechea umană localizează cel mai bine sursele de sunet în plan orizontal. În același timp, sunetele care vin din spate, în lipsa unor informații suplimentare, sunt localizate mai rău. Vederea, inclusiv vederea periferică, este principalul sens al determinării locației obiectelor, prin urmare, fără informații vizuale, capacitatea de a evalua poziția unui sunet în plan vertical și distanța acestuia față de noi este slabă și destul de individuală. Acest lucru poate fi explicat parțial prin caracteristicile anatomice individuale ale urechilor. La redarea înregistrărilor, nu există informații vizuale, așa că orice tehnologie de sunet pentru piața de masă care pretinde că oferă „sunet surround” este forțată să creeze ceva mediu și, evident, un compromis.

O varietate de metode pot fi folosite pentru a reproduce sau sintetiza „efectul hall”. La mijlocul anilor '50, Philips, Grundig și Telefunken au testat sisteme de reproducere tridimensională 3D și Raumton. Transmisia sunetului a fost monofonică, dar difuzoarele suplimentare (de obicei încorporate, mai rar externe), care radiau sunetul lateral sau în sus, creau impresia unui spațiu mare datorită sunetului reflectat de pereți și tavan. Deoarece întârzierea ecoului în spațiile casnice este destul de mică, reverburile de primăvară au fost utilizate ulterior pentru a o crește în canalul de amplificare a semnalelor suplimentare. Datorită complexității tehnice semnificative pentru acea perioadă, aceste sisteme nu au rezistat mult pe piață și au dispărut rapid de pe scena.

Ulterior, au fost dezvoltate sisteme ambiofonice pentru a transmite sunetul difuz, care și-a găsit aplicație mai ales în cinema. Canalul (sau canalele) adiționale pentru transmiterea sunetului difuz în astfel de sisteme au o putere mai mică decât cele principale, iar domeniul lor de frecvență corespunde benzii de frecvență a semnalului difuz (aproximativ 300...5000 Hz). Radiația de la difuzoarele suplimentare trebuie să fie difuză, pentru care acestea sunt direcționate către pereții sau tavanul camerei de ascultare.

Dificultate de standardizare și probleme tehnice cu înregistrarea și transmisia trei semnale, patru sau mai multe canale au dus la faptul că stereofonia cu două canale a devenit principalul sistem de înregistrare și transmitere a sunetului timp de mulți ani. Dar încercările de a crea sisteme de sunet surround nu s-au oprit. Dezvoltarea ambiofoniei a fost cuadrafonia (reproducerea sunetului pe patru canale), a cărei vârf de popularitate a avut loc în prima jumătate a anilor '70. Spre deosebire de sistemul ambiofonic, aici toate canalele de reproducere a sunetului sunt echipate în mod egal. Quadafonie discretă (completă), oferind efect maxim prezență, necesită patru canale de transmisie audio și, prin urmare, sa dovedit a fi incompatibil cu sistemele existente la acel moment mijloace tehniceînregistrarea sunetului și difuzarea radio.

Pentru a depăși acest obstacol, s-au creat mai multe sisteme de quadrifonie matricială (în terminologia de atunci - cvasi-quadrafonie), în care semnalele originale a patru canale au fost matriceate pentru transmisie pe două canale, iar în timpul redării, semnalele originale au fost restaurate de către transformări sumă-diferență și a fost posibil să se reproducă fără un decodor semnal stereo normal. Deoarece niciunul dintre aceste sisteme nu era complet cuadrafonic, nici pe deplin compatibil cu stereofonia cu două canale din cauza pătrunderii mari a semnalului de la canal la canal, utilizarea lor practică a fost limitată și interesul pentru ele a dispărut rapid.

Nu au existat învingători în „războiul standardelor” sistemelor cuadrafonice, ideea a murit fericit, principiile au fost uitate, dar termenul a rămas. Prin urmare, acum puțini oameni sunt confuzi de faptul că „ceva” care are patru canale de amplificare și patru difuzoare este numit cu mândrie „sistem cuadrafonic”. Cu toate acestea, acest lucru este fundamental greșit, deoarece sursa semnalului rămâne cu două canale, iar semnalele canalelor din față și din spate cu acest design de sistem diferă între ele numai în ceea ce privește nivelul, adică se utilizează principiul panning.

Panarea în producția de înregistrări stereo a fost utilizată pe scară largă încă de la mijlocul anilor 50 pentru a poziționa semnalele audio monofonice „stânga/dreapta/mijlocul” câmpului sonor. Panarea nu are nici un efect asupra frecvenței sau fazei semnalului, schimbă doar nivelul semnalului mono furnizat fiecărui canal stereo. Panarea pe mai multe canale (în cazul înregistrărilor pe mai multe canale) se face în același mod. Cu toate acestea, atunci când se determină direcția către o sursă de sunet, aparatul nostru auditiv folosește nu numai diferența de intensitate a semnalelor sonore, ci și schimbarea de fază dintre acestea, iar efectul schimbării de fază asupra preciziei localizării sursei de sunet este cel mai pronunțat în intervalul de frecvență de la aproximativ 500 la 3000 Hz. (Din nou, gama de frecvență a sunetului difuz!).

Prin urmare, simpla panoramă nu oferă fidelitatea sunetului necesară. Efectele stereo („sunet de rulare”, legarea sunetului „stânga-dreapta”, etc.) ale primelor înregistrări stereo au devenit rapid plictisitoare. De aceea cele mai bune înregistrări instrumentele electronice din studioul anilor 60 au fost realizate folosind tehnologia microfonului, ceea ce explică natura „live” a sunetului: introducerea multicanalului complet electronic (fără utilizarea microfoanelor) înregistrarea instrumentelor cu amestecare ulterioară, facilitând în același timp munca inginerului de sunet, în același timp, a distrus atmosfera sălii. Ulterior, acest fapt a început să fie luat în considerare la realizarea înregistrărilor de studio, deși nu s-a produs o revenire completă la tehnologia microfonului.

Când se utilizează o schemă de redare pe două canale, zona principală de locație efectivă a surselor de sunet aparent (ASS) este situată în fața ascultătorului și acoperă un spațiu de aproximativ 180 de grade în plan orizontal. Cele două canale frontale nu pot reproduce în mod adecvat sunetele ale căror surse sunt de fapt situate în spatele și în planul vertical, decât dacă sunt susținute de semnale suplimentare. Utilizarea difuzoarelor din spate în combinație cu panoul de sunet funcționează bine cu sursele de sunet situate în fața și în spatele ascultătorului și mai puțin bine cu o locație laterală. Cu toate acestea, panoarea sunetului singură nu poate asigura niciodată o poziționare acceptabilă a surselor de sunet în plan vertical.

În timpul dezvoltării sistemelor matrice, s-a dovedit că o parte semnificativă a informațiilor spațiale este conținută în semnalul de diferență (semnal de informații stereo), care poate fi alimentat către difuzoarele canalelor din spate sau către formă pură, sau amestecat cu o anumită cantitate de semnale frontale. În cel mai simplu caz, acest lucru nu necesită nici măcar canale de amplificare suplimentare, iar semnalele pot fi matriceate la ieșirea amplificatorului:

Așa s-au născut mai multe sisteme pseudo-cuadrafonice, înlăturându-i complet pe „adevărații arieni” de pe piață la mijlocul anilor ’70. Se deosebeau unul de celălalt doar prin metodele de obținere a semnalului de diferență. Cu toate acestea, triumful lor a fost și de scurtă durată, ceea ce s-a explicat prin deficiențele purtătorului de semnal - disc de vinil și bandă magnetică. Zgomotul necorelat de la canalele stânga și dreapta nu a fost scăzut, ceea ce, combinat cu nivelul relativ scăzut al semnalului de diferență, a deteriorat foarte mult raportul semnal-zgomot în canalele din spate.

Un alt dezavantaj, nu mai puțin semnificativ, al unor astfel de sisteme este lipsa de dependență a nivelului semnalului din spate de natura fonogramei. La un nivel scăzut al semnalului din spate, efectul spațial este puțin vizibil atunci când nivelul crește, apare o întrerupere a scenei sonore și fragmentele sale se deplasează înapoi (efectul de „înconjurare a unei orchestre”, care nu corespunde realității); .

La redarea înregistrărilor „live” (care au o distribuție naturală a componentelor totale, diferențiale și de fază), acest dezavantaj s-a manifestat nesemnificativ, dar pe majoritatea fonogramelor de studio canalele din spate au introdus erori semnificative în poziția IZ. Pentru a depăși acest neajuns, sistemele de sunet surround timpurie au încercat să folosească panoramă automată. Semnalele de control au fost obținute de la nivelul informațiilor spațiale - o creștere a nivelului de semnale de diferență a dus la o creștere a câștigului în canalele din spate. Cu toate acestea, modelul de panning adoptat a fost foarte dur, drept urmare erorile de control ale expandorului au dus la modificări haotice ale nivelului semnalelor din spate (efectul „respirație grea”).

Interesul pentru sistemele de sunet surround a reapărut odată cu apariția mediilor digitale, al cărui nivel de zgomot intrinsec este neglijabil și chiar și procesarea semnalului analogic nu va degrada practic gama dinamică a sistemului. Dezvoltarea metodelor de procesare a semnalului digital a condus la crearea procesoarelor digitale de sunet (Digital Sound Processor - DSP).

Proiectat inițial pentru sisteme home theater, procesoare de sunet surround în În ultima vreme a început să fie utilizat în mod activ în sistemele audio auto. Utilizarea lor poate îmbunătăți semnificativ sunetul din interiorul unei mașini, motiv pentru care sunt produse nu numai ca dispozitive DSP separate, ci sunt și incluse în radiouri relativ ieftine. Setările procesorului vă permit să selectați cei mai optimi parametri pentru locația de ascultare selectată.

Există o serie de metode care permit echipamentelor să reproducă sunetul localizat în spațiu cu un număr limitat de sisteme acustice. Diferite metode de implementare au puncte tari și puncte slabe, așa că este important să înțelegem diferențe fundamentaleîntre principalele metode de procesare a semnalului. In nucleu sisteme moderne Sunetul spațial (Dolby Surround, Dolby Pro-Logic, Q-Sound, Curcle Surround și altele) se bazează pe aceeași idee de conversie sumă-diferență, completată de metode de procesare a semnalului „proprietate” (atât analogice, cât și digitale). Ele sunt adesea unite sub denumirea comună „sisteme 3D” („renașterea” unui termen de patruzeci de ani!).

Înainte de a analiza principiile implicate în procesarea semnalelor audio în sistemele de sunet surround, luați în considerare procesul tipic de înregistrare. În primul rând, se face o înregistrare care are multe canale individuale - instrumente, voci, efecte sonore etc. În timpul amestecării pentru fiecare pistă audio Nivelul volumului și locația sursei de sunet sunt controlate pentru a obține rezultatul dorit. În cazul înregistrării stereo, rezultatul mixării este de două canale pentru sistemele surround, numărul de canale este mai mare (de exemplu, 6 canale pentru formatul „5.1” Dolby Digital/AC-3). În ambele cazuri, fiecare canal constă din semnale care sunt concepute pentru a fi trimise către difuzoare individuale atunci când utilizatorul ascultă. Fiecare dintre aceste semnale este rezultatul unei amestecări complexe a semnalelor sursei originale.

În continuare, are loc procesul de codificare a canalelor obținute după amestecare și rezultatul este un flux digital (bitstream). În timpul redării, decodorul procesează fluxul digital, împărțindu-l în canale individuale și transmițându-le pentru redare către sistemele de difuzoare. Pentru sistemele de sunet surround cu mai multe canale (discrete), este posibil un mod de simulare a sistemelor de difuzoare efectiv absente (modul Phantom). Dacă aveți doar două difuzoare, atunci canalele subwoofer (frecvență joasă) și centrale (dialog) sunt pur și simplu adăugate la ambele canale de ieșire simultan. Canalul din spate stânga este adăugat la canalul de ieșire din stânga, din spate din dreapta canalului de ieșire din dreapta.

Rețineți că panningul afectează doar amplitudinea semnalului audio. Conversia audio în sistemele 3D moderne include informații suplimentare despre amplitudinea și diferența de fază/latența dintre canalele de ieșire în fluxul audio. De obicei, cantitatea de procesare depinde de frecvența semnalului, deși unele efecte sunt create folosind întârzieri simple.

Ce metode sunt folosite pentru a procesa un semnal audio? În primul rând, aceasta este expansiunea stereo (Stereo Expansion), care este produsă prin influențarea diferenței semnalului stereo al canalelor frontale. Această metodă poate fi considerată clasică și se aplică în primul rând înregistrărilor stereo convenționale.

Procesarea semnalului poate fi fie analogică, fie digitală. În al doilea rând, Positional 3D Audio (audio 3D localizat). Această metodă funcționează pe multe canale audio individuale și încearcă să localizeze individual fiecare semnal în spațiu. În al treilea rând, Virtual Surround este o metodă de redare a unei înregistrări multicanal folosind un număr limitat de surse de sunet, de exemplu redarea sunetului pe cinci canale pe două difuzoare acustice. Evident, ultimele două metode sunt aplicabile doar mediilor audio multicanal (înregistrări în format DVD, AC-3), ceea ce nu este încă foarte relevant pentru sistemele auto.

Aducerea la sfârșitul listei diverse metode reverberație artificială. Pe măsură ce sunetul călătorește prin spațiu, acesta poate fi reflectat sau absorbit de diferite obiecte. Sunetele reflectate într-un spațiu mare pot crea în realitate un ecou clar perceptibil, dar într-un spațiu limitat, multe sunete reflectate se combină astfel încât le auzim ca o singură secvență care urmează sunetul original și se atenuează, iar gradul de atenuare variază pentru diferite frecvențe și depinde direct de proprietățile spațiului înconjurător.

Procesoarele digitale de sunet utilizează un model de reverberație generalizat, care reduce controlul procesului de reverberație la setarea parametrilor cheie (timpul de întârziere, numărul de reflexii, rata de dezintegrare, modificarea compoziției spectrale a semnalelor reflectate). Așa sunt implementate modurile sală, live, stadion etc. Imitația se dovedește a fi destul de realistă. Procesoarele analogice folosesc linii de întârziere a semnalului în acest scop. Controlul parametrilor de reverb în acest caz este mult mai complex, așa că de obicei există un singur mod fix de funcționare.

Desigur, este dificil de descris caracteristicile structurale ale tuturor sistemelor de sunet surround existente, dar munca lor se bazează pe principiile discutate - diferența este doar în detaliile algoritmilor și setul de moduri (presetări). Prin urmare, cel mai bun consilier atunci când alegeți un procesor de sunet este propriul dvs. auz.

Acest articol se bazează pe teza mea pe tema „Dezvoltarea principiilor pentru simularea sunetului surround în sectorul divertismentului”, Departamentul de Tehnologia Informației, Institutul de Aviație din Moscova, 2011. Pentru adaptarea textului, s-au decupat statisticile seci, s-a făcut limbajul mai vioi și s-au introdus referințe la cărți și articole pe care le pot recomanda. Problemele ridicate vor fi de interes pentru cei care încă studiază mecanismele de localizare a sunetului. Partea software nu este atinsă în articol. Pentru un interes suplimentar, partea practică a creării unui microfon fals binaural nu a fost tăiată din articol.

Aș dori să-mi exprim recunoștința lui Boris Klimov pentru crearea de ilustrații exclusive, precum și Nadezhda Gurskaya pentru analiza și editarea textului.

Introducere

obiectivul principal realitate virtuala„cufundă” o persoană în spațiul jocului, acțiunea de pe ecran (film, desene animate, cinema 5D) atât de mult încât pentru un timp uită de realitatea lumii din jurul său.

Puteți citi despre conceptele „Immersion”, precum și „Suspensia Necredinței” în legătură cu sunetul și muzică, în cartea Winifred Phillips – A Composer’s Guide to Game Music.

Sunetul surround este cheia pentru ca o persoană să poată simți efectul „prezenței”. Percepția spațiului sonor, evident, era solicitată cu mult înainte de apariția mijloacelor de înregistrare a sunetului: de-a lungul secolelor, au fost create spații precum biserici, teatre, săli de concerte, în care ascultătorul era „cufundat” în spațiul sonor prin crearea unui efect acustic natural – reverberație. Studiile științifice ale comportamentului acusticii în sălile de concert de către Bose au arătat că aproximativ 11% ajunge direct la ascultător, procentul rămas de sunet vine sub formă reflectată de pe pereți, podea și tavan și alte obiecte din jurul ascultătorului, creând astfel volumul. de sunet. Din punct de vedere al informației, 25% din informațiile pe care o persoană le primește despre lumea din jurul său provin din sunet.

Abordarea sunetului în cinematografele moderne îl obișnuiește pe ascultător cu faptul că sunetul poate și ar trebui să fie de înaltă calitate și realist. Dezvoltatorii profesioniști de aplicații moderne de jocuri dedică până la 40% din buget și din resursele umane temporare lucrului cu sunetul. Pe de altă parte, unii dezvoltatori de jocuri și aplicații trebuie să fie convinși să cheltuiască timp și bani pentru implementarea sunetului de înaltă calitate.

Pe tema diferitelor abordări, este interesant să citiți articolele „Scoring computer games”, părțile 1 și 2 de la Christopher (căutate liber pe Internet).

Percepția umană a sunetului

Auzul uman este capabil să perceapă sunetul în intervalul de la 16-20 Hz la 15-20 kHz. Sunetele cu o frecvență sub 20-30 Hz (infrasunete) sunt percepute nu de organul auzului, ci prin atingere, de exemplu, prin vibrația suprafețelor. Frecvențele valorilor limită inferioare ale spectrului sonor pot fi percepute prin rezonanțe ale organelor interne ale unei persoane. La intensitate scăzută, sunetul de joasă frecvență are un impact emoțional suplimentar (de exemplu, popularul efect de sub drop).

O scădere a intervalului de frecvențe audibile este asociată cu modificări ale urechii interne și cu dezvoltarea pierderii auzului neurosenzorial legat de vârstă. Până la vârsta de 60 de ani, intervalul sonor la limita superioară nu devine mai mare de 10-12 kHz. Întrucât principalul contingent al sectorului de divertisment este reprezentat de tineri, gama percepută de auz trebuie luată în considerare pe deplin. Dar un specialist în sunet trebuie să aibă, de asemenea, auzul deplin, să fie capabil să audă caracterul nefiresc și incomplet al timbrului și să fie capabil să identifice rezonanțe. Și ceea ce nu este lipsit de importanță este să vă protejați auzul de suprasolicitare. Mulți oameni din industria muzicii și a sunetului se confruntă cu stres constant din cauza echipamentelor de întărire a sunetului și a instrumentelor acustice puternice (ca mine, după mai bine de 12 ani de cânt la instrumente de percuție). Omul modern este susceptibil la efectele negative ale zgomotului ambiental, care îi reduce sensibilitatea și atenuează limitele superioare ale frecvențelor înainte de pierderea naturală a auzului. Nu este nevoie să neglijați protecția auditivă, cum ar fi dopurile pentru urechi. Sunetele pot avea, de asemenea, un impact negativ frecvențe joase.

Detalii de la impact negativ sunet (inclusiv tehnic) poate fi găsit în cartea Chadd G. - Sound.

Percepția sunetului este individuală, depinde de configurația (forma) auriculei, de caracteristicile fiziologice, de vârstă și de starea psihologică la un anumit moment. În zona luată în considerare, percepția sunetului depinde și de:
- dispozitive de reproducere (difuzoare dispozitiv de redare, căști, difuzoare, sisteme multicanal),
- camera în care se desfășoară ascultarea,
- calitatea instrumentelor de conversie (de exemplu, implementarea unui procesor de sunet, motor),
- aderarea la principiile creării imaginii sonore corecte atunci când vine vorba de design sonor.

Mecanisme de localizare a surselor de sunet de către auzul uman

Capacitatea unei persoane de a localiza o sursă de sunet în spațiu se bazează pe principiul auzului binaural. Structura binaurală (din latinescul bini - „două” și auricula – „ureche”) a sistemului auditiv constă în percepția diferită a semnalelor sonore care vin la urechea dreaptă și stângă. Algoritm de localizare a sursei de sunet:
- semnalul sonor provenit de la sursa de sunet și reflexiile încăperii intră în partea externă a sistemului auditiv, unde configurația auriculare face posibilă transmiterea unui semnal procesat în frecvență către canalul auditiv extern;
- semnalul trece în timpanul uman, mecanismele urechii interne intră în vigoare,
- din urechea internă, informațiile intră în părțile creierului, unde, pe baza unei analize a comparației semnalelor primite de la fiecare dintre canalele auditive, se trag concluzii despre localizare sursa de sunet.

Creier uman compară informațiile care provin din timpan cu informațiile deja stocate în memorie.

Orez. 1. Structura părții externe a sistemului auditiv uman

Despre structura auzului extern și intern și multe altele puteți citi în detaliu în cartea lui Irina Aldoshina și Roy Pritts - Acustica muzicală, capitolul „Percepția sunetului. Fundamentele psihoacusticii"

Pentru a determina locația unei surse de sunet în spațiu, sistemul auditiv utilizează mecanisme de localizare de bază: prin diferență de timp, prin diferență de intensitate, prin diferență de spectru amplitudine-frecvență. Mecanismele auxiliare includ reflexiile sonore de la trunchiul și umerii umani, reverberația, ocluzia (sunetul care trece printr-un obstacol), obstrucția (sunetul filtrat de un obstacol), efectul Doppler, efectul Haas (efectul de precedență). Nu uitați de efectul percepției psihologice: dacă sursa din spațiul vizibil nu se potrivește cu sunetul sau sincronicitatea este perturbată, calitatea localizării scade brusc.

Este necesar să se determine poziția spațială a unei surse de sunet în prezența interferenței sonore. Există mecanisme naturale de imunitate la zgomot a sistemului auditiv. Una dintre ele se manifestă prin eliberarea binaurală din mascare. Fenomenul este că este mai ușor să localizați un semnal audio pe un fundal de zgomot static (de exemplu, zgomotul ambiental).

Câteva cuvinte despre transparența sunetului. Permiteți-mi să vă dau un exemplu binecunoscut. Să ne imaginăm mai multe desene de contur ale animalelor suprapuse unele peste altele. Recunoașterea tiparelor combinate în spațiu este mai dificilă, cu cât formele animalelor reprezentate sunt mai apropiate (termenul formă are același sens ca și într-un semnal sonor). Dacă aceste desene sunt răspândite în spațiu, atunci sarcina de a identifica animalul după formă devine mult mai ușoară.

Localizare după diferența de timp (localizare de fază)

Acest mecanism funcționează la frecvențe de la 300 Hz la 1,5 kHz. Datorită diferenței dintre poziția urechii stângi și a urechii drepte, sunetul care vine de la o sursă situată în unghi față de direcția frontală durează diferiți timpi pentru a ajunge la timpan.


Orez. 2. Exemplu schematic de localizare a fazelor

Având în vedere același timp necesar pentru a ajunge la semnalul din urechea stângă și dreaptă, acest mecanism va localiza sursa la 0 și 180 de grade azimut. Diferiții timpi pentru a ajunge la timpan au ca rezultat o schimbare de fază. Sistemul auditiv distinge schimbări de fază de până la 10-15 grade. Odată cu creșterea frecvenței și, în consecință, cu scăderea lungimii de undă a sunetului, defazarea semnalelor care vin de la aceeași sursă către urechi diferite crește. De îndată ce schimbarea atinge o valoare apropiată de jumătate din lungimea de undă a sunetului, mecanismul încetează să funcționeze. Creierul uman nu poate determina fără ambiguitate dacă semnalul sonor dintr-unul dintre canalele auditive rămâne în urmă celuilalt sau, dimpotrivă, îl avansează.

Diferența maximă de timp corespunzătoare unei deplasări complete a sursei de sunet la dreapta sau la stânga nu poate fi mai mare de 630 μs.

Distanța dintre urechea dreaptă și stângă a unui adult este de 0,15 m-0,20 m, dacă luăm valoarea medie pe gen. Cu o sursă care emite o undă sonoră cu o frecvență de 20 Hz și o viteză a sunetului de 340 m/s, lungimea de undă va fi de 17 m. În consecință, dacă o persoană se întoarce pe o parte către sursă, atunci defazarea semnalelor care sosesc într-o ureche și apoi în cealaltă, va fi aproximativ 1,1% din întreaga perioadă a undei de 20 Hz (localizarea la frecvențe atât de joase este imposibilă). Fiziologic, acuratețea localizării depinde de mărimea capului, adică de distanța dintre urechi. Cu cât această distanță este mai mare, cu atât este mai mare diferența de semnale sonore care sosesc în fiecare ureche.

Atunci când sunetul este emis de o sursă situată la un anumit unghi față de direcția frontală, nivelul de presiune a sunetului pe timpane din diferite urechi va fi diferit. Acest lucru se datorează faptului că o ureche va fi „în umbră” creată de cap și, de asemenea, datorită faptului că undele sonore de peste 1000 Hz se atenuează relativ rapid în spațiu.


Orez. 3. Exemplu schematic de localizare după nivel de intensitate

Acest mecanism este destul de eficient, dar în intervalul de frecvență audio de la 1600 Hz. Când lungimea de undă a sunetului este comparabilă cu diametrul capului uman, urechea cea mai îndepărtată de sursă încetează să mai fie în „umbra acustică”, ceea ce se datorează fenomenului de difracție a undei sonore de pe suprafața capului. În același timp, s-a dezvăluit experimental că capacitatea urechii umane de a determina unghiul dintre două surse în plan orizontal în intervalul de frecvență 1500-2000 Hz scade brusc.

Acest mecanism ajută la determinarea distanței până la sursa de sunet. Cu toate acestea, nivelul sunetului dintr-o sursă slabă, dar apropiată poate fi același cu cel al unei surse puternice, dar îndepărtate. În astfel de condiții, localizarea este facilitată de următorul mecanism.

Localizare prin diferență în spectrul amplitudine-frecvență

Mecanismul se bazează pe capacitatea creierului de a analiza scăderile și creșterile de frecvență ale anumitor frecvențe într-un semnal complex. Sunetul care ajunge la un unghi de 90° conține atât componente de joasă frecvență, cât și de înaltă frecvență, iar în spectrul sunetului care acționează asupra urechii îndepărtate, vor exista mai puține componente de înaltă frecvență - efectul de ecranare al capului. În plus, semnalul sonor este reflectat diferit față de părțile auriculare, iar diferite părți ale spectrului sonor sunt întărite și slăbite.

Acest mecanism este responsabil pentru localizarea din față în spate și pentru planul vertical. Studiul efectului de filtrare al capului și urechilor ascultătorului a făcut posibilă introducerea conceptului de benzi de purtare. La localizare, o persoană nu analizează întregul spectru al sunetului primit, ci doar se modifică în anumite frecvențe. Astfel de dungi s-au format în mod evolutiv;

Modificările benzilor de la 16 la 500 Hz și de la 2 la 6 kHz sunt responsabile pentru localizarea surselor frontale de sunet. Banda de la 0,7 la 2 kHz - modificarea timbrului surselor care pot fi situate în spate.

Un semnal cu o compoziție spectrală complexă este localizat mai bine, iar sensul direcției „față-spate” este format în primul rând din acele benzi direcționale în care este concentrată cea mai mare parte a puterii semnalului. Tonurile pure, care practic nu se găsesc niciodată în natură, sunt localizate mai rău decât semnalele complexe. Astfel, tonurile pure de peste 8000 Hz sunt greu de localizat. De asemenea, este imposibil să se determine locația surselor de sunet de joasă frecvență - mai puțin de 150 Hz.

Localizarea în plan vertical este mult mai proastă decât în ​​orizontală. Fără influență psihologică, vizuală, este aproape imposibil să se creeze o imitație a unui obiect care ar trebui să fie amplasat, de exemplu, deasupra. Acest sunet ar trebui să fie cel puțin familiar și așteptat.

Gibson D., în cărțile și videoclipurile sale, prezintă conceptul de aranjare verticală a instrumentelor într-un mix muzical în funcție de înălțimea lor (tesitura) sau formantul (zona tonurilor parțiale amplificate), deoarece în plan vertical, sunetul -echipamentul de reproducere este construit pe acelasi principiu. Datorită unui crossover acustic cu limite definite, un semnal complex este împărțit în benzi de frecvență. Într-un sistem cu trei căi, există un woffer în partea de jos pentru transmiterea frecvențelor joase, în partea de mijloc există un driver de mijloc pentru gama medie și un tweeter în partea de sus a sistemului pentru transmiterea frecvențelor înalte. Iar sub-wofferul transmite o parte din informații prin podea. Această abordare este interesantă, dar nu este potrivită pentru multe sisteme, de exemplu, atunci când utilizați căști sau orice alt sistem fără striping.

Mai multe detalii despre principiile descrise pot fi găsite în cartea Gibson D. - A Visual Guide to Recording and Producing.

Cu toate acestea, reducerea intensității frecvențelor joase ajută psihoacustic la „ridicarea” obiectului, făcându-l mai ușor.

Mutarea sursei de sunet

Până în anii 1960, studiul capacității umane de a localiza o sursă de sunet în spațiu s-a concentrat în principal pe sursele de sunet staționare. Ulterior, a început studiul percepției umane și al surselor de sunet în mișcare: au fost determinate principalele caracteristici ale percepției.

În cursul cercetărilor, s-a dovedit că, pentru ca o persoană să aibă o senzație de mișcare sonoră, este necesar anumit timp- fereastra de timp. Acesta variază de la 0,08 la 0,12 s. Localizarea unui sunet scurt, staționar (de exemplu, un clic care durează aproximativ 0,001 s) este destul de ușoară.

De asemenea, o persoană poate distinge viteza de mișcare a unei surse de sunet: cu cât este mai mare (în anumite limite), cu atât mai subtilă această abilitate. Dacă sursa de sunet se mișcă cu o viteză de 90°/s (mișcare de-a lungul unui semiperimetru în fața capului subiectului), o persoană distinge o modificare a vitezei de 15%; și la o viteză de mișcare de 360°/s - cu 5,5%.

Dacă sursa este staționară, atunci pentru a o localiza, o persoană face subconștient micro-mișcări ale capului, ceea ce crește precizia determinării poziției sursei în spațiu cu un ordin de mărime.

Efecte

Pentru a transmite în mod plauzibil sunetul dintr-o sursă în mișcare, este necesar să se țină seama de (efectul modificărilor frecvenței sunetului de la sursă atunci când acesta se mișcă neradial față de ascultător). În funcție de sentimentul subiectiv al efectului, sunetul își schimbă brusc tonul - devine mai ridicat când obiectul se apropie și mai scăzut când se îndepărtează. În domeniul jocurilor, efectul Doppler joacă un rol semnificativ. Mai ales când vine vorba de simulatoare auto și alte aplicații legate de mișcare rapidă obiecte. Efectul Doppler este un plugin comun pentru secvențiere și, din câte știu eu, există în multe motoare de sunet.

Unul dintre principalele efecte ale creării spațiului este efectul de reverberație (procesul de reflectare repetată a unui semnal sonor de pe diferite suprafețe cu o scădere treptată a intensității acestuia). Reverberația simulată are o serie de parametri - timpul de reflexie timpurie, timpul de reflexie târziu, rata de dezintegrare, procent semnal „uscat” cu unul procesat. Acești parametri indică dimensiunea camerei și locația sursei de sunet în ea în raport cu ascultătorul. În munca mea folosesc exclusiv reverberatoare convoluționale, aplicând acestora impulsuri din camere reale. Fără a intra în detaliile tehnologiei, impulsul în sine este o „amprentă” de zgomot a camerei (fișier wav), care modulează fișierul de sunet original, plasându-l astfel în spațiul simulat. În domeniul muzical, tehnologiile de convoluție sunt folosite de mult timp, așa că în shell-ul Kontakt (4,5) de la NI, o reverb de convoluție cu un set de impulsuri este inclusă în lista de efecte standard.

Sisteme de sunet. Sistem binaural

Există două abordări principale pentru organizarea sistemelor moderne de sunet într-o cameră: sisteme cu mai multe canale și sisteme cu două canale (inclusiv căști). În sistemele cu mai multe canale, sunetul este transmis de la monitoare plasate în fața și în spatele (sau în jurul) ascultătorului.

Mai multe detalii despre sistemele monoaurale, binaurale, stereofonice și multicanal și complexitățile acestora pot fi găsite în cartea lui Kovalgin - Transmisie stereofonică și înregistrare audio.

Pentru a spori efectul spațial, producătorii încearcă să promoveze concepte de sistem care nu mai au cinci, ci șase, șapte și chiar nouă canale. Creșterea numărului de canale necesită complicarea muncii inginerului de sunet, creșterea numărului de sisteme de difuzoare, corelare fire și utilizarea unor amplificatoare mai complexe și, prin urmare, permite creșterea veniturilor din vânzări.
Nu toți consumatorii au nevoie de sisteme audio multicanal. Pentru unii, acest lucru este inacceptabil din motive economice, alții nu pot aloca spațiu în spațiul lor de locuit pentru un sistem de divertisment la domiciliu. Unii oameni, din motive evidente, preferă să folosească căștile (noaptea, când se deplasează în mijloacele de transport în comun etc.).

Doar două urechi oferă unei persoane toate informațiile necesare despre un obiect, ceea ce înseamnă că doar două difuzoare sunt suficiente pentru a-l transmite. Când se utilizează înregistrarea binaurală, sursele de sunet aparente, atunci când se folosesc căștile, sunt plasate în afara capului ascultătorului, în locul în care se află sursele de sunet reale. În schimb, atunci când ascultați semnale stereofonice convenționale prin căști, sursele de sunet aparente sunt simțite a fi situate în interiorul capului ascultătorului.

Apariția reverberației face dificilă estimarea azimutului surselor de sunet aparente în regiunea din spate, unde ascultătorii indică adesea direcția corespunzătoare din față a oglinzii în loc de direcția adevărată. Acest fenomen apare mai ales când timpul standard de reverberație în camera de ascultare depășește 0,3 s.

Este posibilă transmiterea corectă a informațiilor spațiale la redarea folosind două monitoare, dar chiar și o deplasare ușoară (aproximativ 9-15 cm) a centrului capului ascultătorului la stânga sau la dreapta acestui punct duce la faptul că localizarea sunetului aparent surse este imposibilă în afara focalizării axelor monitoarelor.

La punctul optim de ascultare, sistemul binaural oferă un sunet care este preferabil cu încredere decât stereo convențional. Cu toate acestea, aplicația sa este foarte limitată: redare folosind căști, echipamente portabile de transmisie radio și de reproducere a sunetului, modelare pe computer. Stereofonic sistem audio Nu prea potrivit pentru condiții de ascultare în grup.

Atunci când redați un semnal binaural printr-un sistem de difuzoare, apare distorsiunea încrucișată din cauza semnalului canalului drept care intră în urechea stângă a ascultătorului și invers.

În realitățile de proiectare a sunetului jocului, fișierele audio binaurale înregistrate nu sunt utilizate, deoarece este imposibil să-și schimbe poziția în spațiu, nu există o sursă virtuală și un ascultător virtual, aceasta nu este modelare.

Algoritmi

Algoritmul principal, care folosește mecanismele de bază ale localizării sunetului uman, este implementat în HRTF (Head Related Transfer Functions - funcții ale sunetului în mișcare față de ascultător. HRTF-urile sunt determinate cantitativ de transformarea Fourier integrală inversă a coeficienților numită HRIR (Head Related) Răspunsul la impuls), care, într-o primă aproximare, sunt determinate de raportul de presiune undei sonore în timpan spatiu liber(câmp liber) și în spațiu real, ținând cont de capul uman, urechile, corpul și alte obstacole.

HRTF este o funcție complexă cu patru variabile: trei coordonate spațiale și frecvență. Când se utilizează coordonate sferice pentru a determina distanțe la sursele de sunet mai mari de un metru, se presupune că sursele de sunet sunt în câmpul îndepărtat, iar valoarea HRTF scade invers cu distanța. Majoritatea măsurătorilor HRTF se fac în câmpul îndepărtat, iar numărul de variabile este redus la trei: azimut, elevație și frecvență. Efectul HRTF depinde de intervalul de frecvență al semnalului procesat: numai sunetele cu valori ale componentei de frecvență între 3000 Hz și 10000 Hz pot fi interpretate cu succes folosind funcțiile HRTF. Dacă semnalul de la sursa de sunet nu conține o frecvență specială care afectează diferența dintre funcțiile HRTF din față și din spate, atunci un astfel de semnal nu va fi niciodată localizat în direcția față-spate.

HRTF a fost simulat folosind un manechin KEMAR (Knowless Electronics Manikin for Audiry Research) și o „ureche digitală” specială dezvoltată de Sensaura. Microfoanele sunt plasate în urechile manechinului, iar microfoanele sunt plasate în jurul manechinului. difuzoare acustice, rezultatul este o înregistrare a ceea ce aude fiecare „ureche”. Rezultatele obținute dintr-o astfel de modelare sunt folosite pentru a extinde baza de date HRTF, care poate fi apoi folosită pentru a selecta interactiv parametrii atunci când redați sunetul 3D poziționat (Sensaura are mai mult de 1.100 de HRTF-uri în baza de date). Necesitatea unei astfel de baze de date se explică, în primul rând, prin diferența de dimensiune și formă a capului și urechilor manechinului și a potențialului ascultător și, în al doilea rând, așa-numita zonă de punct dulce determinată de acești parametri, în care efectul de sunet în plan vertical este corect recreat și determinând corect amplasarea surselor de sunet în spațiu. Cu cât suprafața punctului favorabil este mai mare, cu atât ascultătorul are mai multă libertate de acțiune. Prin urmare, dezvoltatorii caută în mod constant modalități de a crește aria de efect a punctului dulce.

La implementarea tehnologiilor cu HRTF, QSound se bazează nu numai pe metode matematice, ci și pe testarea de către ascultători (au fost efectuate aproximativ 550 de mii de astfel de sesiuni de ascultare). Specialiștii Sensaura, după o serie de experimente, au stabilit că HRTF în forma sa pură „funcționează” doar când este redat prin căști. Modelarea sunetului în acest caz este o sarcină banală: fiecare difuzor își controlează urechea corespunzătoare. Cu toate acestea, atunci când același sunet este redat prin difuzoare, urechea dreaptă aude și un sunet menit să „înșele” urechea stângă din punct de vedere tridimensional și invers. Pentru a elimina acest fenomen, la sunet trebuie adăugate calcule suplimentare de compensare. Au fost dezvoltați algoritmi de compensare de succes și se numesc Transaural Cross-talk Cancellation (TCC). Problema a fost rezolvată folosind o altă idee de la inginerii Sensaura. Constă în faptul că funcțiile HRTF funcționează doar pentru urechea medie, deoarece sunt derivate folosind un singur manechin sau citirile medii ale unui grup mare de oameni. Sensaura a dezvoltat un model digital de ureche în care puteți seta parametrii auriculei. Cu asta model digital Combinând diferiți parametri, puteți reproduce forma aproape oricărei urechi. Driverul digital pentru ureche care rezultă funcționează astfel: atunci când este instalat, o persoană ascultă o serie de sunete de testare și ajustează setările driverului pentru a experimenta cât mai bine tridimensionalitatea sunetului. Parametrii individuali ai ascultătorului sunt înregistrați într-un „profil” special, care este ulterior utilizat de aplicații.

Ce este sunetul surround ( Sunet ambiental) și cum funcționează

Cele mai multe dispozitive moderne, ieftine și nu foarte reproducătoare de sunet, inclusiv plăcile de sunet pentru computerele multimedia personale, vă permit să reproduceți sunetul în modul „Sunet 3D” sau „Surround”, care poate fi tradus ca „sunet surround”. Ce este și pentru ce este?

Sistemele de reproducere a sunetului surround au fost dezvoltate deoarece calitatea sunetului oferită de sistemele stereo convenționale sau de căștile nu mai era satisfăcătoare pentru ascultătorii exigenți. Deși sistemele stereo creează un efect de sunet spațial prin sintetizarea unei panorame de surse de sunet imaginare (ISS) între două difuzoare (Fig. 1), sunetul stereo are totuși un dezavantaj semnificativ. Panorama stereo este plată și limitată de unghiul dintre direcțiile către difuzoare.

Figura 1. Panoramă stereo

Un astfel de sunet este în mare parte lipsit de naturalețea inerentă a ceea ce se realizează într-un câmp sonor real, atunci când o persoană este capabilă să perceapă surse reale din aproape toate direcțiile, atât orizontale, cât și verticale, și să estimeze, deși uneori cu erori, distanța până la sunet. surse. Se crede că percepția sunetelor din diferite direcții și distanțe este importantă nu numai ca un fapt al locației lor spațiale. Creează în ascultător o senzație de volum sonor (câmp sonor tridimensional), îmbogățește semnificativ timbrele instrumentelor muzicale și vocilor, restabilind procesul de reverberație caracteristic sălii primare (sala de concerte). Stereofonia convențională creează un efect de sunet spațial într-o zonă foarte limitată în fața ascultătorului, nu permite ca caracteristicile de percepție a sunetului menționate mai sus să fie dezvăluite pe deplin într-un câmp sonor real și, prin urmare, reduce calitatea sunetului.

De asemenea, sistemele cvadrafonice nu oferă o simulare completă a unui câmp sonor real. În primul rând, cu cadrafonie, nu se obține o panoramă stereo circulară - ascultătorul simte o panoramă stereo obișnuită în fața lui și o panoramă stereo din spate în spatele lui. În al doilea rând, toate sursele de sunet imaginare sunt situate în același plan și pe linia dintre difuzoare, adică. nu există adâncime și, de fapt, nu există sunet surround de dimensiunea 3 și tridimensional (Fig. 2).


Figura 2. Panoramă quad

De asemenea, căștile stereo nu vă permit să obțineți un sunet natural din fonograma reprodusă. Faptul este că impresia rezultată de o lățime stereo infinită și o localizare clară a imaginii sonore în interiorul capului ascultătorului nu poate satisface iubitorii de muzică pretențioși. Pentru a elimina efectul de localizare a sunetului în interiorul capului, se folosesc circuite similare cu cele prezentate în Fig. 3.


Figura 3. Diagrama bloc a unui dispozitiv pentru crearea de sunet surround pentru telefoane stereo

Aici, semnalele canalelor stânga și dreapta prin dispozitivele de intrare A1 și A2 sunt furnizate respectiv divizoarelor de tensiune A3 și A6 și, respectiv, intrărilor canalelor transversale constând din linii de întârziere (LZ) A4, A5, dispozitive de potrivire A8, A9 și low. -filtre de trecere (LPF) Z1 , Z2. De la divizoarele A3, A6, semnalele sunt transmise corectoarelor de răspuns în frecvență A7 și A10 și apoi la una dintre intrările sumatoarelor, iar de la acestea la intrările amplificatoarelor de putere pentru telefoane stereo. Astfel, la ieșirea fiecărui canal, se generează un semnal constând dintr-un semnal slăbit și corectat al canalului său și un semnal întârziat și corect corectat al celuilalt canal.

Multe centre muzicale sunt echipate în prezent cu dispozitive similare, realizate sub formă de set-top box-uri sau dispozitive încorporate. Interesant este că astfel de dispozitive pot fi implementate și folosind metode pur software, folosind procesarea semnalului digital în timp real. Cititorii care au un computer personal cu o placă de sunet full-duplex (din păcate, programul nu funcționează bine cu plăcile produse de compania Creative Labs din Singapore.) pot descărca unul dintre aceste programe de aici. Programul, în plus, vă permite să adăugați efecte de reverb pentru camere mici, medii și mari, ecou, ​​chorus, flanger și are un egalizator destul de bun care îmbunătățește semnificativ reproducerea frecvențelor joase (20...60 Hz) până la mijloc. telefoane stereo de calitate. Toate efectele funcționează în timp real chiar și pe plăci de sunet foarte ieftine fără procesoare DSP, de exemplu OPTi-931 sau Acer S23.

Cea mai avansată metodă de simulare a unui câmp sonor tridimensional real este transmisia binaurală a sunetului. Metoda binaurală constă în faptul că informația sonoră este percepută de microfoane plasate în urechile unei persoane sau de un cap artificial. - un model care simulează percepția auditivă umană. Semnalele care provin de la fiecare microfon sunt amplificate de amplificatoare separate de joasă frecvență și reproduse de telefoane stereo. În mod ideal, un astfel de sistem vă permite să creați iluzia completă a sunetului natural.

Se pare că transportă ascultătorul din camera de ascultare în camera din care se realizează transmisia. Cu toate acestea, îl puteți asculta pe deplin folosind telefoane stereo și cu condiția ca capul să fi fost folosit ca probă pentru a crea un cap artificial. Cititorii pot asculta fișiere WAV audio demonstrative binaurale, descărcându-le pe Internet de pe servere


www.geocities.com/SiliconValley/Pines/7899

La redarea unui semnal binaural prin difuzoare, apare distorsiunea încrucișată din cauza semnalului canalului drept care intră în urechea stângă a ascultătorului și invers, ceea ce în cele din urmă anulează toate avantajele reproducerii sunetului binaural. Aceste dezavantaje pot fi eliminate în mare măsură cu ajutorul unui dispozitiv special de procesare a semnalului sonor, care face posibilă obținerea unui efect binaural la ascultarea înregistrărilor binaurale prin difuzoare. Astfel de dispozitive se numesc procesoare bifonice. Înregistrarea este realizată din microfoane situate în capul artificial și este redată după procesare de către un procesor bifonic, în care o cantitate calculată cu precizie de semnal al canalului stâng, întârziat și corectat la frecvență, este scăzută din semnalul canalului drept și invers. . Schema bloc a procesorului bifonic, dezvoltată pentru prima dată de JVC, este prezentată în Fig. 4.


Figura 4. Diagrama bloc a unui procesor binaural

Se compune din amplificatoare de semnal ale canalelor stânga și dreapta A1, A2, semnale de amplificare de la microfoanele instalate în capul artificial A0, linii de întârziere D1, D2, defazatoare U1, U2 și sumatori E1, E2. După procesarea de către un procesor bifonic, semnalele care vin de la difuzoare către urechile ascultătorului sunt însumate astfel încât urechea stângă să audă doar semnalele de la canalul stâng, iar urechea dreaptă doar semnalele de la canalul drept. Astfel, putem spune că efectul bifonic este asemănător cu cel binaural și diferă de acesta doar prin modul în care este reprodusă înregistrarea binaurală.

Și deși zona în care apare clar este mică, fiind în limitele sale, ascultătorul își poate face o idee despre distanța până la sursele de sunet și locația relativă a acestora în spațiu în momentul înregistrării, ceea ce nu poate fi realizat cu sunet stereofonic. reproducere, care dă o idee doar despre locația surselor de sunet pe linia dintre difuzoare. O altă proprietate interesantă a procesorului bifonic este capacitatea de a extinde baza stereo a înregistrărilor stereo convenționale cu ajutorul acestuia. Aceasta este ceea ce se înțelege de obicei prin „3DSound”. Și dacă sistemul vă permite să creșteți unghiul imaginar dintre direcțiile către difuzoarele de sunet (Fig. 1) la 180 de grade, atunci un astfel de sistem se numește „Surround” și panorama sonoră creată pentru acesta va fi aceeași ca atunci când ascultați. la telefoane stereo, dar fără concentrarea surselor de sunet imaginare în capul ascultătorului. Desigur, un procesor bifonic poate fi implementat exclusiv în software folosind tehnici de procesare a semnalului digital în timp real.