Riproduzione ed ascolto dei suoni (quarta parte)

Qualità oggettiva e soggettiva; elaboratori di immagine sonora; subwoofer

Nella puntata precedente abbiamo visto che alcune delle comuni pratiche di ripresa e di riascolto dei suoni possono interferire con il nostro meccanismo dell’effetto di precedenza, in particolare nella gamma di tempi che va da zero a trecento microsecondi.

È stato evidenziato che l’influenza di tali interferenze è da considerarsi comunque negativa, in quanto confonde, in maniera imprevedibile e contraddittoria, quei dati sui quali il nostro senso dell’udito si basa per la localizzazione delle sorgenti sonore.

In questa puntata esamineremo altri aspetti della percezione sonora, in relazione ad alcune delle modalità di intervento sul segnale stereofonico da parte di quegli apparecchi definiti «elaboratori di immagine sonora» o «processori di ambienza» o altre cose del genere. Le modifiche operate da questi apparecchi sul
segnale originale non sono da considerarsi a priori negative, in quanto non confondono la percezione; la modificano e la arricchiscono anzi in una maniera che il nostro senso dell’udito mostra di apprezzare.

Entrerei dunque in argomento proponendo una distinzione tra due aspetti della qualità della musica riprodotta, che ho voluto chiamare «qualità oggettiva» e «qualità soggettiva».

Con qualità oggettiva della riproduzione musicale intendo riferirmi al grado di successo ottenuto nella ricostruzione, attraverso l’uso di adeguate tecniche di ripresa e di riascolto, di un dato evento sonoro.

La valutazione di questo successo è basata sulle sensazioni provate nel riascolto, che devono essere il più possibile simili a quelle avute nell’ascolto dal vivo.
Gli eventi sonori che qui ci interessano sono delle esecuzioni musicali: abbiamo ragione di ritenere che per esse siano state ottimizzate certe condizioni per il conseguimento della massima piacevolezza dell’ascolto, sulla base sia delle esperienze maturate in secoli di attività musicale sia degli studi compiuti negli ultimi cento anni per scoprirne le ragioni.

È proprio questo aspetto dell’evento sonoro originale, da trasferire possibilmente anche nella sua riproduzione, che ho voluto indicare con l’espressione «qualità soggettiva», poiché si basa sulla generalizzazione, di impressioni soggettive riguardanti la piacevolezza dell’ascolto.

Per la qualità oggettiva è invece importante la somiglianza tra copia ed originale, quest’ultimo in teoria sempre disponibile per il confronto.

Un ruolo determinante ai fini della localizzazione di una sorgente è svolto dalle differenze di intensità e di fase con le quali lo stimolo giunge alle orecchie dell'ascoltatore. Contrariamente a quanto spesso si ritiene, anche le basse frequenze hanno un notevole peso nella corretta definizione dell'immagine sonora. Poiché a bassa frequenza, con lunghezze d'onda notevol mente superiori alle dimensioni fisiche della testa dell'ascoltatore, non si registrano differenze di intensità del suono percepito dalle due orecchie, la percezione nell'ascolto a bassa frequenza è legata essenzialmente a differenze di fase. Queste sono a loro volta presenti quando la provenienza dei suoni è prevalentemente laterale.

Un ruolo determinante ai fini della localizzazione di una sorgente è svolto dalle differenze di intensità e di fase con le quali lo stimolo giunge alle orecchie dell’ascoltatore. Contrariamente a quanto spesso si ritiene, anche le basse frequenze hanno un notevole peso nella corretta definizione dell’immagine sonora. Poiché a bassa frequenza, con lunghezze d’onda notevolmente superiori alle dimensioni fisiche della testa dell’ascoltatore, non si registrano differenze di intensità del suono percepito dalle due orecchie, la percezione nell’ascolto a bassa frequenza è legata essenzialmente a differenze di fase. Queste sono a loro volta presenti quando la provenienza dei suoni è prevalentemente laterale.

77 – Elaboratori di immagine sonora

Abbiamo già visto, nel paragrafo dedicato all’effetto di precedenza, come le prime riflessioni giochino un ruolo molto importante per un buon ascolto, sia per i suoni naturali sia per quelli riprodotti, tanto per gli ascoltatori quanto per gli esecutori (8).

E stato inoltre riscontrato che la qualità soggettiva dell’ascolto aumenta quando è presente una certa diversità nei segnali in arrivo alle orecchie, soprattutto alle frequenze basse e medio-basse (inferiori a 800 Hz): in altre parole il nostro cervello non è portato ad apprezzare un suono troppo monofonico, neanche nell’ascolto dal vivo (7), (8).

Siccome non è possibile avere alle due orecchie differenze di intensità per suoni di frequenza bassa, le differenze di cui si parla potranno essere esclusivamente di fase: questo accade quando le direzioni di provenienza dei suoni (prime riflessioni) sono prevalentemente laterali.

Si preferisce perciò evitare che in sala da concerto vi siano forti prime riflessioni dalle superifici del soffitto e della parete di fondo, cercando di tenerle più lontane o di renderle diffondenti, favorendo invece la produzione di riflessioni sulle pareti laterali.

È opinione di molti che le registrazioni eseguite con microfoni omnidirezionali spaziati possiedano questa qualità «stereofonica» in misura maggiore di quelle eseguite con tecniche coincidenti; questo è dovuto soprattutto al fatto che la loro stessa disposizione produce forti differenze di fase tra i due canali a tutte le
frequenze.

I microfoni direzionali invece alle frequenze basse, per ragioni legate alla loro costruzione ed al principio di funzionamento, mostrano una attenuazione del livello di uscita accompagnata da una perdita, più o meno accentuata, delle caratteristiche direttive: essi restituiranno, quando impiegati in configurazioni coincidenti, frequenze basse con fase e talora anche ampiezza identiche in entrambi i canali.

Sono comunque effetti che possono venire corretti (29) attraverso una manipolazione dei segnali stereofonici, che consiste nell’aggiungere ad ogni canale parte del segnale dell’altro invertito di fase e nell’aumento del livello alle frequenze basse, fino a circa 600 Hz.

Questo intervento è simile nella sostanza a quello operato dai vari elaboratori di immagine sonora; questi si differenziano tra loro nella gamma di frequenza interessata, nelle eventuali introduzioni di ritardi di tempo, nella possibilità di dosare l’intervento stesso. Nel caso di una registrazione eseguita con una coppia coincidente di microfoni direzionali possiamo vedere facilmente, se consideriamo la combinazione M-S equivalente, che questa elaborazione tende a favorire le componenti S ed a ridurre le componenti M del segnale stereo risultante, come se si fossero usati microfoni (in configurazione X-Y) più direttivi e con gli assi formanti un angolo più aperto.

Circuiti per V«equalizzazione spaziale» di normali registrazioni commerciali proposti da Griesinger (29). Il circuito «a» esalta le componenti di bassa frequenza della differenza canali; il circuito «b» opera anche una attenuazione della somma canali. Originali autografi dell'autore da AES Journal, Voi. 34, n. 4, aprile 1966.

Circuiti per V«equalizzazione spaziale» di normali registrazioni commerciali proposti da Griesinger (29). Il circuito «a» esalta le componenti di bassa frequenza della differenza canali; il circuito «b» opera anche una attenuazione della somma canali. Originali  autografi dell’autore da AES Journal, Vol. 34, n. 4, aprile 1966.

L’effetto è particolarmente benefico per tutte quelle registrazioni effettuate con microfoni coincidenti male posizionati, come i cardioidi angolati di 90° o 120°, che all’ascolto suonano troppo monofoniche.

Con le registrazioni effettuate con microfoni omnidirezionali spaziati, o in multimicrofonia, l’intervento è ugualmente avvertibile, anche se non nel senso di un deciso miglioramento.

Non è invece molto verosimile l’interpretazione secondo la quale i vantaggi all’ascolto conseguibili con gli elaboratori di immagine sonora consistano nella presunta cancellazione della diafonia interaurale: abbiamo visto che è proprio la diafonia interaurale, alle frequenze basse, che consente la localizzazione di una sorgente virtuale a partire da due segnali, in opportuna relazione di ampiezza, emessi da due diffusori.

È inoltre inutile che questo genere di elaborazione si estenda anche alle frequenze medie ed alte, alle quali la diafonia interaurale viene comunque cancellata dalla testa stessa dell’ascoltatore.

Il risultato che questi apparecchi possono dare consiste unicamente nello spostamento dell’equilibrio spaziale dei suoni ricvuti dall’ascoltatore, favorendo i segnali laterali rispetto a quelli frontali in fase, che è proprio ciò che il nostro cervello preferisce anche nell’ascolto dal vivo; un loro uso accorto potrà riequilibrare la qualità soggettiva delle registrazioni senza modificare la qualità oggettiva delle sensazioni provate dall’ascoltatore.

Esiste un’altra categoria di elaboratori del segnale stereofonico, il cui funzionamento è diverso e più complesso di quello appena esaminato.

Questi intervengono aggiungendo al segnale in ingresso un set completo di prime riflessioni e riverberazione, costruito secondo schemi prestabiliti, che l’ascoltatore può scegliere tra quelli corrispondenti a differenti ambienti di ascolto.

Questi apparecchi sono generalmente reperibili come accessori da collegare ad un impianto già esistente, con l’aggiunta eventuale di un amplificatore e due diffusori per una emissione sonora distinta da quella dei diffusori principali; anche alcuni amplificatori integrati dispongono di tali funzioni.

L’impiego di apparecchi di questo tipo è complementare a quello descritto in precedenza: mentre prima veniva modificata la prospettiva di una registrazione contenente già tutte le informazioni direzionali ed ambientali, ora si tratta di aggiungere un set preconfezionato di informazioni ambientali là dove queste mancano. I programmi musicali che possono trarre beneficio da questo tipo di elaborazione sono quelli registrati in studio, o quelli appositamente prodotti, soprattutto computer-music: in questo caso non si può parlare di qualità oggettiva, in quanto non è disponibile un originale, adatto ad un ascolto dal vivo, da poter confrontare con la riproduzione.

Queste registrazioni possono però acquistare così quella qualità soggettiva necessaria per un buon riascolto. Le registrazioni dal vivo, al contrario, eseguite con gli accorgimenti adatti a mantenere intatte le relazioni spaziali ed ambientali, verrebbero del tutto inquinate dall’aggiunta di un contesto ambientale artificiale ed estraneo.

Una seconda categoria di elaboratori di imma gine sonora è costituita da apparecchi che aggiungono al segnale di ingresso un completo set di prime riflessioni e di riverberazione. A parte le apparecchiature prima analogiche e poi digitali impiegate da diversi decenni nella pratica di studio radiofonico, di registrazione ed anche nell'esecuzione dal vivo, il primo esempio di elaboratore digitale di immagine stereofonica ad uso dell'audiofilo è rappresen tato dal DSP-100 Yamaha (nella foto, vedi anche prova su A UDIOreview n. 83, maggio 1989). Esistono anche alcuni preamplificatori che incorporano queste funzioni tra i quali ricordiamo il Sony TA-E 1000 ES in prova su questo stesso numero.

Una seconda categoria di elaboratori di immagine sonora è costituita da apparecchi che aggiungono al segnale di ingresso un completo set di prime riflessioni e di riverberazione. A parte le apparecchiature prima analogiche e poi digitali impiegate da diversi decenni nella pratica di studio radiofonico, di registrazione ed anche nell’esecuzione dal vivo, il primo esempio di elaboratore digitale di immagine stereofonica ad uso dell’audiofilo è rappresentato dal DSP-100 Yamaha (nella foto, vedi anche prova su A UDIOreview n. 83, maggio 1989). Esistono anche alcuni preamplificatori che incorporano queste funzioni tra i quali ricordiamo il Sony TA-E 1000 ES in prova su questo stesso numero.

figura-3a

72 – Subwoofer

Vorrei terminare con alcune considerazioni su di un’altra elaborazione del segnale stereo fonico, che conosciamo molto bene perché ormai di uso comune da molto tempo: la somma in mono del segnale stereofonico alle frequenze basse, per l’uso di un unico diffusore «subwoofer».

L’uso di un solo diffusore per la riproduzione delle frequenze più basse della gamma audio segue dall’esigenza di contenere, in un ambiente domestico,  l’ingombro totale dei diffusori acustici e trova giustificazione nel fatto che l’effetto stereofonico complessivo non viene compromesso, se la separazione alle
frequenze medie ed alte si mantiene sino ad una frequenza abbastanza bassa, solitamente attorno ai 100-150 Hz.

L’approccio alla configurazione subwoofer + satelliti si basa sul presupposto teorico che due sorgenti di frequenza bassa non sono distinguibili se la distanza che le separa è dell’ordine della lunghezza d’onda emessa; come conseguenza avremmo che, in un normale ambiente d’ascolto, si potrebbe spostare la sorgente delle frequenze basse di un canale fino a farla coincidere con l’altra o, addirittura, si potrebbero sommare i due canali per inviarli ad un unico diffusore per le frequenze basse, senza che tutto questo procuri differenze apprezzabili all’ascolto.

Queste affermazioni non tengono però conto di due fatti importanti: innanzitutto, la stereofonia alle frequenze basse non consiste nella localizzazione corretta dei diffusori, ma nella interazione tra i due diffusori e le due orecchie dell’ascoltatore, che permette di sintetizzare sorgenti virtuali nello spazio compreso tra i due diffusori; la stereofonia alle frequenze basse è inoltre responsabile di quella qualità soggettiva, che abbiamo sopra definito, indispensabile per un ascolto di
buon livello.

Il fatto che sistemi facenti uso di un unico subwoofer possano venire giudicati equivalenti ai sistemi con diffusori distinti, sulla base di prove di ascolto (30), (31), (32), rivela in realtà i limiti di due altri componenti la catena di ascolto: le sorgenti di programma musicale disponibili e l’ambiente di ascolto.

Sistemi di altoparlanti con 2 subwoofer separati (a sinistra B&W CM2, a destra ESB Gold Two con SW2). La stereofonia alle frequenze basse richiede una corretta interazione tra i due sistemi di altoparlanti e le orecchie degli ascoltatori. Di conseguenza e contrariamente a quanto generalmente si crede, la possibilità di utilizzare un subwoofer unico per i due canali discende non tanto dalla non localizzabilità di suoni di frequenza molto bassa, quanto dalle caratteristiche proprie delle registrazioni commerciali nelle quali, per adeguarsi alle proprietà fisiche del microsolco e del canale radio stereofonico, si è costretti o comunque si tende a «monofonicizzare» le informazioni di bassa frequenza.

Sistemi di altoparlanti con 2 subwoofer separati (a sinistra B&W CM2, a destra ESB Gold Two con SW2). La stereofonia alle frequenze basse richiede una corretta interazione tra i due sistemi di altoparlanti e le orecchie degli ascoltatori. Di  conseguenza e contrariamente a quanto generalmente si crede, la possibilità di utilizzare un subwoofer unico per i due canali discende non tanto dalla non localizzabilità di suoni di frequenza molto bassa, quanto dalle caratteristiche proprie delle  registrazioni commerciali nelle quali, per adeguarsi alle proprietà fisiche del microsolco e del canale radio stereofonico, si è  costretti o comunque si tende a «monofonicizzare» le informazioni di bassa frequenza.

foto-4I tre richiami appena fatti si riferiscono a descrizioni di impianti con subwoofer; coprono un intervallo di tempo di venticinque anni ed una zona geografica che comprende Stati Uniti, Inghilterra ed Italia.

In tutti i casi si ha a che fare con normali ambienti domestici e con impianti Hi-Fi concepiti per la riproduzione da disco microsolco, il supporto audio di migliore qualità prima dell’avvento del digitale.

Un punto debole del disco microsolco, come abbiamo potuto vedere già nel secondo articolo di questa serie, è la sua scarsa attitudine a immagazzinare l’informazione stereofonica alle frequenze basse.

La differenza tra i segnali destro e sinistro è infatti tradotta in una modulazione verticale del solco, tanto più profonda quanto più la frequenza bassa: la massima ampiezza di questa modulazione è evidentemente limitata dallo spessore fisico del disco.Per evitare problemi, si usa ridurre la differenza tra i due canali sommandoli in mono al di sotto di una certa frequenza, dell’ordine del centinaio di Hertz; le migliori macchine di incisione incorporano questa funzione, consentendo la scelta sia della frequenza di inizio intervento sia delle quantità di segnale differenza da mantenere (11).

Per quel che riguarda l’ambiente di ascolto, indagini condotte per stabilire la sua influenza sulla spazialità del suono riprodotto (29) hanno stabilito che ambienti di piccole dimensioni (sotto i 40 m3) riducono la separazione alle frequenze basse, ma che questa può essere ripristinata mediante una opportuna elaborazione del segnale stereo.

La situazione attuale è dunque questa: l’impiego di un elaboratore di immagine sonora rende possibile una buona riproduzione delle frequenze basse anche in normali ambienti domestici; è però difficile che il materiale registrato disponibile abbia alle frequenze basse una sufficiente separazione.

Anche il compact-disc, benché immune dai problemi tecnici che affliggono il disco microsolco, in pratica subisce la medesima elaborazione, con la somma in mono dei due canali alle frequenze basse per esigenze di compatibilità mono in previsione della diffusione radiofonica (11).

di Carlo Zuccatti


Bibliografia

(7) Pierce J.B. – «La scienza del suono» (cap. 10), Nicola Zanichelli Editore Spa, Bologna, 1987. (Orig. «The science of musical sound», Scientific American Books Ine, New York, 1983).
(8) Benade A., H. – «From instrument to ear in a room: direct or via recording», Journal of the Audio Engineering Society, Voi. 33 n. 4 (aprile 1985).
(11) Feldman S. «Preparation of master tapes», Journal of the Audio Engineeing Society Vol. 34 n. 11 (novembre 1986).
(29) Griesinger D. – «Spaciousness and localization in listening rooms and their effeets on the recording technique», Journal of the Audio Engineering Society, Vol. 34 n. 4 (aprile 1986).
(30) Chen F.F. – «Common bass stereo speaker System», Audio (novembre 1961).
(31) Read D.C. – «Active crossover network – using a single bass speaker in a stereo System», Wireless World (novembre 1974).
(32) Giussani R., Moroni B. – «The audio bass – installazione, uso, ascolto», AUDIOreview n. 35 (gennaio 1985).

Altre letture sugli argomenti trattati

(33) AUDIOreview n. 7 (maggio 1982) – Elaboratori di immagine sonora.
(34) Toole F.E. – «Listening test-turning opinion into fact», Journal of thè Audio Engineering Society, Vol. 30 n. 6 (giugno 1982).
(35) Toole F.E. – «Subjective measurements of loudspeaker sound quality and listener performance», Journal of the Audio Engineering Society, Vol. 33 n. 1/2 (gennaio/febbraio 1985).


da AUDIOreview n.94 maggio 1990

Author: Redazione

Share This Post On

1 Comment

  1. Sempre un riferimento il nostro caro vecchio Audio Review!

Submit a Comment