La funzione primaria di questa serie di articoli dedicati all’alta fedeltà per chi non ne sa assolutamente nulla è quella di fornire spiegazioni semplici al fenomeno invero abbastanza complesso della riproduzione sonora.

Il concetto di distorsione armonica offre immediatamente il gancio nell’individuare il limite di pressione sonora che è possibile ottenere da un impianto HiFi. Gli amanti degli SPL elevati, vale a dire i membri onorari dell’associazione “Amici della manopola ad ore 3”, almeno una volta nella vita hanno verificato il senso di scarso appagamento che si può sperimentare con sistemi audio limitati dal punto di vista della massima pressione sonora. Alzando il volume, infatti, a un certo punto si prova ineluttabilmente una sensazione di fastidio tale da far ritornare nuovamente alla manopola del volume, questa volta per regolarla su posizioni meno indecenti. La sensazione in verità non è banalmente legata solo al limite dell’impianto audio, quanto alla sua capacità di riprodurre fedelmente le variazioni di livello sonoro, capacità detta “dinamica”: essa è alla base della corretta riproduzione tanto quanto risposta in frequenza e distorsione armonica.

La dinamica, fra musica e HiFi

La dinamica di un suono è praticamente la differenza fra il suo livello massimo e minimo espressa in decibel. In musica, i segni dinamici come il “crescendo” (simbolo: <) o il “diminuendo” (simbolo: >) indicano sullo spartito che l’intensità sonora dell’esecuzione deve rispettivamente crescere o decrescere: non una indicazione precisa, giacché, come noto, l’arte è foriera di interpretazione.

Sembra proprio che stavolta il parallelo fra mondo fisico e musicale sia cristallino: e dunque, sia che si guardi dal di qua che dal di là del buco della serratura, facciamo almeno in modo che non si trovi la chiave infilata nel mezzo… Andiamo allora a mettere in relazione la dinamica di un segnale con l’impianto attraverso cui deve transitare, abbracciando alcuni argomenti connessi. In ambedue i mondi citati, infatti, la parola… chiave dietro il concetto di dinamica è “differenza”: un livello di pressione sonora o di tensione elettrica di un segnale viene rapportato a un altro, ma – attenzione! – senza tenere in considerazione il livello medio generale (ovvero dell’intero brano). In altri termini, paradossalmente (?) il suono di un martello pneumatico può anche avere meno dinamica del canto. Per spiegare l’asserto vi è bisogno di un utile excursus, peraltro funzionale a quei cenni di teoria che non devono far difetto a chi vuole guardare da vicino l’HiFi. Osserviamo il grafico ampiezza-tempo del nostro pezzo musicale preferito. Siccome il suono è composto da compressioni e rarefazioni dell’aria, il grafico come sappiamo presenta valori rispettivamente positivi e negativi. Se ad un primo sguardo può apparire lecito prendere come massimo il punto più in alto sulla scala delle ampiezze, non altrettanto può dirsi del minimo, che potrebbe essere banalmente individuato al di sotto della linea atmosferica (Figura 1).

Figura 1 - Esempio di ricerca dei livelli minimo e massimo in un brano e determinazione della dinamica. Quest’ultima può essere determinata in due modi: o si dividono livello massimo e minimo e si trasforma in dB oppure si esprime dapprima ciascun livello in dB e poi la dinamica si ottiene dalla sottrazione fra livello max e min.

Figura 1 – Esempio di ricerca dei livelli minimo e massimo in un brano e determinazione della dinamica. Quest’ultima può essere determinata in due modi: o si dividono livello massimo e minimo e si trasforma in dB oppure si esprime dapprima ciascun livello in dB e poi la dinamica si ottiene dalla sottrazione fra livello max e min.

L’errore può essere riconosciuto facilmente rifacendosi alla solita didatticissima onda sinusoidale: la sua ampiezza è invariabilmente quella del picco, positivo o negativo che sia: essi sono uguali per definizione! E come si fa allora per la musica, fatta di tante sinusoidi? Bisogna guardare sia ai picchi positivi che negativi, rispettivamente sopra e sotto la linea atmosferica se ci troviamo nel dominio acustico, ovvero sopra e sotto la linea dello zero se il segnale è nel dominio elettrico (come nella figura), e prendere il più grande, senza badare al segno. Analogamente si agisce per cercare il livello minimo, solo che stavolta non si va a guardare il più lontano possibile dallo zero, bensì il più vicino. La differenza fra i due espressi in dB (oppure, ricordando la definizione di decibel, il rapporto fra i due trasformato poi in dB) è proprio la dinamica del brano musicale.

Nella pratica dell’ascolto, come si traduce il concetto di dinamica? Prendiamo un pezzo in cui vi sia un momento in cui gli strumenti si fermano e la cantante da sola sussurra: cercheremo il livello minimo proprio in corrispondenza di tale frangente. E se al ritornello il batterista picchia duro, la cantante dà fondo alle sue doti, tastiere, chitarre e basso, tutti gli strumenti suonano forte, altrettanto chiaramente lì sarà da cercarsi il livello massimo. Lo stesso accade per un brano al pianoforte, come il celeberrimo Notturno n. 2 di Chopin: generalmente il pianista suona dolcemente, agendo delicatamente sui tasti, mentre in altri momenti suona più forte, come nell’emozionante crescendo verso il finire del brano. È il risultato dell’esecuzione dei segni dinamici sullo spartito, che si traducono, fisicamente parlando, in momenti in cui il suono è meno intenso e altri in cui lo è di più, come abbiamo constatato nella disamina precedente.

Proprio un brano come questo, in cui è coinvolto un solo strumento, ci fa comprendere come la dinamica sia funzionale, necessaria, a una più coinvolgente fruizione del messaggio musicale. Senza essa si perderebbe gran parte del significato espressivo, e la carica emozionale praticamente ridotta al lumicino. Un esempio particolarmente eclatante è la “Sinfonia delle Alpi” di Richard Strauss, che inizia in modo sommesso per poi crescere, dapprima molto lentamente, e poi mano mano più velocemente fino a esplodere, musicalmente parlando. Senza il crescendo non si creerebbe mai quel climax che qualifica imprescindibilmente i primi minuti del famoso poema sinfonico.

In medio stat virtus

Gli esempi appena citati si rifanno, rispettivamente, alla musica pop-rock, a quella classica cameristica e infine alla sinfonica. Nel primo caso a suonare sono strumenti elettrificati, amplificati, e per goderne appieno è chiaro che il volume deve essere sostenuto: il genere lo esige, perlomeno quasi sempre (gli “Amici della manetta ad ore 3” ringraziano sentitamente). Lo stesso volume non è invece adatto al secondo esempio: per quanto un piano possa suonare… forte ci pare fuori luogo sentirlo competere in pressione sonora con un gruppo rock. Altrettanto può dirsi della sinfonica, sebbene un’orchestra di svariate decine di elementi possa indubbiamente suonare più forte del più celebre strumento a tastiera. Senza dubbio si può affermare che non solo ogni genere musicale, ma proprio ogni disco esige il giusto volume sonoro, anche in ragione dell’acustica del luogo di ripresa, della quantità di riverbero e della immaginaria posizione che l’ascoltatore dovrebbe assumere rispetto ai musicisti.

In termini appena più rigorosi, diciamo che ogni disco pretende un determinato livello medio. Quando regoliamo il volume, non facciamo altro che aumentare o diminuire l’ampiezza di ogni singola nota, sia quelle suonate piano che quelle suonate forte. In altre parole la regolazione del volume non intacca – in teoria! – la dinamica: se il brano musicale esibisce, per esempio, 30 dB di dinamica, alzando il volume aumenta l’intensità del suono sia degli urli del cantante che dei sussurri; ma la differenza in decibel fra essi rimane comunque di 30 dB.

Regolare il volume significa allora variare il livello generale del brano, livello che definiamo appunto “medio”. Ci si può chiedere come determinarlo, dato che più su abbiamo fornito un metodo per determinare invece quello massimo e minimo. Intanto, il primo non è la media aritmetica dei secondi: purtroppo non è così semplice! Per determinare la pressione acustica media di un brano bisogna rifarsi a considerazioni energetiche. Proseguiamo con ciò che già conosciamo: i livelli massimo e minimo, per come sono stati definiti, si raggiungono in un unico e solo punto del brano musicale.

Ma tutti i punti del brano, ovvero tutte le ampiezze, istante per istante, concorrono a determinare il livello medio, e non solo quelle prese in due singoli momenti, come la minima e la massima: ecco perché la loro media aritmetica non determina il livello medio! Il computo della media di tutti i punti del grafico temporale è certamente operazione non men che barbosa da effettuare a mano, ma fortunatamente è facilmente traducibile in un programma per computer.

Anche dal punto di vista musicale, il quadro non cambia. Fermo restando i segni dinamici (crescendo e diminuendo), l’intensità media – o, se vogliamo, il livello medio – col quale l’esecutore deve suonare il pezzo viene indicata generalmente all’inizio della partitura con simboli come ad esempio “pp”, “mf”, “f”, rispettivamente: pianissimo, mezzoforte, forte. Il musicista dovrà attenervisi in linea generale, e modulare l’intensità verso l’alto o verso il basso intorno a quella media. È quanto accade con l’impianto HiFi: si imposta un volume in base al livello medio percepito (o atteso) lasciando che il brano scivoli con la sua naturale evoluzione dinamica. Dunque, allo stato attuale delle conoscenze si potrebbe essere portati a pensare di alzare o abbassare il volume mantenendo inalterata la dinamica. Ma è davvero così?

La gamma dinamica di un componente HiFi

Dato che si è visto come testare un apparecchio sotto il profilo della risposta in frequenza e della distorsione armonica, ci si può chiedere se esista una misura della bontà di un elemento della catena di riproduzione rispetto alla dinamica. Domanda volutamente retorica: certo che sì! Si dice “gamma dinamica” di un apparecchio HiFi la differenza fra il livello massimo e quello minimo riproducibile da esso, indipendentemente dal brano musicale. La gamma dinamica è allora una caratteristica dell’apparecchio, il quale esibisce precisi limiti sia dal punto di vista del massimo segnale che può transitarvi, sia del minimo. Ambedue gli aspetti sono già stati accennati nel corso della rubrica, e troveranno qui una nuova collocazione.

Nei riguardi del livello massimo il fattore limitante è, come sappiamo dalle scorse note, la distorsione armonica. Ciascun anello della catena di riproduzione esibisce meccanismi diversi che generano distorsione, e dunque sarebbe non solo inutile ma controproducente accennarvi qui: l’argomento merita uno spazio a sé stante. Dal punto di vista intuitivo, tuttavia, torna utile il ragionamento ai limiti che, sebbene grossolano, aiuta certamente a fissare le idee. Utilizziamo un esempio per chiarezza. È esperienza comune che, aumentando il volume, un altoparlante si muova di più.

Questo accade con la musica così come con un tono puro. Conosciuta la frequenza della sinusoide da riprodurre, sappiamo automaticamente anche quante volte in un secondo la membrana dell’altoparlante deve compiere il suo ciclo dentro-fuori. Fissata la frequenza, asserire allora che l’altoparlante “si muove di più” può significare unicamente che esso compie una corsa più elevata: alzando il volume, cioè, la membrana deve spostarsi più in dentro e più in fuori. È chiaro che, pur disponendo di un amplificatore potentissimo e di un impianto a bassissima quanto nulla distorsione, a un certo punto l’altoparlante non potrà compiere escursioni maggiori anche se continuiamo ad aumentare il volume: semplicemente, potrebbe rompersi. Oppure non riuscirebbe a muoversi ulteriormente, cosa che produce una vistosissima distorsione. Ebbene, anche le elettroniche mostrano un comportamento grossolanamente simile: non è possibile per il segnale compiere escursioni maggiori di un certo livello, ovvero superare una determinata ampiezza.

Il fenomeno si denomina “clipping” ed è immediatamente udibile: il segnale, arrivato alla massima ampiezza, non riesce a superare la soglia massima e pertanto vien tosato in modo drastico, come la Figura 2 illustra meglio di mille parole.

Figura 2 - Tosatura drastica del segnale: clipping.

Figura 2 – Tosatura drastica del segnale: clipping.

La forma d’onda viene stravolta, e lo spettro risultante (Figura 3) declama pietà, tanto elevata (e udibile) è la distorsione armonica in presenza di clipping. Insomma, la povera elettronica alza vistosamente bandiera bianca. Esiste allora un limite preciso, netto, al massimo segnale riproducibile da qualunque elemento dell’impianto. Fortunatamente, prima che si raggiungano livelli pericolosi, l’impianto avvisa perché la distorsione cresce col volume prima di impennarsi improvvisamente quando ormai siamo all’hard limit del clipping. All’ascolto, infatti, quando si alza oltremisura il volume ci si attenderebbe un coinvolgimento crescente, il quale, tuttavia, sembra invece mancare, come se il messaggio musicale si svilisse.

Figura 3 - Spettro (qualitativo) del clipping.

Figura 3 – Spettro (qualitativo) del clipping.

Questa perdita di vitalità è l’effetto della cosiddetta “compressione dinamica”, vero e proprio flagello dell’audio made in 2013, come vedremo nel prossimo paragrafo. La compressione dinamica, quando non introdotta artificialmente con mezzi appositi, è un primo sintomo del sopraggiungere di una robusta distorsione, e ha come contropartita un contenimento dei picchi massimi: non già una vera e propria tosatura, ma una riduzione più graduale del livello massimo (Figura 4).

Figura 4 - La compressione ha come effetto una riduzione dei picchi dinamici, ma al contrario del clipping avviene in modo graduale.

Figura 4 – La compressione ha come effetto una riduzione dei picchi dinamici, ma al contrario del clipping avviene in modo graduale.

Tuttavia, siccome quello minimo non ha subito la medesima sorte (perlomeno non ancora…) possiamo senz’altro concludere che è diminuita la dinamica del brano che stiamo ascoltando. I picchi sono diminuiti di ampiezza ma i minimi no: la differenza è allora un numero minore.

Dall’altro capo della scala dinamica, verso lo zero del segnale, il fattore limitante non può essere più la distorsione armonica, giacché non sussistono sollecitazioni gravose per l’impianto, anzi: una indagine appena più approfondita rivela che in questo caso, per le elettroniche, il colpevole è il rumore. Per scoprirlo basta analizzare lo spettro dell’uscita di una elettronica quando essa non suona (ma è accesa): evidentemente le stiamo fornendo un segnale in ingresso che è pari a zero e in teoria essa dovrebbe restituire altrettanto. Ciò che l’apparecchio esibisce in tale condizione è invece praticamente rumore bianco. Esso ha genesi varia e pertanto, così come per i meccanismi distorsivi, rimandiamo la spiegazione al futuro capitolo che tratterà specificamente delle elettroniche. In genere, insieme al rumore troviamo anche alcune componenti spettrali di frequenza 50 Hz e multipli (Figura 5): trattasi di un disturbo (ovvero di un segnale indesiderato) dovuto alla necessaria fornitura di corrente dalla rete elettrica nazionale senza la quale l’apparecchio, come sappiamo, non potrebbe funzionare.

Figura 5 - Rumore di fondo di un’elettronica: notare le righe spettrali dei 50 Hz e le armoniche, spesso presenti ma non sempre.

Figura 5 – Rumore di fondo di un’elettronica: notare le righe spettrali dei 50 Hz e le armoniche, spesso presenti ma non sempre.

L’ente distributore di energia infatti eroga elettricità sotto forma di una… sinusoide a 50 Hz. Possiamo riguardare alla fornitura di energia elettrica a sua volta come un segnale che riesce in qualche modo a essere trasmesso all’uscita. La presenza di armoniche significa pure che tale segnale viene deformato: dopo il danno, la beffa! Quale il risvolto pratico della limitazione operata dal rumore? Abbassando il volume, ad un certo punto, il suono finirà per essere contaminato in percentuale sempre maggiore dal rumore, sino a confondersi con esso: dunque il rumore ha un effetto mascherante sul segnale. Come quando si tenta di condurre una civile conversazione durante una riunione di condominio: tentativo vano… Se nel frattempo non si è diminuito troppo il volume, allora ad essere mascherato sarà solo il livello minimo: anche in questo caso, per ragioni del tutto analoghe alla compressione, la dinamica viene a ridursi.

Riassumiamo quanto sinora spiegato visualizzando i limiti dinamici con un grafico (Figura 6) che a questo punto dovrebbe risultare sufficientemente esplicativo. È da rimarcare che così come la distorsione armonica, il rumore può essere espresso come percentuale del segnale indistorto e indisturbato. È invalso l’uso di misurare il valore combinato in percentuale di distorsione totale “THD” (“Total Harmonic Distortion”) e di rumore “N” (“Noise”) col simbolo: “THD+N”.

Figura 6 - Livello medio sull’asse delle ascisse, livelli minimo e massimo su quello delle ordinate. Le linee rossa e blu tratteggiate sono rispettivamente il limite del rumore e del clipping. Notare come a bassi ed alti volumi (livelli medi) la dinamica, rappresentata dai segmenti verdi A, B e C, sia ridotta (A e C) rispetto alla situazione normale (B).

Figura 6 – Livello medio sull’asse delle ascisse, livelli minimo e massimo su quello delle ordinate. Le linee rossa e blu tratteggiate sono rispettivamente il limite del rumore e del clipping. Notare come a bassi ed alti volumi (livelli medi) la dinamica, rappresentata dai segmenti verdi A, B e C, sia ridotta (A e C) rispetto alla situazione normale (B).

Dinamica e livello medio: la guerra del ventunesimo secolo

Uno dei fenomeni percettivi più noti affonda le radici nel legame fra volume sonoro e qualità percepita, nel senso che, messi a confronto diretto lo stesso brano riprodotto con volumi diversi e su apparecchi diversi, viene percepito come qualitativamente migliore l’apparecchio che riproduce a livello più alto: per questo motivo il confronto all’ascolto fra componenti HiFi va fatto allo stesso SPL.

Ma d’altro canto, per lo stesso principio, il brano a livello più alto sembra suonare meglio pur se la catena di riproduzione è la medesima. Allo scopo di attirare l’attenzione dell’acquirente verso di loro, le case discografiche hanno iniziato letteralmente a farsi la guerra pompando oltremodo il livello medio sino a dover comprimere artificialmente la dinamica per evitare il clipping (che pure talvolta può avere luogo). Il suono delle registrazioni post “loudness war” (“guerra del volume” fra le major discografiche) è per tale motivo povero, spento: fa tanto rumore ma suscita poca emozione.

Pur tuttavia, ad avviso di chi scrive, lo scempio al quale sono sottoposti alcuni dischi non rappresenta il peccato originale, essendo quello malcelato dall’indice di tolleranza del pubblico verso manipolazioni così spinte. Ne è un esempio l’algoritmo di compressione MP3, diffusosi a macchia d’olio in men che non si dica. Come è bene sapere o ribadire, l’Mpeg Layer 3 prevede la compressione dei dati audio sacrificando le informazioni ritenute non essenziali secondo assunzioni basate sulla psicoacustica.

Al di là della bontà di tali ragionamenti, ciò che conta è che in ogni caso il suono originale viene decurtato di una sua parte e questo, ovviamente, non è HiFi… La minore fedeltà, tuttavia, non è bastata come deterrente verso la diffusione dell’MP3 le cui comodità e versatilità ne hanno invece decretato il successo di pubblico. Solo un interrogativo mi attanaglia: una volta che il mondo sia divenuto comodo e versatile a 360 gradi, giungerà l’ora di rilassarsi con della buona musica?

di Valerio Russo

da AUDIOreview n. 342 aprile 2013