Oltre il muro dei 20 kHz

Ci siamo lasciati la volta scorsa proponendoci di rispondere a tre domande che ritengo basilari per comprendere se la musica liquida, con i suoi formati a risoluzione e frequenze di campionamento sempre più elevate, apporta reali benefici all’ascolto o è solo un’illusione.

Le domande a cui cercheremo di dare risposta sono:

  • C’è musica oltre i 20 kHz?
  • Siamo capaci di percepire tali frequenze?
  • I nostri impianti audio sono in grado di riprodurle?

Questioni spesso dibattute tra gli appassionati di audio ma che fino ad ora non hanno ricevuto quella validazione scientifica che meritano, lasciando che i “forse” e i “sembra” prendessero il sopravvento. Cerchiamo allora di fugare ogni dubbio, fornendo i risultati di alcune ricerche già disponibili da anni e riconducibili a prove strumentali e scientifiche condotte da studiosi interessati ad allargare gli orizzonti del sapere sulla percezione audio e ad indagare sul comportamento del cervello nella percezione dei suoni. Studi selezionati, quindi, non solo per il valore della ricerca in se stessa ma per avere una visione d’insieme che sia più vicina alle esperienze di ascolto degli appassionato di audio. L’articolo che segue prende quindi spunto da alcuni trattati che ritengo più importanti e significativi visti dalla parte di un audiofilo, in relazione all’ascolto della musica.

C’è musica oltre i 20 kHz?

Per dare una risposta certa ed inequivocabile bisogna rifarsi a rilevazioni dello spettro audio oltre il limite dei 20 kHz, effettuate utilizzando apparecchiature in grado di evidenziare la gamma delle frequenze ed i relativi livelli sonori emessi da uno strumento reale, ripresi in un ambiente opportuno.
Una risposta esauriente ce la fornisce James Boyk del California Institute of Technology, in un lavoro pubblicato nel 1997, con il preciso scopo di indagare su quanta energia sonora fosse ancora emessa dai principali strumenti di una orchestra al di sopra dei 20 kHz.
La ricerca ha stabilito che ogni famiglia di strumenti musicali, archi, ottoni, fiati e percussioni, ha almeno un membro che produce suoni al di sopra di tale limite, evidenziando come molti strumenti producono ancora significativi livelli di energia a 40 kHz. Non solo, in alcuni spettri di frequenza l’energia era ancora molto elevata al raggiungimento del limite di misura di questo lavoro, posto a 102,4 kHz.
Lo studio appare interessante pur con le limitazioni degli strumenti di misura allora disponibili e per essere stato eseguito in un grande auditorio.
Lo studio parte dalla acquisizione degli spettri di frequenza degli strumenti ripresi con un microfono posto a circa 1,2 metri dalla sorgente sonora, garantendo una libera emissione del suono, non ostacolato cioè da riflessioni, ad eccezione di quella naturale data dal pavimento e dallo stesso strumentista, godendo di una naturale dispersione in ambiente.

Figura 1 - Lo spettro armonico, captato da un microfono posto a poco più di un metro, di una nota suonata da una tromba con sordina (linea nera); la linea azzurra rappresenta il livello di rumore ambientale. I limiti fisici del set up di misura impediscono di andare oltre i 100 kHz.

Figura 1 – Lo spettro armonico, captato da un microfono posto a poco più di un metro, di una nota suonata da una tromba con sordina (linea nera); la linea azzurra rappresenta il livello di rumore ambientale. I limiti fisici del set up di misura impediscono di andare oltre i 100 kHz.

In Figura 1 è presente l’immagine dello spettro in frequenza di una nota di tromba con sordina ripresa a poco più di un metro di distanza. Si nota con chiarezza che la fondamentale è posta piuttosto in basso, a 465,4 Hz, con un picco massimo posto a circa 2.000 Hz del valore di 90,8 dB. Si può notare nel grafico come il suono resti a livelli elevati anche nella banda delle frequenze ultrasoniche, tanto che a 50 kHz risulta di circa 12 dB superiore al livello del rumore di fondo. I numerosi picchi con andamento decrescente sono le armoniche, individuate con maggiore precisione nelle Figure 2 e 3.

Figura 2 - Lo spettro di Figura 1 è stato suddiviso in quattro bande: qui sono rappresentate le prime due da 320 a 8k Hz e da 15 a 32 kHz. I pallini tondi sono dei marcatori di armoniche (fonte Journal of Neurophysiology).

Figura 2 – Lo spettro di Figura 1 è stato suddiviso in quattro bande: qui sono rappresentate le prime due da 320 a 8k Hz e da 15 a 32 kHz. I pallini tondi sono dei marcatori di armoniche (fonte Journal of Neurophysiology).

Figura 3 - Anche in questo caso sono messe in evidenza due porzioni di banda della Figura 1 ed in particolare nel tracciato in alto si può contare la centesima armonica posta a 46.540 Hz, mentre in quello inferiore si nota come superati i 55 kHz il tracciato perda la struttura armonica ma conservi una elevata energia residuale (fonte Journal of Neurophysiology).

Figura 3 – Anche in questo caso sono messe in evidenza due porzioni di banda della Figura 1 ed in particolare nel tracciato in alto si può contare la centesima armonica posta a 46.540 Hz, mentre in quello inferiore si nota come superati i 55 kHz il tracciato perda la struttura armonica ma conservi una elevata energia residuale (fonte Journal of Neurophysiology).

La traccia inferiore della Figura 1 mostra il rumore di fondo con la tromba in silenzio. Naturalmente questo rumore è presente anche quando la tromba suona, ed è per questo che la traccia superiore è identificata come “Trumpet + Background”. I picchi stretti e ravvicinati, evidenziati nella Figura 1, sono realmente le varie armoniche che lo strumento produce? Per scoprirlo abbiamo bisogno di allargare quanto più possibile la scala delle frequenze dividendo lo spettro in quattro parti (Figure 2 e 3) adeguandone anche il livello in modo da avere lo sviluppo delle frequenze allineate sullo stesso grafico.
Per facilitare l’individuazione delle armoniche sono stati inseriti dei marcatori che evidenziano come ad ogni picco corrisponda un’armonica. In particolare troviamo lo spettro armonico che nel primo grafico in alto di Figura 2 è limitato alla frequenza di 8 kHz, mentre il secondo grafico in basso rappresenta la porzione di spettro che va dai 15 ai 32 kHz.
Infine, la Figura 3 evidenzia la porzione di spettro dai 38 ai 53 kHz, che riporta il conteggio delle armoniche, con la numero 100 posta a 45.560 Hz.
Il grafico in basso di Figura 3 mostra che a partire da 55 kHz, le armoniche stanno scomparendo. Si noti che, come illustrato nella Figura 1, il suono emesso dalla tromba a queste frequenze è ancora al di sopra del rumore di fondo di circa 12-15 dB. L’autore della ricerca sostiene pertanto che l’energia a 55 kHz, anche se non più di tipo armonico, fa parte integrante del suono della tromba e come tale deve essere considerata per il suo elevato livello energetico.
Questo il caso evidenziato nella ricerca che con lo stesso metodo ha indagato anche su altri strumenti dell’orchestra, suddividendoli in strumenti a sviluppo armonico e strumenti senza armoniche (piatti, batterie, ecc.), trovando che le armoniche del corno francese possono estendersi al di sopra dei 90 kHz, accreditate di una bassa percentuale di energia in banda ultrasonica; la tromba raggiunge gli 80 kHz, violino e oboe sono prossimi ai 40 kHz, mentre un colpo di piatti non mostra segni di esaurimento di energia a 100 kHz (limite massimo della misura).
La percentuale di energia superiore a 20 kHz è bassa per la maggior parte degli strumenti, ma per un campione di tromba è pari al 2%, per un altro campione è lo 0,5%, per un parlato sibilante è l’1,7% e per il colpo di piatti il 40%. L’energia del piatto non mostra alcun segno di fermarsi raggiunto il limite di misura, quindi la sua percentuale può essere molto più alta. Curiosamente due strumenti, il clarinetto ed il vibrafono, non hanno mostrato ultrasuoni.

Deduzioni

Lo studio ci propone un estratto di come le componenti ad alta frequenza degli strumenti di un’orchestra siano ricchi di contenuto energetico oltre il muro dei 20 kHz, anche se questa caratteristica non è uguale per tutti. Ad esempio, per un pianoforte il contenuto energetico è di appena lo 0,02% e vede un’estensione in frequenza di 70 kHz, mentre per la tromba può arrivare al 2% con un’altrettanto elevata estensione in frequenza. Sta di fatto che ogni famiglia di strumenti musicali include almeno un componente in grado di emettere suoni oltre i 20 kHz.
A questo punto resta da verificare se il nostro sistema uditivo è in grado di apprezzare tutto ciò, per cui affrontiamo il secondo quesito.

 

Siamo in grado di percepire tali frequenze, e se sì come?

Prima di addentrarci nei meandri del nostro sistema uditivo è bene cercare di capire a grandi linee il funzionamento accertato del cervello umano e dei meccanismi con i quali percepisce ed interpreta lo spazio intorno a noi, alla continua ricerca di quelle anomalie che possono mettere la nostra persona in pericolo. Rumori, luci e odori possono essere interpretati dal cervello come stimoli rassicuranti o indurre ad un particolare stato di attenzione, se il cervello riscontra un’anomalia, qualcosa di non riconosciuto e quindi un possibile pericolo.
Questo comportamento è uno dei meccanismi di base per la salvaguardia della specie, dove di fronte ad una anomalia persistente si attuano opportuni sistemi di difesa o fuga.
Già questo mette in risalto due elementi basilari sul funzionamento del cervello, che sono giunti immutati sino ai giorni nostri: la continua e costante fase di apprendimento ed una percezione a tre dimensioni dello spazio che ci circonda, utilizzando principalmente tre dei cinque sensi: udito, vista e olfatto.
Proviamo a chiarire la situazione cominciando dal secondo elemento individuato, ovvero la percezione tridimensionale dello spazio intorno a noi.
Attraverso l’udito, o meglio il sistema uditivo nel suo insieme, composto cioè dalle orecchie e dal cervello, si ha una percezione dello spazio intorno a noi e si è in grado di udire suoni o rumori che ci circondano a 360°. È come se il cervello scattasse delle ”immagini sonore” dello spazio che ci circonda analizzando i soggetti che di volta in volta sono presenti nella foto, utilizzando all’occorrenza anche altri sensi.
Questa capacità di analisi viene spesso supportata anche dalla vista, che riesce a focalizzare l’attenzione su di un angolo di maggiore attenzione dell’occhio, di circa 55°. Ma per orientare lo sguardo nella direzione giusta c’è bisogno che il sistema uditivo dia una indicazione sulla provenienza del suono o del rumore anomalo, mettendo quindi il sistema uditivo al primo posto in una ipotetica scala di valori dei cinque sensi, seguito dalla vista e dall’olfatto.
Possiamo affermare che la necessità di conoscere lo spazio che ci circonda è un elemento basilare per la nostra esistenza, tanto che l’udito è l’unico dei cinque sensi che non va mai a dormire!
Abbiamo detto poco sopra che il cervello è in continuo e costante apprendimento, allo scopo di associare ogni suono o rumore ad un oggetto o causa che lo ha prodotto. Per capire ed analizzare le migliaia di stimoli sonori che lo raggiungono, il cervello archivia la struttura del suono o del rumore catalogandolo nella memoria. In questo modo si creano degli archivi collegati tra loro che permettono, una volta riconosciuto il suono o rumore, di dare una prima classificazione del tipo: pericoloso – non pericoloso.
Vediamo di fare un esempio prendendo il rumore dello stridore della gomma sull’asfalto. Di solito lo si associa ad una frenata brusca, il che pone di per sé uno stato di attenzione come analisi di rumore, ma va sempre integrato con altri sensi ed archivi. Se sono in strada quel rumore genera un’attenzione particolare perché viene percepito come un pericolo, ma tutto si trasforma se invece di essere in mezzo alla strada sto assistendo ad uno spettacolo acrobatico di auto, in tutta sicurezza.
Questo continuo apprendimento ed analisi inizia sin dai primi giorni di vita e termina il giorno della nostra dipartita. Ma come e cosa andiamo ad archiviare e codificare?
Il nostro cervello archivia in modo differente in funzione della natura dello stimolo sonoro, se è una voce umana o uno strumento musicale possiamo dire, semplificando, che archivia lo spettro armonico con i relativi livelli di energia delle armoniche, oltre ai tempi di attacco. Anche i rumori sono trattati allo stesso modo, ponendo cioè grande attenzione ai tempi di attacco e alla distribuzione energetica dello spettro che non può soffermarsi sulle armoniche, che in un rumore sono assenti.
È questo ciò che viene definito “timbro”, termine che in origine indicava proprio il sigillo o la firma, che lega in modo indissolubile quel tipo di suono (analisi spettrale e tempo di attacco) ad un oggetto sonoro. Per capirne il funzionamento possiamo far riferimento al timbro che ognuno di noi dà a una voce familiare, il timbro ad essa associato è unico ed inconfondibile non solo quando ci parla in modo diretto ma anche se grida o canta, e se la sentiamo al telefono o al citofono (affetto di solito da una larghezza di banda molto ristretta) riusciamo sempre a riconoscerla grazie alla grande capacità di analisi e confronto dei vari archivi del nostro cervello.
Questo modo di elaborare gli stimoli sonori apre una grande porta verso le complesse operazioni che si svolgono subito dopo l’organo del Corti ospitato nella coclea, quando cioè la vibrazione che viaggia all’interno dell’orecchio si trasforma in una serie di impulsi elettrici che raggiungono la corteccia cerebrale.
Infatti si conoscono bene i meccanismi e le funzioni che svolgono i singoli componenti dell’orecchio, ma da quel punto in poi tutto è frutto di ipotesi o teorie non suffragate dal conforto scientifico.
In effetti, nel capire i meccanismi, i legami tra le varie memorie, le neuroscienze hanno fatto passi da gigante negli ultimi quindici anni aprendo, con rigore scientifico, nuove strade verso la comprensione di come funzioni quella “macchina” unica ed eccezionale che è il cervello.
Prima di presentarvi uno dei lavori più interessanti per l’accertamento di come e se il cervello percepisca le frequenze ultrasoniche, è bene fare un piccolo riassunto di come funziona l’orecchio umano.
Per rendere semplice la comprensione possiamo analizzare la Figura 4 che rappresenta in modo schematico un orecchio umano ed il suo funzionamento.
Gli stimoli sonori vengono raccolti dal padiglione e convogliati nel condotto uditivo; ricordo che ogni suono o rumore porta in sé una gran quantità di frequenze che si sommano in un’onda di pressione che le contiene tutte. Quindi ogni stimolo sonoro identificato in un’onda di pressione contiene al suo interno una gran quantità di informazioni. Anche se non ce ne accorgiamo ogni istante possiamo essere raggiunti da migliaia di stimoli sonori, con i loro spettri di frequenze che raccolti dal padiglione esterno sono indirizzati verso il timpano.

Figura 4 - Schema del principio di funzionamento dell’orecchio umano. Il padiglione esterno raccoglie i suoni che giungono dall’ambiente e li convoglia verso la membrana del timpano; la vibrazione percorrendo l’orecchio interno raggiunge l’organo del Corti dove sono presenti i corpi ciliati. In pratica i suoni vengono sommati in un unico segnale che viaggia all’interno dell’orecchio. Prima di essere consegnata al cervello, questa vibrazione viene scomposta in frequenza come farebbe un analizzatore di spettro.

Figura 4 – Schema del principio di funzionamento dell’orecchio umano. Il padiglione esterno raccoglie i suoni che giungono dall’ambiente e li convoglia verso la membrana del timpano; la vibrazione percorrendo l’orecchio interno raggiunge l’organo del Corti dove sono presenti i corpi ciliati. In pratica i suoni vengono sommati in un unico segnale che viaggia all’interno dell’orecchio. Prima di essere consegnata al cervello, questa vibrazione viene scomposta in frequenza come farebbe un analizzatore di spettro.

Semplificando possiamo dire che nel momento di colpire la membrana del timpano tutte queste onde di pressione si fondono in un’unica onda che genera la vibrazione dello stesso, mettendo in moto la trasmissione di questa vibrazione lungo le componenti dell’orecchio interno che giunge sino alla coclea dove all’interno ci sono le cellule ciliate dell’organo del Corti. In pratica la coclea è un condotto rastremato lungo il quale viaggia la vibrazione raccolta dalla membrana del timpano.
Lungo la coclea sono distribuiti circa 16.000 ricettori; ogni ricettore è collegato in un elevato numero di cellule ciliate che varia dalle 50 alle 100 unità per ricettore (Figura 5), ognuna delle quali ha la capacità di risuonare ad una determinata frequenza, e se all’interno della vibrazione è presente quella frequenza la cilia “entra in risonanza” inviando uno stimolo elettrico ad alcune cellule poste in determinate aree della corteccia cerebrale.

Figura 5 - La foto al microscopio elettronico mostra uno dei 16.000 ricettori con le sue tre file di sensori ciliati che possono variare nel numero da 50 a 100 per ricettore.

Figura 5 – La foto al microscopio elettronico mostra uno dei 16.000 ricettori con le sue tre file di sensori ciliati che possono variare nel numero da 50 a 100 per ricettore.

Per capirne il funzionamento possiamo fare un paragone con il senso della vista. Se osserviamo una linea verticale, l’immagine che si imprime sulla retina va ad attivare una determinata cellula posta sulla corteccia cerebrale visiva. Quella cellula non analizza l’oggetto che mette in evidenza la linea verticale, se è cioè una matita o un lampione, non è chiamata a riconoscere l’oggetto, ma a contribuire alla sua definizione, inviando un segnale al cervello che dice semplicemente che quella linea o soggetto “è verticale” e basta. Allo stesso modo ci sono altre cellule dedicate per le linee orizzontali, altre per identificare i colori, le superfici e via di questo passo.
Questa analisi dettagliata che parte dalle fondamenta degli elementi, consente di avere aree del cervello con elevati livelli di specializzazione (il riconoscimento della posizione verticale di un oggetto visivo, il colore, ecc.).
Tornando agli stimoli sonori possiamo affermare che in ogni istante sono prodotti migliaia di stimoli elettrici a differenti frequenze che possono anche nel caso della musica e dei rumori superare i confini della nostra banda audio udibile. Ma come associare tutti questi dati con le sorgenti sonore, come è possibile e soprattutto quale meccanismo intercorre per ricostruire correttamente questo immenso puzzle?
Immaginate quale complessa opera di riconoscimento e classificazione deve esserci alle spalle, finalizzata al raggiungimento di un unico risultato: la continua ricerca delle anomalie!
Infatti quelle singole frequenze vengono confrontare con l’archivio dei timbri, accoppiate tra loro, ed una volta riconosciute e ricostruite messe in secondo piano. Solo quando qualche “tessera del puzzle” non trova una valida collocazione fa sì che il cervello raccolga le sue energie per definirne la natura, capire da cosa sia generata, facendo anche analisi integrate con gli altri sensi e al limite delle supposizioni.
È quello che accade quando si ascolta, dal nostro impianto, un rumore ambientale presente in una registrazione di musica dove non abbiamo il supporto della vista, perché davanti a noi non ci sono gli esecutori; percepiamo un rumore “strano” e se non riusciamo a catalogarlo subito andiamo avanti con le ipotesi visto che siamo in assenza della possibilità di acquisire maggiori informazioni per trasformare quella ipotesi in certezza.
La specializzazione delle cellule della corteccia cerebrale ha permesso l’identificazione di aree specifiche dedicate agli altri sensi, allo sviluppo della parola, dei gesti motori e molto altro.

 

Un test interessante

L’American Physiological Society ha pubblicato, nel giugno 2000, i risultati di una ricerca effettuata da un gruppo di studiosi dell’università di Kyoto finalizzata a verificare se il sistema uditivo umano è in grado di percepire le frequenze oltre il limite dei 20 kHz.
Lo studio è particolarmente interessante e lo propongo in quanto molto vicino alla realtà del mondo audiofilo, visto che non usa toni puri o segnali specifici da laboratorio, ma un brano musicale appositamente registrato.
Il brano scelto è una musica tipica delle isole di Bali, prodotto da un’orchestra “gamelan”, ricca di strumenti che producono alte frequenze e registrato con un set di microfoni, pre e alimentatori B&K, un convertitore AD/DA ad 1 bit e frequenza di campionamento posta a 1,92 MHz ed un adeguato registratore digitale. Questo segnale che si estende sino ai 50 kHz è stato diviso in due parti, ponendo come frequenza di separazione i 22 kHz, creando così la terna di segnali in Figura 6: il primo a banda intera (A), il secondo al di sotto dei 22 kHz (B) ed il terzo superiore ai 22 kHz (C).

Figura 6 - Lo spettro in frequenza del brano di musica “gamelan” utilizzato come campione si estende sino ai 50 kHz. In alto nella sua raffigurazione originale e in “A” come riprodotto nel punto di ascolto. Il brano è stato diviso in due parti filtrate a circa 22 kHz ottenendo due segnali “B” e “C”. Il segnale “B” rappresenta il suono in banda audio sotto i 22 kHz, mentre il segnale “C” è la parte oltre i 22 kHz.

Figura 6 – Lo spettro in frequenza del brano di musica “gamelan” utilizzato come campione si estende sino ai 50 kHz. In alto nella sua raffigurazione originale e in “A” come riprodotto nel punto di ascolto. Il brano è stato diviso in due parti filtrate a circa 22 kHz ottenendo due segnali “B” e “C”. Il segnale “B” rappresenta il suono in banda audio sotto i 22 kHz, mentre il segnale “C” è la parte oltre i 22 kHz.

La ricerca era finalizzata all’individuazione di aree della corteccia cerebrale che vengono attivate dalla percezione d’ascolto dei tre segnali visti poco sopra, utilizzando per l’analisi il principio per cui una cellula che si attiva emette un segnale elettrico che può essere captato dai sensori di un encefalogramma, oltre a richiede una maggiore quantità di ossigeno con conseguente maggior afflusso di sangue in quella zona della corteccia cerebrale.
Quindi la ricerca su soggetti “normali”, nella fascia di età compresa tra i 16 e i 43 anni, è stata condotta con due differenti sistemi di analisi: elettroencefalogramma di onde Alfa (Alpha EEG) e tomografia ad emissione di ositroni (PET).
Ai soggetti bendati posti sotto test venivano fatti ascoltare, in doppio cieco, i tre spezzoni di brano intervallati da un quarto che rappresenta il rumore di fondo, riprodotti da un sistema audio con una coppia di casse acustiche equipaggiate con un supertweeter in grado di raggiungere i 100 kHz.

 

I risultati

In Figura 7 sono evidenziate le aree del cervello interessate all’analisi del suono rilevate tramite dodici sensori dell’elettroencefalogramma. Nella posizione “Baseline” viene mostrata in colore la parte di corteccia cerebrale attiva quando si ascolta il solo rumore di fondo presente in ambiente. L’immagine seguente, ”LCS” (Low Cut Sound, ovvero limitata alle sole frequenze oltre i 22 kHz), mostra un ampliamento della porzione di corteccia cerebrale maggiormente attiva (zona rossa). Questo lascia intendere che qualcosa accada di diverso rispetto all’assenza di suoni. La terza immagine, “HCS” (High Cut Sound, ovvero limitata alle frequenze sotto i 22 kHz), mostra come la porzione di corteccia attiva si ampli ulteriormente, con una maggiore estensione verso il lato sinistro. Infine, nella quarta immagine, “FRS” (Full Range Sound, ossia a banda intera) la porzione di corteccia cerebrale attiva si amplia notevolmente rispetto a tutte le altre condizioni, lasciando intendere che la presenza di uno spettro di frequenze più esteso sia in qualche modo percepito dal sistema uditivo.

Figura 7 - L’immagine riassume l’attività della corteccia cerebrale misurata con 12 sensori dell’elettroencefalogramma. La prima immagine si riferisce all’ascolto del rumore di fondo presente nella sala in condizioni di riposo e silenzio; “LCS” (Low Cut Sound) è riferita all’attività delle cellule cerebrali facendo ascoltare solo la parte ultrasonica; in “HCS” (High Cut Sound) notiamo la parte di corteccia interessata dal solo segnale in banda audio; l’ultima, “FRS” (Full Range Sound), evidenzia l’attività cerebrale quando la si stimola con il segnale a banda intera, ultrasuoni compresi (fonte Journal of Neurophysiology).

Figura 7 – L’immagine riassume l’attività della corteccia cerebrale misurata con 12 sensori dell’elettroencefalogramma. La prima immagine si riferisce all’ascolto del rumore di fondo presente nella sala in condizioni di riposo e silenzio; “LCS” (Low Cut Sound) è riferita all’attività delle cellule cerebrali facendo ascoltare solo la parte ultrasonica; in “HCS” (High Cut Sound) notiamo la parte di corteccia interessata dal solo segnale in banda audio; l’ultima, “FRS” (Full Range Sound), evidenzia l’attività cerebrale quando la si stimola con il segnale a banda intera, ultrasuoni compresi (fonte Journal of Neurophysiology).

Tutti i soggetti sotto test evidenziano che la maggiore estensione del segnale a banda intera conferisce maggiore ariosità, dettaglio e ambienza rispetto allo stesso segnale limitato a 22 kHz, tutto questo a prescindere dall’età, dal sesso e dalle condizioni psicofisiche del soggetto.
Da aggiungere inoltre che nei soggetti posti sotto test si è notato come il segnale a banda intera “FRS”, attraverso la PET, evidenzia anche un interessamento del tronco encefalico Figura 8 e della parete del talamo sinistro, in pratica la parte di cervello più antico che è responsabile dell’emissione di sostanze in grado di indurre uno stato di piacevolezza e tranquillità.

Figura 8 - Immagine della PET quando viene fatto ascoltare il segnale a banda intera, ultrasuoni compresi, dove si nota un interessamento anche del tronco encefalico di sinistra.

Figura 8 – Immagine della PET quando viene fatto ascoltare il segnale a banda intera, ultrasuoni compresi, dove si nota un interessamento anche del tronco encefalico di sinistra.

Appurato che la presenza delle frequenze oltre i 22 kHz determina degli effetti misurabili sulla corteccia cerebrale, resta da definire come sia possibile la loro percezione, dal momento che altri studi parlano di limiti fisiologici dell’orecchio interno nella percezione di tali frequenze. Gli stessi ricercatori lanciano due ipotesi. La prima, ritenuta meno probabile, è che la presenza delle frequenze al di sopra dei 22 kHz determini un affinamento delle capacità percettive della membrana del timpano; più probabile, invece, secondo gli stessi ricercatori, che le più alte frequenze possano essere percepite attraverso percorsi diversi dal canale uditivo (come la trasmissione ossea, anche se non viene dichiarata apertamente). A supporto di questa tesi posso riportare la presentazione di uno studio del 2011, che vede coinvolte diverse realtà genovesi, tra cui l’Istituto di Biofisica del CNR (Almanacco della Scienza), in merito alla realizzazione di una “protesi acustica ad ultrasuoni” che utilizza la stimolazione ossea come canale di trasmissione. Interessante anche l’annuncio riportato sul quotidiano La Stampa.it, che recita testualmente: “secondo gli scienziati della Marina Militare USA sottacqua è possibile udire la quasi totalità della gamma dei suoni ed arrivare fino ad una frequenza di 200 kHz” (Estratto del 27-05-2011), sempre attraverso la trasmissione ossea, visto che in immersione la membrana del timpano è compressa. In particolare, i ricercatori del Naval Medical Research Lab di Groton, nel Connecticut (USA), hanno definito una zona precisa del cranio indicando il mastoide (protuberanza ossea posta dietro l’orecchio) quale principale fonte di partenza dei suoni verso l’orecchio interno. Tutto lascia pensare che in qualche modo il corpo umano riesca a percepire gli ultrasuoni e che questi contribuiscano ad aumentare quella sensazione di piacevolezza già nota da tempo ed associata alla presenza di altissime frequenze.

 

Alcune riflessioni personali

Personalmente credo che il cervello elabori contemporaneamente le vibrazioni che arrivano all’orecchio interno, sia attraverso la stimolazione ossea che attraverso la membrana del timpano, e che tenga in maggiore considerazione quando gli spettri di frequenze sono direttamente correlati, ovvero quando la presenza di ultrasoniche segua lo stesso andamento di un suono in banda audio, come nel caso visto in apertura della tromba con sordina: solo in questo caso si percepisce un miglioramento delle condizioni di ascolto.
La percezione delle frequenze in banda audio ed ultrasonica attraverso la trasmissione ossea è possibile grazie anche ad altri fattori esterni quali una ampia superficie cranica libera da muscoli o grasso nelle zone parietali, zona di solito a contatto con l’archetto della cuffia, e occipitale (confinante con la parietale, scende fino al cervelletto). Questa ampia zona è libera di percepire le onde di pressione che per le frequenze ultrasoniche basse (banda che va dai 30 ai 70 kHz) è in grado di penetrare nei tessuti per profondità comprese tra i 10 ed i 15 mm (usata nella cavitazione ultrasonica per il trattamento estetico della pelle e dei tessuti sottostanti).
Interessante notare come il nostro cranio sia disaccoppiato a livello osseo dal resto del corpo dalla prima vertebra cervicale, con il dente epistrofeo (Figura 10) che consente liberi movimenti della testa in tutte le direzioni, limitati, per evitare danni agli organi interni, da un ulteriore anello detto atlante posto in corrispondenza della prima vertebra cervicale. Se osservate meglio la figura, la prima vertebra cervicale agisce come una specie di punta (la sottopunta è nella base del cranio).

Figura 10 - La struttura ossea alla base del cranio si compone di due parti: la prima vertebra cervicale vera e propria sormontata dall’atlante che ne limita pericolose oscillazioni. In pratica le ossa della testa poggiano su una punta, il dente epistrofeo.

Figura 10 – La struttura ossea alla base del cranio si compone di due parti: la prima vertebra cervicale vera e propria sormontata dall’atlante che ne limita pericolose oscillazioni. In pratica le ossa della testa poggiano su una punta, il dente epistrofeo.

In pratica una gran parte del cranio funziona come una grande antenna che riceve energia e la trasmette direttamente ai tre ossicini (incudine, martello e staffa) presenti nell’orecchio medio. Il fatto che siamo in presenza di segnali di basso livello è in parte compensata dalla superficie esposta che è notevolmente più grande di quella delle due membrane dei timpani e dal fatto che questa energia è distribuita contemporaneamente alle due orecchie, cosa che fa perdere l’identificazione di suono distinto, visto che vengono meno tutte le informazioni sulla spazialità del suono, assumendo più una sensazione di complemento. Ma torno a ripetere, sono solo riflessioni personali che non hanno prova scientifica della loro valenza.

Quali limiti sono spesso presenti nei nostri impianti audio?

Alla luce delle considerazioni fatte finora sul sistema uditivo, risulta evidente come il nostro impianto audio deve essere in grado di riprodurre anche le frequenze oltre i 20 kHz. Per questo è necessario superare alcuni ostacoli, hardware e/o software, che limitano fortemente la qualità della riproduzione, a partire dal componente più debole della catena di ascolto.
Non tutti i tweeter, per esempio, sono capaci di risposte che si spingono con regolarità verso le frequenze ultrasoniche. Molto dipende dai materiali con i quali è costruita la membrana (Figura 11). I tweeter più pregiati sotto questo punto di vista raggiungono con buona regolarità le frequenze limite di 40-50 kHz, ma capita più sovente di imbattersi in componenti dalla cupola metallica, in alluminio o titanio, che risuonano a 22-25 kHz mostrando a quella frequenza un picco di esaltazione nella risposta di parecchi dB, seguito da un profondo crollo della risposta stessa. Un andamento di questo tipo, oltre a chiudere inesorabilmente la porta alla possibilità di avere in ambiente anche le frequenze estreme, penalizza la timbrica e la naturalezza di emissione, con un’impronta sonora fortemente caratterizzata dal picco della risposta in frequenza.

Figura 11 - Il grafico mostra la tipica risposta di un tweeter a cupola metallica con una pronunciata risonanza oltre i 20 kHz.

Figura 11 – Il grafico mostra la tipica risposta di un tweeter a cupola metallica con una pronunciata risonanza oltre i 20 kHz.

Non è un caso se negli anni ‘70-‘80, nel pieno dell’audio analogico, era in uso presso gli audiofili giapponesi posizionare sopra i diffusori dei supertweeter in grado di estendere la risposta in frequenza del diffusore, che a quei tempi non poteva godere della ricerca tecnologica sui materiali che abbiamo oggi (Figura 12). Considerate che da poco erano comparsi i tweeter a cupola e che la maggior parte dei diffusori era dotata di tweeter a cono o a compressione. Questo modo di ascoltare rimase invariato tra gli analogisti anche negli anni successivi, perché la presenza di ultrasuoni riprodotti da supertweeter dava un maggior respiro e ariosità alla riproduzione oltre ad un miglior fuoco dell’immagine sonora.

Figura 12 - Ancora in servizio dopo molti anni tra gli appassionati audiofili giapponesi il supertweeter Tannoy ST200 cui viene affidata la banda ultrasonica (in questo caso è abbinato ad un diffusore Tannoy Glenair).

Figura 12 – Ancora in servizio dopo molti anni tra gli appassionati audiofili giapponesi il supertweeter Tannoy ST200 cui viene affidata la banda ultrasonica (in questo caso è abbinato ad un diffusore Tannoy Glenair).

Lo stesso andamento risonante della risposta si può riscontrare in alcuni stadi di potenza di tipo digitale (Figura 13), con la particolarità che l’entità del picco dipende dall’impedenza del sistema di altoparlanti ad esso collegato.

Figura 13 - Il grafico mostra come cambia la risposta alle frequenze  oltre i 20 kHz nel caso dei finali digitali sensibili alle variazioni del modulo di impedenza dei tweeter ad esso collegati.

Figura 13 – Il grafico mostra come cambia la risposta alle frequenze
oltre i 20 kHz nel caso dei finali digitali sensibili alle variazioni del modulo di impedenza dei tweeter ad esso collegati.

Un altro elemento che limita la risposta in frequenza sulle alte è di solito il trasformatore di uscita dei finali a valvole che, soprattutto negli apparecchi economici, fa già fatica a restituire il normale spettro audio, figurarsi se si possono permettere di andare oltre. Ma non sono tutti così naturalmente, visto che di recente mi sono imbattuto in alcune realizzazioni giapponesi che, misure alla mano, riuscivano a salire con estrema disinvoltura oltre il limite dei 20 kHz.
Questi riportati sono solo alcuni esempi eclatanti che non sempre sono tenuti in considerazione quando parliamo di sistemi in grado di riprodurre nel modo più corretto l’intero spettro audio, ultrasuoni compresi.
Non meno importante è il contenuto di alte frequenze presente nelle incisioni, comprese quelle indicate ad alta risoluzione, laddove risultino dal ricampionamento (up-sampling) di registrazioni inadeguate. Ricordate infatti che se un suono manca nella registrazione originale nessun artificio elettronico potrà recuperarlo ed è perso per sempre.

Conclusioni

Grazie alle conoscenze messe a disposizione da vari ricercatori abbiamo cercato di dare risposta ai quesiti espressi in apertura. Questi rappresentano una verifica necessaria per meglio comprendere i vantaggi di una risposta in frequenza ben estesa, come nella musica ad alta definizione. Dalla prossima puntata inizieremo a conoscere da vicino il player di lettura Foobar2000, strumento fondamentale per una completa e facile fruizione della musica liquida ad alta definizione.

di Roberto Pallocchia


Bibliografia

  • James Boyk, C’è vita oltre i 20 kilohertz!, California Institute of Technology – Music Lab, 0-51 Caltech, Pasadena, CA 91125 USA, 1992-1997.
  • Tsutomu Oohashi, Emi Nishina, Manabu Honda, Yoshiharu Yonekura, Yoshitaka Fuwamoto, Norie Kawai, Tadao Maekawa, Satoshi Nakamura, Hidenao Fukuyama, Hiroshi Shibasaki, Impercettibili suoni ad alta frequenza influenzano l’attività celebrale: Effetto Ipersonico, Journal of Neurophysiology.
  • Dr. Mario Nobile, Studio e sviluppo di una protesi acustica a ultrasuoni, Istituto di biofisica (Ibf) del Cnr.
  • Gianni Zanarini, Il suono, da Enciclopedia della musica, Einaudi – Il Sole 24 ore.
  • Isabelle Peretez, La musica ed il cervello, da Enciclopedia della musica, Einaudi – Il Sole 24 ore.
  • Jean-Jacques Nattiez, Musica e significato, da Enciclopedia della musica, Einaudi – Il Sole 24 ore.
  • Irene Deliege, La percezione della musica, da Enciclopedia della musica, Einaudi – Il Sole 24 ore.
  • Enrico Bellone, Qualcosa, là fuori, Codice Edizioni.
  • Semir Zeki, Splendori e miserie del cervello, Codice Edizioni.

Author: Roberto Pallocchia

Share This Post On

Submit a Comment