DSD Un pianeta tutto da esplorare 1

Quello degli algoritmi di conversione verso i segnali DSD. Il PCM ci ha confinato in uno spazio ben definito e decisamente ristretto, le codifiche a bit singolo aprono ad orizzonti amplissimi, con esiti – anche e soprattutto sonori – estremamente differenti tra loro. Tali probabilmente da caricare di lavoro per anni le orecchie più raffinate del panorama dell’hi-fi mondiale.

Cop_Audio_12_2014_2Molti pensano – ed in fondo l’abbiamo fatto anche noi prima di poter disporre degli strumenti di analisi adeguati – che quando si parla di segnali a bit singolo esista un solo metodo per ottenerli, magari insito nello standard del Super Audio CD, che notoriamente è stato il primo veicolo commerciale per i segnali audio codificati in questo modo. Del resto, come sarebbe stato altrimenti possibile, ad esempio, realizzare dei dischi test per esaminare le prestazioni dei player commerciali?
E invece no. Ma prima di parlare dei “gradi di libertà” oggi disponibili, sarà bene riassumere in breve quelli che finora consentiva il PCM.

Da uno a quattro

Il PCM è nato commercialmente con il Compact Disc, ovvero con il formato di campionamento lineare a 44.100 Hz e 16 bit di lunghezza di parola. A parte gli standard professionali dell’epoca (DASH, ProDigi, etc.) poco dopo si arrivò con il DAT (Digital Audio Tape, per chi non lo ricorda più) a 48 kHz e 16 bit, ed all’inizio degli anni ’90 addirittura a 96 kHz/16 bit con un DAT Pioneer che registrava da analogico in un formato DAT non standard. In termini di risoluzione, e solo in quella, un passetto avanti venne fatto negli stessi anni con la DCC (Digital Compact Cassette) della Philips, che forse pochi ricordano essere stata capace di una risoluzione nominale di 18 bit, anche se la compressione percettuale del segnale poi vanificava di fatto questa “finezza”. Pochi anni ancora ed arriva il DVD-Video, che è capace di immagazzinare il PCM lineare stereo fino a 96 kHz/24 bit, anche se poi bisognava fare i conti con la reale risoluzione dei convertitori dell’epoca.

Un fatto che sfugge a molti è infatti la divergenza tra le performance teoriche e quelle reali. Durante il “regno” del CD il formato di immagazzinamento collimava, sostanzialmente, con le reali prestazioni dei DAC, ma quando la lunghezza di parola è arrivata a 24 bit i componenti reali hanno mostrato i loro veri limiti. Ricordiamo di nuovo che il massimo valore di risoluzione integrale trovato nel nostro laboratorio per un DAC PCM è pari – ad oggi – a poco meno di 19,4 bit. Nei 20 anni successivi la massima parola di quantizzazione è rimasta (ovviamente, per quanto sopra) a 24 bit, e la frequenza di campionamento è arrivata a 192 kHz, perlomeno se guardiamo ai soli supporti ottici (DVD-Audio e Blu-ray). Se invece parliamo di musica “liquida”, allora il massimo attualmente offerto è il formato DXD, che arriva a 352,8 kHz (44.100 Hz x 8); alcuni DAC arrivano a frequenze anche superiori, ma al momento di software non ce n’è, e comunque a questi livelli non ci sono in pratica i microfoni atti a captare suoni tanto acuti (Figura 1).

Figura 1. La capsula microfonica Brüel & Kjaer 4138, che come altri prodotti simili (es.: G.R.A.S. 40DP) NON nasce per applicazioni da studio di registrazione o per riprese live, è uno dei trasduttori con la più ampia banda passante disponibili sul mercato, dato che arriva linearmente a 140 kHz. Un ADC che vi fosse collegato potrebbe essere sprovvisto del filtro anti-alias, se operasse sopra i 300 kHz.

Figura 1. La capsula microfonica Brüel & Kjaer 4138, che come altri prodotti simili (es.: G.R.A.S. 40DP) NON nasce per applicazioni da studio di registrazione o per riprese live, è uno dei trasduttori con la più ampia banda passante disponibili sul mercato, dato che arriva linearmente a 140 kHz. Un ADC che vi fosse collegato potrebbe essere sprovvisto del filtro anti-alias, se operasse sopra i 300 kHz.

Come si vede abbiamo fatto riferimento a due soli parametri: frequenza di campionamento e lunghezza di parola. La caratteristica più rilevante della codifica PCM lineare è proprio questa, il fatto di poterla definire in modo così sintetico, ma tanta sintesi corrisponde ad altrettanta rigidità: dalla frequenza di campionamento deriva la banda passante utile (pari alla metà di essa) e dalla lunghezza di parola dipende l’errore di quantizzazione, ovvero (in prima approssimazione) il rumore, ovvero la dinamica utile, che in dB è pari a 6,021 per il numero di bit. Dato un segnale qualsiasi, sappiamo immediatamente ed inequivocabilmente se una certa codifica PCM può gestirlo (il che avviene se quel segnale ha spettro contenuto entro la metà della frequenza di campionamento) e con quale livello di rumore/distorsione (pari, in prima approssimazione, al rapporto tra il livello del rumore associato alla lunghezza di parola ed il livello del segnale).

Per la verità un minimo di flessibilità esiste, e ne ha parlato Roberto Lucchesi su queste pagine in più riprese fin dagli anni ’90 dello scorso secolo. Si tratta “semplicemente” di applicare la tecnica del noise shaping in modo da privilegiare determinate bande di frequenza rispetto ad altre. Se ad esempio stiamo ragionando di segnali da incidere su di un compact disc, si può partire da una registrazione effettuata con un campionamento molto fine (p.e. 24 bit) e poi ridurre il tutto a 16 bit modellando il rumore in modo che risulti più rarefatto nelle aree di maggiore sensibilità del nostro sistema uditivo (vale a dire nei dintorni dei 3-4 kHz) e più denso dove la sensibilità è inferiore (alle basse ed alle altissime frequenze, vale a dire, in pratica, alle altissime frequenze). Ciò è stato fatto tra la fine degli anni ’80 e l’inizio dei ’90 in primis da Sony con il Super Bit Mapping, e poi da altri, con strategie necessariamente non troppo dissimili. Questa tecnica però non si presta benissimo al PCM, per due ragioni:

  • il rumore totale aumenta, e se si tratta di segnali a bassa Fs (come ovviamente il CD) l’aumento avviene sempre all’interno della banda audio, per cui il processo deve essere applicato in modo moderato;
  • se si opera con frequenze di campionamento relativamente elevate, tali quindi da poter “proiettare” in banda ultrasonica molto rumore per avere una rilevante riduzione in banda audio, la maggiore quantità di informazione da immagazzinare rende più competitivo l’aumento della lunghezza di parola. Ovvero, ad esempio se devo lavorare a 88.200 Hz (raddoppiando quindi i bit rispetto a 44.100) per spostare il rumore con il noise shaping sopra i 20 kHz, e poi al contempo devo filtrare a 20 kHz per evitare che quel rumore arrivi in uscita, allora tanto vale che continui a lavorare a 44.100 Hz ma con una parola di maggiore lunghezza.

Di fatto le tecniche di noise shaping, nel PCM, sono state abbandonate da quando è stato possibile diffondere supporti con capacità di immagazzinamento molto maggiore del CD, e quindi arrivare a parole di lunghezza adeguata a sfruttare fino ai limiti tecnologici i convertitori digitale-analogico. E per lo stesso motivo sono stati abbandonati anche i pochi altri “puntelli” tecnologici che nel tempo hanno permesso il miglioramento della qualità ottenibile da un compact disc (ad esempio la tecnologia HDCD).

Il PCM, in sintesi, offre prestazioni elevate ed uniformi all’interno di una determinata banda. Una certa uniformità si osserva anche nelle prestazioni dei DAC usati per convertire segnali PCM. Oggi, nelle prove che eseguiamo sui DAC con ingresso PCM, il range di variazione delle prestazioni in termini di risoluzione integrale misurata oscilla – per le macchine di livello almeno buono – orientativamente da 17 a 19 bit, vale a dire 12 dB (1 bit corrisponde a circa 6 dB), vale a dire un rapporto da 1 a 4 in termini lineari.

Uno, nessuno e centomila

Il primo segnale monobit commerciale è stato quello del Super Audio CD, che notoriamente opera a 64 volte la frequenza del CD (2.822.400 Hz). Se proviamo ad inquadrare questo flusso come se fosse un segnale PCM ci rendiamo rapidamente conto che si tratta di un bitrate “solo” quattro volte maggiore di quello del CD, e quindi potrebbe veicolare, ad esempio, segnali a 44.100 Hz con parola da 64 bit, oppure a 88.200 Hz con parola da 32 bit, oppure da 117.600 Hz a 24 bit. Quest’ultimo esempio permette di realizzare “al volo” che il massimo flusso PCM del DVD-Audio o del Blu-ray (192 kHz/24 bit) è superiore a quello del formato DSD del Super Audio CD.

Ma mentre il PCM a 192/24 può unicamente raggiungere una banda utile di 96 kHz e -146 dB di rumore (e sappiamo bene da articoli precedenti che in pratica non c’è nulla che oggi possa superare i 120 dB di rapporto segnale/rumore), il DSD può essere letteralmente modellato per ottenere – entro limiti piuttosto vasti – quel che si desidera. È possibile ad esempio porsi come target l’ottenimento di un rumore bassissimo all’interno dei primi 6 kHz di banda, e poi far salire il rumore, oppure accettare un rumore in banda utile più elevato ma estendendo la banda utile. Il professor Romani, all’interno di questa monografia, ci spiega come ciò possa avvenire sul piano teorico. Nella pratica tutto dipende dall’algoritmo di conversione implementato nel modulatore delta-sigma, sia che questo operi sul segnale analogico proveniente da un microfono (o da un nastro, o da sorgente assimilabile) o che si tratti della conversione a DSD di un segnale PCM precedentemente acquisito (ad esempio mediante una workstation DXD).

Dall’esposizione del prof. Francesco Romani sappiamo che la conversione da un segnale analogico, o già codificato PCM, verso un segnale DSD a singolo bit non è un processo univoco, perché esistono infinite alternative. Ma quel che forse solo pochi addetti ai lavori sanno è che univoca non è nemmeno l’efficienza degli algoritmi realmente disponibili oggi. Quel che abbiamo fatto per mettere in evidenza tutto ciò è stato di mettere alla prova i più noti software utilizzati per la conversione a DSD, consegnargli dei segnali test adatti ad evidenziare le differenze ed analizzare i risultati. Ed i risultati divergono tra loro in modi e quantità che francamente non ci aspettavamo.

I software che abbiamo analizzato sono i seguenti:

  • Audio Format Converter della Philips Protech;
  • SaraCon della Weiss;
  • Audiogate della Korg;
  • il convertitore di Jriver, popolarissimo tra gli audiofili.

Audiogate, SaraCon e Jriver permettono di convertire in DSD fino a 128x (5.644.800 Hz), ma nei test effettuati per questo lavoro abbiamo operato unicamente a 64x, intendendo questo valore come 44.100 x 64. Si può ovviamente moltiplicare per 64 anche prendendo 48 kHz come frequenza base, ma non tutti i software lo permettono. Per quanto visto finora il passaggio a 128x comporta solo il raddoppio di banda utile (tutto viene raddoppiato in termini di banda), ma all’occorrenza torneremo in futuro su questa materia in modo più specifico. Tutti questi software permettono di partire da segnali PCM in formato wave alla massima risoluzione possibile (32 bit floating point), ma il Philips ed il Korg non accettano frequenze oltre i 192 kHz. Di conseguenza, per i nostri test abbiamo consegnato a questi programmi dei segnali PCM alla massima frequenza comune possibile della famiglia dei 44.100 Hz, ovvero a 176,4 kHz.

Il software Philips, che qualche anno dopo la sua realizzazione venne ceduto alla Sonic Studio e prese il nome di nexStage AFC, permette di scegliere tra 9 diversi modulatori sigma-delta, indicati con le lettere dalla “A” alla “E”. I primi 4 possono essere usati nella forma “pre-corrected”, che con lo scotto di un drastico aumento dei tempi di calcolo dovrebbe permettere di introdurre una pre-correzione delle non linearità residuali associate a ciascun modulatore. Da notare che la Philips stessa metteva in evidenza, nella documentazione tecnica diffusa a suo tempo, che tale correzione risultava alla fine meramente “estetica”, dato che qualsiasi componente analogico avrebbe distorto ben più di quei modulatori.

SaraCon della Weiss mette a disposizione 3 diversi modulatori, di complessità e prestazioni crescenti (sesto, ottavo e decimo ordine), consigliando quello di ordine più basso per la musica a bassa dinamica, dato che con l’aumento dell’ordine aumenta anche la possibilità di entrare in una condizione di instabilità.
Audiogate e Jriver dispongono di un unico modulatore.

Cosa abbiamo fatto

I segnali di prova in formato PCM wave a 176,4 kHz e 32 bit che abbiamo approntato per i test di questo articolo sono i seguenti:

  1. tono puro da 1 kHz/0 dB, per i normali riferimenti di livello;
  2. toni puri da 1 kHz/-70 dB e -130 dB, per analizzare il comportamento ai bassi livelli, ed in generale la forma del fondo di rumore (quest’ultimo cambia peraltro con il segnale, almeno in alcuni casi);
  3. tono puro da 20,11 Hz/-0,5 dB, per la misura della risoluzione integrale equivalente;
  4. segnale multitono a minimo fattore di cresta con una sequenza di 188 toni equipotenti, da 1.000 a 95.500 Hz, per l’analisi della risposta in frequenza. La posizione dei toni è stata calcolata per farli cadere esattamente al centro dei canali di una trasformata FFT di adeguata lunghezza in sede di analisi. Questo segnale è l’unico che abbiamo sintetizzato campionando a 192 kHz, ovvero al massimo valore comune per tutti i software, dato che in questo caso non serviva per misurare una distorsione nonlineare.

Naturalmente abbiamo fatto molti altri test, ma è inutile descriverli ora.
Questi segnali sono stati processati con i vari software, ed il risultante segnale DSD è stato analizzato in forma nativa dal prof. Romani, che allo scopo ha allestito in una mezza giornata di lavoro un’applicazione Java. Grazie a lui possiamo quindi presentare – e ci risulta essere la prima volta in assoluto – il reale contenuto di segnali sottoposti a codifica DSD fino al limite superiore teorico di frequenza (1,4 megahertz), pur se ovviamente i segnali sono stati analizzati soprattutto in banda udibile e limitrofa.

Da uno a tremila: analisi dei risultati

Tabella 1. Classifica dei modulatori ordinata per risoluzione integrale.

Tabella 1. Classifica dei modulatori ordinata per risoluzione integrale.

In Tabella 1 vediamo ordinati, in ordine decrescente, i valori di risoluzione integrale conseguiti in banda audio dai 14 modulatori considerati. Non c’è battaglia, i primi tre posti sono saldamente occupati dai modulatori implementati in Weiss SaraCon, con il più potente (quello del decimo ordine) che sfiora i 25 bit e quello di ordine 8 che rispetta alla lettera la pur impegnativa dichiarazione della casa, che lo qualifica come capace di una risoluzione di 24 bit (noi ne abbiamo trovati 23,92). Il quarto posto, con un minimo di sorpresa, se lo aggiudica Jriver, con 19,9 bit, seguito da Audiogate con 18,8 bit. Seguono tutti i Philips, con quello che la casa imposta di default (Sigma Delta Type D) che è in effetti il migliore quanto a risoluzione, con 18,5 bit. Qui si nota subito un fatto inatteso: tutti i modulatori “pre-corrected” appaiono leggermente peggiori di quelli “lisci”, e le successive misure lo confermeranno. Ultimi in classifica i modulatori di “Tipo C”, che scendono fino a 13,2 bit.

Speriamo risulti sufficientemente evidente, a buon bisogno lo scriviamo sottolineandolo: tra il migliore ed il peggiore dei modulatori considerati sussistono 11,7 bit di differenza, vale a dire 70,4 dB di differenza nel fondo di rumore audio, vale a dire un fattore 3.300 in termini lineari.

Altro che i 2 bit di variazione tipica del PCM (!).

Non sappiamo quante registrazioni si siano servite dei modulatori Philips più semplici e meno prestanti, probabilmente la casa li ha sviluppati soprattutto per ridurre il tempo di calcolo (tutti i modulatori sono esigenti quanto a potenza di calcolo, ed ancor più lo erano una decina e più di anni or sono, quando sono stati rilasciati) per il passaggio a DSD di registrazioni che erano già in origine di scarsa qualità. Tuttavia, anche limitandosi alla parte “alta” della classifica, le differenze sono nettissime.

La risoluzione integrale viene misurata come rapporto segnale/rumore in presenza di un tono di ampiezza vicino alla massima e lentamente variabile, nei nostri set di misure la integriamo quindi con la misura di “gamma dinamica”, ovvero il rapporto segnale/rumore osservato in presenza di un segnale di piccola ampiezza (tipicamente il tono da 1 kHz/-70 dB). Idealmente questi due valori dovrebbero sempre coincidere, ma nella realtà, ossia su DAC reali, ciò non avviene mai, perché il tono di massima ampiezza scatena sempre fenomeni secondari tali da aumentare almeno leggermente il fondo di rumore. Qui però non stiamo trattando di DAC fisici, ma di processi matematici, che in prima battuta ci aspetteremmo essere del tutto coerenti quanto a stabilità del rumore residuale.

Tabella 2. Classifica dei modulatori ordinata per gamma dinamica.

Tabella 2. Classifica dei modulatori ordinata per gamma dinamica.

E tuttavia così non è. In Tabella 2 vediamo la classifica relativa ai valori di gamma dinamica: è simile all’altra, salvo che il Philips “Trellis E” risale dall’ottavo al quinto posto e che i modulatori Philips di tipo “A” e di tipo “C” si scambiano di posto. Ciò avviene perché il rumore (con microspurie e distorsione) viene modulato dall’ampiezza del segnale trattato fino a ben 10,5 dB (Trellis E). I modulatori Weiss si confermano essere non solo i migliori, ma anche tra i più invarianti (non più di 1,8 dB di differenza tra le due misure per gli ordini 6 e 8).

Da notare anche che la raffinatezza dei Weiss non ha permesso di analizzarli con la matematica da 32 bit a virgola mobile normalmente utilizzata sia nei formati di archiviazione (il ben noto Microsoft Wave ha come massima risoluzione proprio 32 bit floating point) sia nei software di editing audio (come il celeberrimo Audition). In un primo momento avevamo infatti tentato di misurare questi dati ripassando in PCM a 32 bit i vari file monobit: i Weiss erano sempre i migliori, ma si fermavano a circa -133 dB. Per questo motivo il software del prof. Romani, oltre ad acquisire il segnale in forma nativa, lavora completamente in doppia precisione (64 bit a virgola mobile).

Risoluzione e gamma dinamica sono misure potenti e sintetiche, dato che si esprimono con un singolo numero, ma noi sappiamo bene che l’orecchio non è sensibile solo alle quantità, ma anche a soprattutto alla loro distribuzione. Per ogni modulatore abbiamo quindi analizzato gli spettri dei segnali usati (tono da 20,11 Hz/-0,5 dB e 1 kHz/-70 dB) riportandoli su un range di livelli ampio 140 dB (da -40 a -200 dB). La Fast Fourier Transform da cui derivano queste curve è stata effettuata su una sequenza da 64 MegaSamples, ovvero 67.108.864 campioni a 64 bit, ciascuno contenente un valore +1 o -1 della sequenza DSD da analizzare. Dalla lunghezza della FFT dipende il “diradamento” del fondo di rumore (che, essendo continuo, si dimezza come potenza su ciascun canale per ogni raddoppio della sequenza trasformata, mentre i segnali periodici come distorsione e spurie rimangono alla stessa ampiezza). Per avere un termine di confronto, basti considerare che i programmi di editing audio tipicamente non vanno oltre i 64k (65.536 campioni multibit), per cui nel nostro caso il livello di “emersione” dei segnali periodici dal rumore è risultato più basso di circa 30 decibel. Ciò ha consentito di discernere spurie e distorsioni a livelli davvero infinitesimali.

Trattandosi di segnali campionati a 2,82 MHz, la massima frequenza ravvisabile in essi è pari a 1,41 MHz. Ma a noi interessa soprattutto la banda audio per cui, per ciascun modulatore, riportiamo 3 grafici, relativi allo stesso spettro ma con livelli di “zoom” differenti: nel grafico più a sinistra compare la sola banda audio (da 0 a 20 kHz), in quello mediano la prima porzione ultrasonica (0-120 kHz) e nell’ultimo tutto lo spettro (0-1.400 kHz). Il grafico più importante è naturalmente quello di sinistra, perché tutto ciò che contiene potrebbe essere direttamente udibile. Il grafico centrale ha pure la sua importanza, e la vedremo meglio nella seconda puntata di questa monografia, quando parleremo di risposta in frequenza e di “impronta digitale” del modulatore. Il grafico di destra completa il quadro e rende l’idea di come realmente si distribuisca l’energia del segnale, e come essa eventualmente cambi con il segnale modulante. In tutti i grafici la curva blu rappresenta lo spettro del tono da 20,11 Hz/-0,5 dB, quella rossa lo spettro del tono da 1 kHz/-70 dB.

Figura 2. Modulatore Philips “Sigma Delta Type A”. La curva blu rappresenta lo spettro del tono da 20,11 Hz/-0,5 dB, quella rossa lo spettro del tono da 1 kHz/-70 dB.

Figura 2. Modulatore Philips “Sigma Delta Type A”. La curva blu rappresenta lo spettro del tono da 20,11 Hz/-0,5 dB, quella rossa lo spettro del tono da 1 kHz/-70 dB.

Figura 3. Modulatore Philips “Sigma Delta Precorrected Type A”.

Figura 3. Modulatore Philips “Sigma Delta Precorrected Type A”.

Figura 4. Modulatore Philips “Sigma Delta Type B”.

Figura 4. Modulatore Philips “Sigma Delta Type B”.

Figura 5. Modulatore Philips “Sigma Delta Precorrected Type B”.

Figura 5. Modulatore Philips “Sigma Delta Precorrected Type B”.

Figura 6. Modulatore Philips “Sigma Delta Type C”.

Figura 6. Modulatore Philips “Sigma Delta Type C”.

Figura 7. Modulatore Philips “Sigma Delta Precorrected Type C”.

Figura 7. Modulatore Philips “Sigma Delta Precorrected Type C”.

Figura 8. Modulatore Philips “Sigma Delta Type D”.

Figura 8. Modulatore Philips “Sigma Delta Type D”.

Figura 9. Modulatore Philips “Sigma Delta Precorrected Type D”.

Figura 9. Modulatore Philips “Sigma Delta Precorrected Type D”.

Nelle Figure da 2 a 9 vediamo i modulatori Philips dal tipo “A” al tipo “D”, ciascuno seguito dalla sua versione “pre-corrected”. Il primo elemento che balza agli occhi è la notevolissima diversità dei comportamenti, sono curve totalmente differenti come bilanciamento del rumore e come distorsione. La migliore anche “ad occhio” è quella del modulatore di tipo “D”, che infatti Philips impostò come scelta di default, seguita dalla “B”, talmente silenziosa fino a 5 kHz, ed in parte fino a 13 kHz, da far sembrare alta la sua distorsione rispetto al tipo “D” (mentre in realtà è solo maggiore il rumore della “D”). Come qualità globale i modulatori “C” ed “A” non sembrano troppo diversi, anche se i picchi di distorsione di “A” sono maggiori. Come classifica di qualità audio la Philips indicava la sequenza D-B-A-C, compatibile con quanto abbiamo osservato noi. Altro elemento che si nota subito è che le versioni “pre-corrected” in realtà sono leggermente più rumorose e meno lineari.

Figura 10. Modulatore Philips “Sigma Delta Trellis E”.

Figura 10. Modulatore Philips “Sigma Delta Trellis E”.

L’ultimo modulatore Philips, il “Trellis E” (Figura 10, consigliamo chi vuole approfondire di andare a cercare in letteratura cosa sono gli algoritmi con questa denominazione e perché si prestano bene alla compressione lossless) somiglia molto al tipo “D” e per certi versi lo supera, pur denotando una notevole modulazione di rumore.

Figura 11. Modulatore di Audiogate.

Figura 11. Modulatore di Audiogate.

Nella Figura 11 compare il modulatore Audiogate: silenzioso, lineare e ben bilanciato in frequenza.

Figura 12. Modulatore di Jriver.

Figura 12. Modulatore di Jriver.

Nella Figura 12 vediamo il modulatore di Jriver, un poco meno lineare di quello di Audiogate (attenzione però, nel confronto, ai livelli di rumore) ma più silenzioso in banda audio. Sui primi ultrasuoni il rumore sale invece più perentoriamente rispetto ad Audiogate, rendendo più difficile poter fruire di un’ampia estensione di banda.

Figura 13. Modulatore Weiss SaraCon del VI ordine.

Figura 13. Modulatore Weiss SaraCon del VI ordine.

Figura 14. Modulatore Weiss SaraCon dell’VIII ordine.

Figura 14. Modulatore Weiss SaraCon dell’VIII ordine.

Figura 15. Modulatore Weiss SaraCon del X ordine.

Figura 15. Modulatore Weiss SaraCon del X ordine.

Nelle Figure da 13 a 15 vediamo i “re” dei modulatori, ovvero quelli di Weiss SaraCon. Già il più semplice, quello di ordine “solo” 6, dà punti a tutti gli altri, ma i due maggiori svettano nettamente non tanto per le microspurie – equivalenti ad altri – quanto per il rumore vero e proprio. Tanta eccellenza in banda audio ha ovviamente un costo, ovvero la ripidità con cui il rumore sale immediatamente sopra i 20 kHz per i due modulatori di ordine maggiore.

Nella prossima puntata

Riporteremo:

  • il comportamento dei modulatori rispetto alla risposta in frequenza, ed ai segnali di livello bassissimo e nullo;
  • la prima vera e propria prova d’ascolto a confronto dei modulatori DSD;
  • una analisi tecnica del contenuto di vari SACD commerciali, nella quale davvero non mancheranno le sorprese. Cercheremo anche di riconoscere quale modulatore è stato utilizzato nei vari casi, se appartenente ovviamente alle famiglie qui descritte.

Prime conclusioni

  • Il DSD sta rapidamente conquistando gli appassionati del suono fedele in tutto il mondo, ma parlare di “suono DSD” tout court non ha molto senso. Per poter essere ascoltabile un segnale DSD deve essere ottenuto da un modulatore delta-sigma, ed i modulatori delta-sigma non solo sono abbastanza numerosi, ma soprattutto sono tra loro molto, molto differenti come prestazioni, molto più differenti di come potrebbero risultare delle intere catene di acquisizione-trasmissione di segnali in tecnologia PCM.
  • Chi realizza Super Audio CD o mette in vendita registrazioni in formato DSD dovrebbe, per quanto sopra dimostrato, avere la linearità intellettuale di specificare non solo con quale modulatore è stata effettuata la codifica, ma anche a quali trasformazioni è stato sottoposto il segnale in fase di editing. Anticipando parte del contenuto del mese prossimo, abbiamo più che l’impressione che molta musica che poi viene veicolata in formati monobit viene di fatto trattata con workstation PCM – e nemmeno ad alta frequenza di campionamento – prima della conversione finale.

di Fabrizio Montanucci

da AUDIOREVIEW n. 358 dicembre 2014

Author: Redazione

Share This Post On

1 Comment

Submit a Comment