Tel. +41 58 465 73 44 | fnoffice@nb.admin.ch

Logo FN

Home

International Year of Sound 2020+

La linea sottile che separa un segnale analogico da uno digitale:
Ciò che spesso ignoriamo del teorema di Nyquist-Shannon


La percezione del suono

In termini audio, che è quello di cui ci occupiamo alla Fonoteca nazionale svizzera, analogico è tutto ciò che accade in natura ed è anche quanto il nostro apparato uditivo capta e invia al cervello. Il cervello poi trasforma queste informazioni in un'esperienza sensoriale, che noi riconosciamo come suono.

To see this video, please enable JavaScript or upgrade to the latest HTML5 compatible browser.



Il segnale analogico

Per segnale analogico si intende un segnale elettrico con una forma d'onda continua che cambia nel tempo. Questo segnale può essere ulteriormente classificato come semplice o composito. Un segnale analogico semplice ha la forma di un'onda sinusoidale.

Segnale analogico semplice

Un segnale analogico composito presenta invece una forma d'onda irregolare, che all'occorrenza può essere ulteriormente scomposta in più onde sinusoidali.

Segnale analogico composito

Un segnale analogico viene misurato e descritto in ampiezza, frequenza e fase. L'ampiezza indica l'altezza massima del segnale, in termini elettrici la tensione, in termini acustici il livello o volume. La frequenza indica la velocità con cui il segnale cambia polarità: la si calcola dividendo la lunghezza d'onda per un'unità di tempo fissa. La fase indica la posizione dell'onda rispetto al tempo "zero", cioè dall'inizio del ciclo.

Ampiezza, frequenza e fase

La gamma di valori in un segnale analogico non è fissa. Un segnale analogico per definizione può assumere tutti i valori compresi tra i due estremi di questa gamma, rappresentando il valore di una grandezza fisica così com'è nella realtà.


Il segnale digitale

Un segnale digitale è un segnale temporale definito come discreto, cioè non continuo, che assume solo due valori, uno alto per lo stato "1" e uno basso per lo stato "0". Trasporta dunque informazioni o dati in forma binaria, rappresentando le informazioni sotto forma di bit.

Segnale digitale

In termini audio, per dare un senso a un segnale digitale, descriviamo il flusso di bit, cioè i cambiamenti di stato del segnale nel tempo, fissando la sua risoluzione, costituita dalla frequenza di campionamento (nell'immagine seguente rappresentata dalle linee verticali – unità di tempo) e dalla quantizzazione (i.e. le linee orizzontali – profondità di bit).

Risoluzione

Campionamento e ricostruzione

Il campionamento è il processo attraverso il quale un segnale continuo viene trasformato in un segnale discreto: si traduce dapprima il segnale continuo, analogico, in una tensione, per poi scomporlo e trasformarlo mediante un convertitore analogico-digitale (ADC) in uno discreto. Un ADC campiona dunque la tensione convertendola in un segnale digitale.

Il processo opposto al campionamento è la ricostruzione. La differenza fondamentale tra i segnali continui e quelli campionati è che un segnale continuo è definito ovunque nel tempo, mentre un segnale campionato è definito solo negli istanti di campionamento. Poiché un segnale campionato non è definito tra i campioni, non può essere usato direttamente in un sistema continuo. Per usare un segnale campionato in un sistema continuo, dev’essere trasformato mediante un convertitore digitale-analogico (DAC). Questa conversione del segnale da campionato a continuo è chiamata ricostruzione.

La ricostruzione viene completata interpolando il segnale risultante. L'interpolazione è il processo in cui il valore del segnale continuo tra due campioni viene modellato prendendo come riferimento i valori contigui precedente e successivo.

I processi di campionamento e ricostruzione (n.b. quest’ultima, prima dell’interpolazione) sono illustrati qui di seguito:

Campionamento Ricostruzione

… con qualche difficoltà, l'aliasing

Ignorando ciò che accade tra i singoli campioni, il processo di campionamento getta via informazioni sul segnale originale. Se conosciamo la frequenza della sinusoide originale saremo in grado di prevedere esattamente il segnale campionato. Questo è un concetto facile da afferrare e applicare. Ma una volta campionato, il segnale non sembrerà necessariamente essere alla stessa frequenza del segnale originale. Ciò significa che, in alcuni casi, data una coppia di segnali campionati, di cui uno derivato da una sinusoide di frequenza più bassa e l'altro da una frequenza più alta, non avremo modo di distinguere questi segnali l'uno dall'altro. Questa ambiguità tra due segnali di frequenze diverse (o due componenti di un segnale) è chiamato aliasing, e si manifesta ogniqualvolta si campiona un segnale nel mondo reale.

Aliasing

Analogico vs. digitale, chi avrà la meglio?

Spesso le informazioni che circolano, presentano i sistemi digitali come perfetti e i sistemi analogici come vecchi, superati, imprecisi. La realtà è un po’ diversa: il segnale analogico segue esattamente l'andamento della grandezza che rappresenta, mentre con i segnali digitali tutto viene convertito e ridotto a una sequenza di "0" e "1". Per quanto si possano frazionare il tempo e l’ampiezza, si tratta pur sempre di un’approssimazione; quindi, teoricamente è il segnale analogico ad essere perfetto.

Ma, tornando indietro un passo, cosa intendiamo nel quotidiano per segnale digitale? Intendiamo davvero la forma d’onda (elettrica, quadra) data dal flusso di bit? Oppure la sequenza di numeri ottenuti dal campionamento della sorgente analogica (cioè l’interpretazione dei bit)? O semplicemente quello che il nostro apparecchio di riproduzione audio, non importa se un semplice telefonino, tablet, pc, o un apparecchio più sofisticato, elabora e ci trasmette come suono?

Potremmo dare una risposta tanto semplice quanto incontestabile, dicendo che: il suono digitale non esiste, quindi che importa? Un segnale digitale è solo un mezzo di trasporto per qualcosa che comunque può essere consumato, e apprezzato, solo in modalità analogica.

Allora perché digitalizziamo il suono? Una delle ragioni che fa preferire l'utilizzo dei segnali digitali a quelli analogici è la facilità di trasmissione e di riproduzione grazie all'autorigenerazione. Infatti, se il segnale digitale contiene errori al di sotto di una certa soglia, questi si autocorreggono. In un segnale digitale solo parzialmente deformato, proprio la limitazione ai soli valori "0" e "1", rende i bit ancora riconoscibili:

Autorigenerazione
Segnale digitale

Un altro vantaggio dell'utilizzo dei segnali digitali è la facilità di memorizzazione, poiché per memorizzare un bit basta una sorta di interruttore. Ovviamente non parliamo di un dispositivo meccanico, ma di un interruttore elettronico, che può sopportare molti cicli di accensione e spegnimento al secondo e può essere miniaturizzato.

Se, grazie agli argomenti presentati, accettiamo l'idea, come determiniamo ora la risoluzione ottimale necessaria per catturare numericamente un suono? I più perspicaci diranno che per il campionamento, che, ricordiamoci, è solo il primo passo nel processo di digitalizzazione, esiste il teorema di Nyquist-Shannon.


Cosa dice il teorema di Nyquist-Shannon?

Semplificando al massimo, secondo la teoria, qualsiasi segnale analogico può essere ricostruito senza errori, prelevando campioni ad intervalli di tempo regolari, se la frequenza di campionamento è maggiore o uguale al doppio della frequenza più alta presente nel segnale analogico da campionare.

Frase lunga e complicata. In parole povere, se è vero che la larghezza di banda udibile va da 20Hz a 20kHz, per una sua ricostruzione senza errori basterebbe un campionamento ad una frequenza di poco superiore a 40kHz; per praticità diciamo 44.1kHz, come definito nello standard per i CD audio.

Purtroppo, però, dare per scontato che il teorema di Nyquist-Shannon sia un modo semplice e diretto per determinare la frequenza di campionamento minima per un sistema è un malinteso comune. Il teorema stabilisce alcuni limiti, sì, ma allo stesso tempo non dà risposte facili. La difficoltà principale sta nel fatto che il teorema si basa sulla nozione che il segnale da campionare abbia una banda perfettamente limitata, sia cioè una sinusoide pura ad una determinata frequenza. Nella realtà però nessun segnale ha queste caratteristiche.


Cosa non dice il teorema di Nyquist-Shannon?

Il teorema di campionamento di Nyquist-Shannon, con il suo limite sulla frequenza di campionamento rispetto al contenuto spettrale del segnale, ci dà alcuni limiti chiaramente dichiarati, ma come vediamo nella pratica, questi limiti non sono così chiari come lo sono in teoria. Quindi la teoria di Nyquist-Shannon sembra, a prima vista, dire cose che in pratica non sono vere. Ciò che il teorema di campionamento di Nyquist-Shannon - assolutamente e positivamente - non dice, è che se aspiriamo a una ragionevole possibilità di successo non possiamo progettare un sistema che operi al tasso minimo da esso definito.

Ciò potrebbe significare che nessun sistema che campiona dati provenienti dal mondo reale può farlo perfettamente. È altresì vero però che pur non ottenendo la perfezione, con un po' di ingegno e di lavoro si possono progettare sistemi abbastanza buoni affinché i vantaggi che si guadagnano elaborando segnali discreti superino di gran lunga gli svantaggi del campionamento, rendendo molti sistemi digitali superiori ai loro equivalenti analogici.


Quantizzazione

Mettiamo da parte per un momento il teorema di Nyquist-Shannon per abbordare l'altro passo, non meno importante, del processo di digitalizzazione, cioè la quantizzazione. Abbiamo ormai capito che il segnale analogico, continuo, viene analizzato ad intervalli regolari, determinati dalla frequenza di campionamento. Per ogni campione l'ADC rileva l'ampiezza momentanea del segnale, assegnandole un valore numerico tra quelli a disposizione. Quanti siano questi valori a disposizione dipende dalla profondità di bit definita dalla risoluzione – nell'audio, più comunemente, 16 per la cosiddetta qualità CD, che permette poco più di 65'000 valori; o 24 per la cosiddetta qualità Hi-Res, che permette poco più di 16'000'000 di valori, come si vede nella tabella seguente:

Quantizzazione

Perché ci servono così tanti valori? Domanda lecita, alla quale però dare una risposta esaustiva è piuttosto complicato. Mettiamo l'accento su due dati di fatto:

  1. La percezione del suono è logaritmica, ma non direttamente proporzionale con il sistema di numerazione binario. Mi spiego, un aumento di 6dB dell'ampiezza del segnale corrisponde sempre al raddoppio della pressione sonora (n.b. non del volume, per questo ci vogliono 10dB), non importa se siamo appena al di sopra della soglia di udibilità o in prossimità della soglia del dolore. In termini binari, un aumento di 6dB corrisponde all'aggiunta di un bit, che fa sì che la granularità, cioè il numero di intervalli disponibili, cambi radicalmente quando passiamo dai valori più bassi a quelli più alti.
  2. Il sistema binario conosce solo numeri interi. Ogni operazione atta a modificare il segnale, come ad es. il semplice cambiamento del volume, dell'equalizzazione, ecc. introduce errori di calcolo, e dunque approssimazioni, che si sommano ad ogni intervento e vanno ad alterare il segnale da ricostruire.

Volendo di nuovo semplificare, possiamo affermare che i limiti propri della quantizzazione, alla fine della catena, hanno un impatto molto grande sulla qualità del suono.


E venne il tempo

Fino a qui non pretendo di aver sollevato chissà che polverone tra i seguaci del digitale. D'altronde abbiamo trattato temi conosciuti e ampiamente documentati. Tuttavia forse qualcuno sta cominciando a riflettere e a chiedersi dove stiamo andando a parare.

Torniamo al teorema di Nyquist-Shannon. Nei paragrafi precedenti, per provare a determinare la frequenza di campionamento più adatta ai nostri scopi, abbiamo preso in considerazione lo spettro di un segnale. Ma c'è un altro aspetto, essenziale soprattutto per ricostruire la spazialità di un suono, che viene quasi sempre trascurato, e cioè il dominio temporale. Tutti noi sappiamo che la larghezza di banda udibile (n.b. di un essere umano in giovane età, sano) va da 20Hz a 20kHz. Questo però non ci aiuta a capire da dove proviene un suono. Non ci permette cioè di collocarlo nello spazio. Come facciamo a capire se un suono viene da davanti o da dietro, da destra o da sinistra, dall'alto o dal basso, e per di più con una precisione quasi millimetrica?

Ci ha pensato un brillante professore di fisica, appassionato di acustica, che ho avuto il piacere di incontrare qualche anno fa a una conferenza dell'Audio Engineering Society (AES), il dott. Milind N. Kunchur. Nei suoi studi sulla sensibilità dell'udito, ha provato che gli esseri umani possono discernere alterazioni temporali piccolissime, addirittura di 5 microsecondi (µs)! Se rapportiamo questo valore al teorema di Nyquist-Shannon (n.b. un ciclo della durata di 5µs equivale a una frequenza di 200kHz), per preservare completamente la trasparenza di un suono non dovremmo neanche considerare frequenze di campionamento inferiori a 400kHz… e qui ci crolla un mondo addosso!


Conclusione

È bastato aggiungere un punto a tutte le nozioni che già avevamo, per poter ora dichiarare senza ombra di dubbio, seppur a malincuore, che "il suono come lo conosciamo in natura non può essere catturato e riprodotto mantenendo tutte le sue caratteristiche". Sebbene questa affermazione valga soprattutto per la tecnologia digitale, dove tutto è frammentato, misurato e quantificato, non dobbiamo illuderci: anche quella analogica presenta delle grosse difficoltà, perciò dobbiamo farcene una ragione.

Cercando di preferire il "bicchiere mezzo pieno" a quello "mezzo vuoto", possiamo chiederci quale sia lo scopo della registrazione e della riproduzione del suono. È davvero un tentativo di sostituirsi alla natura? Non credo. Personalmente, lo vedo piuttosto come un modo per documentare la storia e gli eventi, sviluppato poi anche come una forma d'arte, atta a stimolare i nostri sensi.

Non è mai stato tanto vero il detto "è bello ciò che piace" come in questo ambito. In fin dei conti, se quello che ascoltiamo ci piace e scatena in noi emozioni, non possiamo dire che lo scopo di una registrazione sonora è stato raggiunto?


Risorse

La Fonoteca ringrazia sentitamente Brandon Pletsch per l'animazione "Auditory Transduction" presentata nel primo paragrafo di questo progetto.

Logo Schweizerische Eidgenossenschaft, 
Conféderation Suisse, Confederazione Svizzera, Confederaziun svizra


La Fonoteca nazionale svizzera fa parte della Biblioteca nazionale svizzera


© Fonoteca nazionale svizzera.
Tutti i diritti d'autore di questa pubblicazione elettronica sono riservati alla Fonoteca nazionale svizzera, Lugano. È vietato l'uso commerciale.
I contenuti pubblicati su supporto elettronico sono soggetti alla stessa regolamentazione in vigore per i testi stampati (LDA).
Per informazioni sul copyright e le norme di citazione: www.fonoteca.ch/copyright_it.htm

URL: