Skip to content Skip to navigation

OpenStax_CNX

You are here: Home » Content » Audiovisione

Navigation

Recently Viewed

This feature requires Javascript to be enabled.
 

Audiovisione

Module by: Pietro Polotti. E-mail the author

Summary: Il presente modulo è basato su di una sintesi del saggio di M. Chion "L'Audio-vision; son et image au cinéma", Ed. Nathan, Paris, 1990.

L’Audiovisione

In questo modulo tratteremo quelli che sono gli aspetti peculiari della percezione audiovisiva, intesa come effetto composito della percezione visiva ed uditiva. La tesi di fondo che sottende una discussione sull’audiovisione è che quest’ultima non è il risultato della semplice somma di uno stimolo visivo e di uno stimolo uditivo. La percezione audiovisiva è al contrario un fatto a sé, unitario, basato su di una combinazione non necessariamente lineare di stimoli visivi ed uditivi, che spesso perdono (almeno in parte) la loro valenza come stimoli distinti.

Il cinema

L’ambito in cui lo studio dei fenomeni audiovisivi risulta più naturale ed efficace è quello del cinema. Il cinema, accanto alle immagini, presenta tutti gli aspetti legati alla percezione uditiva, dalla musica ai suoni d’ambiente al parlato. In questo senso il cinema, insieme ad altri prodotti multimediali, come ad esempio la televisione o i video giochi, diventano un laboratorio e una fonte naturale di studio per quanto concerne l’audiovisione.

Un esempio di quali siano i legami tra audio e video, citato da Chion nel suo “L’audio-vision. Son et images au cinema” è quello del film Persona di Ingmar Bergman. Nella scena iniziale del film si vede prima una mano di una persona anziana, poi un obitorio con dei cadaveri e successivamente un ragazzino vivo che dorme steso su un lettino sempre nell’obitorio. Guardando la scena senza audio l’impressione è quella di una rappresentazione astratta, anche per la staticità delle riprese. Se invece si assiste alla scena con il sonoro che comprende un rumore di gocciolamento di un lavandino e poi un telefono che squilla fuori campo, allora il tutto assume un carattere estremamente realistico e terrificante. In questo esempio è anche notevole come la versione muta della scena risulti spezzata in tre momenti separati, tre immagini non necessariamente legate tra loro. Non appena il sonoro viene recuperato i tre quadri diventano tre aspetti di una stessa scena, dove l’elemento unificante sono gli eventi sonori: il gocciolamento e lo squillo del telefono. La peculiarità dell’audiovisione viene quindi messa in luce.

Un altro elemento fondamentale che scaturisce dalla produzione cinematografica e multimediale in genere è quello della possibilità di manipolare e creare accostamenti arbitrari tra il video e l’audio. Questo porta a scoprire che non esiste un legame di necessità tra una realtà visuale ed una uditiva. Le combinazioni possono essere innumerevoli, con effetti inusitati che conferiscono un senso nuovo sia al video che all’audio considerati singolarmente. Come esempio circa gli effetti dell’arbitrarietà dell’abbinamento audio video Chion cita il film di Tati Les Vacances de Monsieur Hulot del 1953. Più che di un accostamento arbitrario, in questo caso si tratta di una contraddizione ben giocata. L’esempio è infatti quello di una scena in cui viene ripresa la spiaggia con dei bagnanti adulti con l’aria indistintamente seccata e annoiata, mentre la colonna sonora riproduce gli schiamazzi di bambini che giocano allegramente. La visione accompagnata dal sonoro cela quest’ultimo, ovvero l’immagine ha il sopravvento sull’audio. Se si oscura il video l’effetto è quello di una realtà completamente differente rispetto al film originale e cioè un gruppo di bambini festanti. D’altronde, ad un ascolto attento l’effetto di sovrapposizione dei suoni dei giochi di bambini sulla scena dei bagnanti irritati ha un effetto comico notevole. Un esempio come questo indica come il suono è l’immagine possano essere giocati in combinazioni diverse dando come risultato prodotti audiovisivi la cui valenza cambia in modo sostanziale a seconda degli ingredienti visivi e sonori che vengono impiegati.

La voce

L’ascolto umano è nettamente vococentrico, ovvero siamo predisposti a percepire ed intendere innanzitutto la voce degli altri esseri umani. La voce è infatti il veicolo principale della comunicazione sociale. Questa predisposizione vale sia per quanto riguarda un livello “superficiale” dell’ascolto, sia per quanto riguarda un livello in cui l’ascolto implica un apprendimento di informazione. Nel primo caso ci si riferisce all’adattamento che il nostro sistema uditivo ha sviluppato nei confronti della voce in termini di parametri psicoacustici. Detto in parole povere, il nostro sistema uditivo è ottimamente attrezzato per percepire in modo “nitido” i segnali audio nei range tipici della frequenza e della dinamica della voce umana, a dispetto delle alterazioni significative impresse dagli ambienti riverberanti sul segnale di pressione acustica. Nel secondo caso invece ci si riferisce al significato di quanto espresso attraverso il segnale vocale, cioè all’informazione trasmessa sia in termini semantici che emotivi. Nel caso dell’audiovisione è interessante valutare come messaggi vocali, ovvero un commento audio, possano influenzare la percezione visiva. Chion fa l’esempio della teletrasmissione di una parata areonautica e di come quello che viene detto dal commentatore possa modificare il contenuto di quanto si vede. L’immagine è quella di un cielo blu con tre puntini all’orizzonte, cioè tre aeroplani. Chion sottolinea come tre tipi di frasi diverse come:

  • Il tempo è meraviglioso
  • L’aereo a destra è davanti agli altri
  • Dov’è il quarto aereo?

producano uno spostamento percettivo per cui nei vari casi si ottiene rispettivamente:

  • La scomparsa degli aerei (si vede solo il cielo blu e il tempo magnifico).
  • Una prospettiva che non sarebbe assolutamente percepibile guardando semplicemente l’immagine.
  • La comparsa di un quarto veivolo.

Il messaggio vocale ha quindi il potere di modificare e/o contraddire l’informazione che ci giunge attraverso il canale visivo. Il testo cioè struttura in qualche modo la visione.

Musica e suono come commento

L’utilizzo di musica nel cinema è evidentemente un mezzo efficace per sottolineare o caratterizzare, in genere dal punto di vista soprattutto emotivo, ciò che viene rappresentato sullo schermo. La soluzione più diretta consiste nell’impiegare della musica sulla base di un rapporto empatico con quanto viene rappresentato dalle immagini. L’effetto è assodato, con maggiore o minore riuscita a seconda della felicità della musica scelta o composta.

Un aspetto più interessante consiste nell’accostare musiche diverse ad una stessa scena. In particolare si ottengono risultati che possono rivelarsi più interessanti mediante la giustapposizione di musiche dal carattere contrastante o anche indifferente, astratto. In quest’ultimo caso il contenuto della narrazione viene come impresso su di uno sfondo ultraterreno, sollevato dalla contingenza del presente.

Lo stesso discorso vale anche per il paesaggio sonoro, cioè per i suoni d’ambiente. Il contrasto può risultare in un effetto che si carica di significato e drammaticità. L’esempio di un silenzio punteggiato da rumori d’ambiente prosaici come il gocciolare di un lavandino o il ticchettio di una sveglia da cucina a seguito di una scena cruenta che si chiude con dei morti può essere un esempio.

Musica e suono come elemento strutturale e strutturante

La percezione uditiva presenta due caratteristiche peculiari rispetto a quella visiva: una maggiore risoluzione temporale e l’irreversibilità della freccia del tempo. Il primo aspetto implica che il nostro sistema uditivo ci permette di percepire in modo più nitido degli eventi sonori molto rapidi rispetto a quanto non faccia il sistema visivo nel caso di una successione molto rapida di immagini. Esempi del ruolo fondamentale giocato dal suono in questo senso si hanno per esempio nei film di azione orientali dove le immagini di combattimento hanno una velocità tale per cui il suono diventa essenziale per una percezione chiara degli eventi. Casi simili si hanno nel caso del cinema di animazione dove il ritmo degli eventi può essere accelerato ad libitum, in modo irreale. Fuori dal cinema, nell'ambito dei videogames questo ruolo del suono trova la sua massima espressione. Il secondo aspetto, ovvero l’irreversibilità del tempo gioca invece un ruolo strutturante rispetto al complesso audiovisivo. Le immagini infatti non hanno un ordine temporale così stringente come nel caso dei suoni.. Il flusso degli eventi sonori fissa il tempo degli eventi in modo netto e consequenziale. Si è visto in questo senso l’esempio del prologo di “Persona” di Bergman. D’altra parte anche la musica può giocare un ruolo simile di collante ed elemento di tensione verso il futuro, che nel film muto mancava o era reso mediante un accompagnamento strumentale dal vivo. D’altro canto, il suono gioca un effetto di collante anche riproducendo la percezione di un ambiente acustico costante, quando ad esempio l’inquadratura cambia. Il fatto che le qualità sonore di un ambiente acustico si mantengano dà alla percezione audiovisiva coerenza ed unità.

Un ulteriore caratteristica strutturante del suono o della musica si ha quando essi assumono una funzione di punteggiatura. Nel cinema muto la punteggiatura era ottenuta in modo del tutto esplicito mediante l’inserzione di didascalie a pieno schermo. Nel caso del sonoro la cosa è meno evidente, ma ottenibile mediante un utilizzo iconico del suono o di incisi musicali. Questo a volte può risultare in una stilizzazione come nei cartoni animati oppure in una sorta di utilizzo della tecnica del leitmotiv. Come elemento di punteggiatura si aggiunte anche quello stato particolare del sonoro che è il silenzio, come pausa tra due suoni o brani musicali. Il silenzio nel cinema inizia con il sonoro, dice Bresson. Il cinema muto viceversa è una continua suggestione di suono.

Tre modalità d’ascolto: il suono come metafora

Si possono definire tre modalità d’ascolto: semantico, causale e ridotto. Il primo fa riferimento al parlato e quindi all’attribuzione di significato convenzionale a suono costituito da sequenze di fonemi. In questa categoria si può includere anche l’ascolto musicale. Il secondo invece riguarda il cosiddetto ascolto quotidiano, ovvero l’ascolto degli eventi che accadono intorno a noi. È un ascolto che più che riguardare il suono è un automatismo cognitivo che rimanda ad eventi ed oggetti della realtà che ci circonda, di cui il suono è un elemento di monitoraggio. Il terzo, l’ascolto ridotto, è invece l’ascolto del suono e delle sue caratteristiche per sé. Il suono cioè slegato dalla sua sorgente sonora. Il concetto di ascolto ridotto proviene dalla tradizione della musica elettroacustica o acusmatica, dove la sorgente del suono non è né presente né nota e il suono proviene da degli altoparlanti. Nel cinema un caso di ascolto ridotto molto evidente è quello per esempio dei primi film sugli extraterrestri, dove un suono tipo quello di un Theremin (quindi non identificabile con una sorgente sonora) stava ad indicare la presenza degli extraterrestri. Anche nel caso dei suoni d’ambiente e cioè dell’ascolto causale si riscontra un impiego metaforico del suono, quando cioè il suono sostituisce l’immagine. Un esempio è il suono che segna un colpo mortale e l’uccisione di qualcuno che non viene mostrata.

Anche il silenzio ha una sua rappresentazione metaforica mediante il suono. Suoni tipici per rendere il silenzio sono quelli di grida di animali in lontananza, oppure il suono di un orologio nella stanza vicina o suoni tenui come quello di carezze amplificati in modo innaturale a dare l’impressione di essere molto vicini all’orecchio dell’ascoltatore così da poter essere percepiti.

Un ulteriore evidenza del carattere metaforico del suono rispetto alla realtà ed alle immagini è la polivalenza che uno stesso suono può avere. Una volta ancora Chion riporta degli esempi estremi menzionando il fatto che uno stesso suono può risultare efficace nel caso di uno spiaccicamento di un anguria o della frantumazione del cranio di una persona. E, sempre per restare in tema, lo stesso suono di gorgoglio può essere utilizzato per una scena drammatica come la tortura di un principe russo nell’Andrej Rublov di Tarkowskj, a cui viene fatto ingoiare dell’olio bollente, come nel caso di un gargarismo di Peter Seller in uno dei suoi film comici. Il suono quindi come elemento di rappresentazione di un evento secondo una corrispondenza che, entro certi limiti, è del tutto arbitraria. Portando alle estreme conseguenze questo concetto ritorniamo all’idea di “cartonificazione” della realtà per quanto riguarda gli aspetti acustici, o ancora alla sperimentazione di creazioni di corrispondenze completamente arbitrarie tra una certa immagine o un oggetto o un personaggio e un suono. In quest’ultimo caso, se vogliamo, ci si avvicina piuttosto ad una corrispondenza di tipo musicale o, per meglio dire, secondo la tecnica del leitmotiv.

La scena audiovisiva

La scena visiva coincide indubbiamente con quanto riprodotto sullo schermo. Lo schermo nel cinema è unico. Ci furono esperimenti di film multi-schermo come il Napoleone di Gance, che furono però presto abbandonati. La scena uditiva non è invece relegata sullo schermo, tutt’altro. Ci si chiede allora quale possa essere l’organizzazione della scena uditiva e quali siano le relazioni che si possono instaurare tra scena visiva e quella uditiva. Tutto ciò tenendo sempre presente il fatto che comunque l’immagine è dominante tra i media rispetto all’audio.

Chiaramente non esiste un contenitore della scena uditiva come lo è lo schermo per il video. L’audio può riferirsi a ciò che avviene nella scena ma non necessariamente o non solamente. Un suono può riguardare anche una sorgente sonora che non è inquadrata in quel momento. Su ciò è facile giocare con effetti di “acusmatizzazione” e “de-acusmatizzazione” del suono. Nel primo caso si intende l’effetto di un suono che continua a rivelare cosa sta accadendo e la sua sorgente sonora, anche se questa non è più inquadrata. Nel secondo caso si tratta invece di ottenere un effetto di anticipazione introducendo un suono di cui inizialmente non si vede la sorgente. L’effetto può essere drammatico e di tensione, soprattutto se il suono non è inaspettato e non riconducibile ad una sorgente nota.

Figura 1: La figura rappresenta la tripartizione della scena audio nel contesto di un prodotto audiovisivo.
Tri-cerchio
Tri-cerchio (audiovision_tri-cycle.png)

Una distinzione più precisa riguardo la collocazione dei suoni nella scena audiovisiva può essere fatta in termini di suoni diegetici e non-diegetici, ovvero tra suoni che appartengono al contesto rappresentato nella scena visiva e suoni che non vi appartengono. La colonna sonora musicale ricade ovviamente nella categoria dei suoni non-diegetici. I suoni diegetici possono a loro volta distinguersi in on-screen ed off-screen a seconda che la sorgente appaia o meno sulla scena audiovisiva. Per individuare con maggior precisione cosa si intenda per suoni off-screen è interessante considerare dei casi singolari come il suono della voce di una persona che ci volge le spalle o la voce che ci giunge da una cornetta telefonica. Altri casi particolari sono quelli di suoni fisiologici amplificati, come il battito cardiaco o il respiro di una persona sullo schermo oppure di una voce interiore, che rappresenta il pensiero di un personaggio sulla scena. In particolare quest’ultimo esempio sposta l’audio da una rappresentazione oggettiva del suono presente sulla scena ad un livello invece soggettivo. A questo spostamento dal piano oggettivo a quello soggettivo, si aggiunge un’ulteriore tipologia di suoni off-screen mediante cambiamento temporale: suoni e voci appartenenti ad un momento passato (o futuro) della scena rappresentata.

I suoni off-screen possono essere classificati anche come attivi e passivi. Nel primo caso ci si riferisce a dei suoni che richiamano l’attenzione e che in qualche modo stimolano delle domande come “cos’è?” oppure “dov’è?”. In sostanza, si tratta di una realizzazione del Ears lead the Eyes pattern. Nel secondo caso invece si tratta di componenti sonore di sfondo.

Dei suoni off-screen si può valutare inoltre il senso di estensione dello spazio che possono mettere in opera. Una voce mentale, interiore riduce lo spazio a una dimensione nulla. Viceversa, il suono dell’ambiente esterno fatto sentire amplificato mentre la scena riproduce un interno genera l’effetto opposto di allargamento dello spazio. Il suono quindi può essere efficacemente impiegato per ottenere degli effetti di contrazione e dilatazione dello spazio riprodotto sullo schermo. Anche la musica come suono off-screen può assumere un ruolo spaziale, nel senso di collegamento tra ambienti diversi. Si dice la musica come passepartout che permette di “attraversare i muri”. Un continuum musicale aiuta in un certo senso a sopperire alla mancanza di unità di luogo che nel cinema assolutamente non sussiste.

Sempre restando in termini di funzione spaziale, il suono può determinare degli effetti di definizione di una prosepettiva a seconda di quale punto di ascolto venga scelto. Non solo quindi un punto di vista per quello che riguarda la scena visiva, ma anche un punto di ascolto che può coincidere con quello visivo o contraddirlo. Una possibilità è quella di far coincidere il punto di ascolto con quello di un personaggio sulla scena, in modo da rendere chiaro chi è che sta ascoltando. Un esempio può essere quello di un suono molto flebile che può essere chiaramente percepito solo dal personaggio che si trova nei pressi della sorgente del suono.

Un altro aspetto di cui tener conto e che è un elemento di distinzione tra il caso visivo e quello uditivo è il ruolo della cinepresa rispetto a quello del microfono. La cinepresa è un elemento che è sempre presente ed è in certo senso parte della scena visiva. Più o meno consapevolmente siamo disposti a pensare che quello che vediamo riprodotto sullo schermo sia come visto attraverso il mirino di una cinepresa, anche laddove la cinepresa si muova, come nel caso di una ripresa fatta da un mezzo di trasporto o simili. Il microfono invece non è mai e non deve essere presente. Non siamo disposti ad accettare che sentiamo attraverso un microfono e non è ammissibile che si sentano dei rumori dovuti al microfono, rumori che, d'altra parte, potrebbero essere equiparati ad una cinepresa che si muove.

Alta definizione e realismo

Si è già discusso del fatto che non esiste una relazione necessaria tra immagine e suono. Una riprova semplice e che ognuno avrà sperimentato è la sorpresa nel vedere per la prima volta il volto di una persona di cui si conosce bene e si è ascoltata molte volte la voce. Questo semplice esempio indica la pressochè impossibilità di associare con successo un suono all'aspetto preciso della sua sorgente sonora. Di qui anche l'efficacia drammaturgica nel cinema dell'effetto di de-acusmatizzazione di una sorgente sonora. Questo presupposto fa anche sì che ci sia un ampio spazio per giocare sull'arbitrarietà delle associazioni tra audio e video.

Questo discorso sull'arbitrarietà degli accostamenti audiovisivi porta con sè anche un altro problema, che è quello della qualità del sonoro. Chi ha sperimentato la registrazioni di suoni di ambiente sa che il risultato è spesso deludente, nel senso che il suono privato del suo contesto reale resta come nudo di fronte al nostro udito. O forse è meglio dire, perde quell'identità precisa che pareva avere nella sua ambientazione reale e diventa qualcosa di sbiadito e che necessita un "rinvigorimento percettivo". La ripresa d'ambiente così com'è rischia di dare la sensazione di vuoto e silenzio. Parlando di audio, il termine "realistico" risulta quindi molto pericoloso. E' invece sempre consigliabile pensare in termini, se si vuole, di (alta) definizione o, per dirla in altro modo, di suono enfatizzato e "aumentato". Anche un approccio di tipo semplificativo e di stilizzazione può essere una soluzione per sopperire alla scarsa efficacia del realismo nel sonoro. Questo è quanto si fa, per esempio, nel caso della produzione audio per film di animazione e cartoni animati. La realtà è sempre meno variopinta e scintillante rispetto a come è rappresentata nel cinema. Una rappresentazione stilizzata permette di accentuare alcuni aspetti salienti del suono per potenziare artificialmente il senso di quello che si vuole rappresentare. Il termine realismo è allora sostituibile con quello di verosimile. Un corretto uso del riverbero è un ulteriore elemento importante per una resa efficace del sonoro. Il riverbero serve a caratterizzare lo spazio dal punto di vista dell'acustica ed arricchisce il suono. Se impiegato in modo sovraccarico può inoltre essere usato per produrre degli effetti stranianti.

La televisione: un ambito diverso di produzione audiovisiva

La televisione è un esempio audiovisivo molto diverso dal cinema. Dal punto di vista meramente tecnico i due media potrebbero essere confusi: uno schermo su cui vengono riprodotte delle immagini e degli altoparlanti attraverso i quali si ha una diffusione del sonoro. Quello che però distingue i due mezzi in modo essenziale è la loro funzione e il contesto nel quale se ne usufruisce. Per mettere a fuoco la specificità della televisione rispetto al cinema basta pensare a quello che sono i programmi televisivi per antonomasia e cioè i notiziari e i talk-show. Si tratta in fondo di radio illustrata: quanto viene detto con la voce è l'elemento sostanziale e imprescindibile, mentre le immagini sono ridotte ad una funzione quasi meramente decorativa. Sicuramente questa distinzione è in parte dovuta alla differenza di dimensioni fisiche dello schermo. Tuttavia l'elemento crontaddistintivo vero è il contesto: pubblico e di intrattenimento il cinema, privato e informativo la televisione. Quest'ultimo aspetto risulta ancora più evidente nel caso in cui la televisione diventa un elemento di "compagnia" e viene tenuta sempre accesa in una casa privata o in un locale pubblico come un bar. In questi casi ancor di più è il parlato nell'accezione della radio che prende il sopravvento mentre l'immagine, su cui ogni tanto casca l'occhio, è l'eccezione.

Come controesempio, eccezione che conferma la regola, Chion cita il caso delle riprese sportive e in particolare delle riprese di partite di tennis. E' facile che durante uno lungo scambio a fondo campo il telecronista taccia anche per un arco (interminabile per le modalità televisive) di 30 secondi e l'unico sonoro sia dato dai rumori d'ambiente: gli impatti della pallina sulla

Il videoclip

Il videoclip costituisce un caso diverso di prodotto audiovisivo. Se nel cinema l'immagine è dominante e "guida" il sonoro e nella televisione, come abbiamo visto, i ruoli si invertono, nel videoclip si verifica una situazione di parità. L'elemento essenziale del videoclip è il sincronismo tra video e suono. Tutto si gioca in un legame strettissimo tra audio e video con un risultato che scardina la funzione drammatica del tempo a favore della creazione di un effetto caleidoscopico. E' come se fossimo di fronte ad un oggetto dalle molte facce, che osserviamo una ad una senza un ordine predefinito e con possibilità di ritorni e ripetizioni. Anche la freccia monodirezionale del sonoro perde la sua rigidità e il suono diventa reversibile, secondo la prassi dei Dj's che fanno skratching con i dischi di vinile, ruotandoli in entrambe le direzioni.

Content actions

Download module as:

PDF | EPUB (?)

What is an EPUB file?

EPUB is an electronic book format that can be read on a variety of mobile devices.

Downloading to a reading device

For detailed instructions on how to download this content's EPUB to your specific device, click the "(?)" link.

| More downloads ...

Add module to:

My Favorites (?)

'My Favorites' is a special kind of lens which you can use to bookmark modules and collections. 'My Favorites' can only be seen by you, and collections saved in 'My Favorites' can remember the last module you were on. You need an account to use 'My Favorites'.

| A lens I own (?)

Definition of a lens

Lenses

A lens is a custom view of the content in the repository. You can think of it as a fancy kind of list that will let you see content through the eyes of organizations and people you trust.

What is in a lens?

Lens makers point to materials (modules and collections), creating a guide that includes their own comments and descriptive tags about the content.

Who can create a lens?

Any individual member, a community, or a respected organization.

What are tags? tag icon

Tags are descriptors added by lens makers to help label content, attaching a vocabulary that is meaningful in the context of the lens.

| External bookmarks