Ancora su AI, Latino e #Musica

Ho scritto in passato di un progetto musicale basato sull'uso dell’AI, interrogandomi su quanto ci fosse di umano e quanto di artificiale. Devo ammettere che mi ero sbagliato. Pensavo che dietro Dream.in.Sanity ci fosse un autore sfuggente, difficile da rintracciare — strano, per un artista che dovrebbe voler emergere online — ma mi sbagliavo. In realtà, è una persona apertissima al dialogo, con cui è stato semplice entrare in contatto. Mi ha persino inviato una risposta all’articolo, che riporterò in fondo.

Dalla sua risposta emerge però un dettaglio sorprendente: Dream.in.Sanity è portato avanti da una sola persona. Si definisce semplicemente “un metallaro”, e realizza tutto con l’aiuto esclusivo di diverse AI e di un’amica che posa come modella. Nessuna band, nessuna produzione tradizionale: solo passione, intelligenza artificiale e creatività individuale.

Ed è proprio questo l’aspetto più impressionante: l’AI non è solo uno strumento per lui, è il suo modo di pensare ai problemi. Quando mi ha detto di aver letto questo blog, gli ho chiesto se fosse italiano o se parlasse italiano. La sua risposta? “Siamo nel mondo dell’AI: le barriere linguistiche sono destinate a cadere.” Touché. È questo il punto: se davanti a un problema ti chiedi “come posso usare l’AI per affrontarlo?”, spesso scopri che non solo puoi risolverlo, ma puoi anche aggirarlo in modo elegante. È una mentalità, un paradigma nuovo — e sta già iniziando a diffondersi.

Tutto questo, ovviamente, si inserisce nel grande dibattito — spesso distorto da interessi economici enormi — sull’arrivo dell’AI. Lo sapete: io sto dalla parte del progresso tecnologico e del potenziamento dell’individuo. Credo che ogni tecnologia che permetta a una singola persona di esprimersi, creare, e fare ciò che la rende felice sia una buona tecnologia. A patto, naturalmente, che non renda infelici altri. È una linea sottile, ma fondamentale.


I critici dell’AI si affannano a sostenere che, in fondo, l’AI non crea nulla: “ruba” materiale da altri creativi. È l’obiezione più gettonata, e ruota attorno al periodo di addestramento dei modelli. Ma c’è un problema fondamentale: nessuno, e dico nessuno, riesce mai a indicarmi con precisione da chi sarebbe stato “rubato” un determinato brano. Ho posto la domanda in modo diretto, più volte. Silenzio. E questo, per un’accusa così pesante, è piuttosto indicativo. Prendiamo il brano che segue:

Mi sapete indicare, con precisione, la vittima di questo presunto furto? Perché se qualcuno copia — che so — la Gioconda, lo capisco subito: riconosco l’opera, so chi l’ha dipinta, ed è evidente a chi sia stato sottratto qualcosa. Il punto è proprio questo: basta riconoscere l’originale per parlare di plagio.

Ma qui? Qui parliamo di un “furto” senza vittima. Nessuno sa dire chi sia stato derubato, né cosa sia stato rubato. Quante canzoni death metal melodico, cantate in latino, conoscete che suonino come questa? Appunto. Se non sappiamo identificare né il derubato né l’oggetto rubato, allora dov’è il furto?

È ora di dire una cosa: chi parla di “furto” da parte dell’AI confonde — o finge di confondere — imitazione con ispirazione. Ma la differenza non è solo semantica, è strutturale. Tutta la storia dell’arte, della musica e della letteratura si regge su ispirazioni reciproche, contaminazioni, influenze. I Beatles si sono ispirati a Elvis, il metal nasce dalla contaminazione tra blues e hard rock, e lo stesso Bach ha preso a piene mani da musiche popolari del suo tempo. Nessuno li ha accusati di furto.

L’AI, nel suo processo di generazione, fa esattamente questo: apprende strutture, stili, pattern — non copia, ma si ispira. Esattamente come farebbe un musicista che ha ascoltato tutta la vita un certo genere, e poi prova a scriverci dentro qualcosa di nuovo. Il risultato? Qualcosa che ricorda ciò che l’ha influenzato, ma che non è ciò che l’ha influenzato.

Chiamare questo processo “furto” significa chiedere all’AI un trattamento che non abbiamo mai preteso dagli umani. E questo, francamente, ha poco senso.


Ma anche questo dibattito diventa sterile, se non ci poniamo la vera domanda: l’autore dietro Dream.in.Sanity ama davvero la musica che crea? Io lo spero. Proviamo a pensare di sì. Proviamo a immaginare che questa sia, più o meno, la realizzazione di un progetto musicale personale, in cui è riuscito a comporre esattamente la musica che voleva. La musica che gli piace davvero.

E allora chiediamoci: quanta gente ascolta davvero la musica che ama? E quella che crediamo ci piaccia, è davvero nostra — o è semplicemente ciò che l’industria ci scarica addosso, giorno dopo giorno? Certo, ogni tanto qualcosa ci colpisce di più. Ma chi non ha mai pensato: “se solo qui ci fosse un assolo di chitarra”, oppure “se solo smettesse di fare quella cosa con la voce”?

La verità è che ascoltiamo per lo più musica che ci piace quasi. La musica che quasi ci rappresenta. Un buffet enorme servito dall’industria, da cui scegliamo non quello che amiamo, ma spesso quello che ci dispiace di meno. Quanti possono dire, con onestà, di ascoltare musica fatta esattamente come la vorrebbero?

Certo, anche a me piace la musica di Dream.in.Sanity. Però, qualche volta, mi sorprendo a pensare: “Se solo avesse usato larva o spiritus invece di daemonelarva è sottovalutato nel suo essere spettrale, deforme, incompleto.” Oppure: “Se solo usasse due voci femminili, un contralto e un soprano.”

Se l’avessi fatta io, curandone i dettagli, Lectio Diaboli avrebbe certamente un contralto e un soprano a cantare, invece di un sussurrato all’inizio. Ma, appunto, questa è la musica che piacerebbe a me.

E qui sta il punto: se vogliamo produrre la musica che ci piace davvero, dobbiamo prima imparare un po’ di teoria musicale, capire come si scrive, come si struttura un pezzo, e così via. Nel mio caso, dato che suono la batteria (o meglio, sto prendendo lezioni), dovrei poi trovare un gruppo con due cantanti, un soprano e un contralto, che faccia death metal melodico e canti in latino. Non è esattamente semplice, vero?


Ma visto che ci sono già passato, parliamo di ispirazione. Cos’è l’ispirazione? È la capacità degli artisti di catturare un’emozione e infilarla dentro un brano. Quando ascoltate quella musica, sentite l’eco di quell’emozione.

Avete presente quando vi stendete da soli con le cuffie, in una stanza silenziosa, e vi lasciate andare alla musica? Bene. Adesso sappiamo che non siete sposati. Dicevo: vi siete mai chiesti cosa succede nella vostra mente in quei momenti? Da piccolo dicevo “mi faccio i viaggi mentali”, poi “mi sparo i film”, ma in realtà succedono emozioni. A volte vi viene voglia di invadere la Polonia, altre volte vi vengono i lacrimoni. Dipende.

Questo è l’effetto dell’ispirazione: entrate in risonanza con un’emozione catturata da qualcun altro, e trasformata in musica. E volete sapere una cosa?

Posso ascoltare l’intera discografia di Taylor Swift senza provare un solo secondo di emozione. Niente. Zero. Tecnicamente è perfetta, musicalmente idem, ma dal punto di vista emotivo è un disastro: non trasmette nulla. Nessuna risonanza. Nessuna ispirazione.

Con Dreams.in.Sanity, invece, le emozioni scorrono. Ho invaso la Polonia con la mente così tante volte che quando passo da Katowice Carol, il barista, mi chiede: “Il solito?”

Ovviamente la capacità di percepire l’ispirazione cambia da persona a persona, e magari anche da periodo a periodo. Quindi, chi lo sa: magari da morto mi piacerà Taylor Swift. Ma il punto è un altro.

Quanta della musica che ascoltiamo, essendo un prodotto industriale, può essere davvero ispirata? Non percepite anche voi questo gigantesco senso di vuoto?


Se fosse per me, sarei già un fanatico di questo genere musicale solo per due motivi fondamentali.

Il primo: chiunque può ascoltare la musica che vuole — proprio quella. Non quella che gli viene proposta, spinta, raccomandata dall’algoritmo o dalle major. Ma quella che sceglie. Che cerca. Che vuole. E magari, domani, anche quella che si crea da solo.

Il secondo: è possibile trasmettere emozioni autentiche, anche usando l’AI. Lo dimostra proprio questo progetto. Dreams.in.Sanity non è solo un esercizio di stile tecnologico: è un flusso emotivo. È qualcuno che ti parla, attraverso strumenti nuovi, ma con emozioni vere. E questo, per me, basta e avanza.

E vai che si invade la Polonia.

E allora arrivano i musicofighetti a dirmi: “Ma così è facile!”

Bene. Perché non ci provate voi, prima di fingere di sapere che è facile? Avete avuto la dignità intellettuale di mettervi lì, aprire uno di questi strumenti, e provare?

Io sì.

Ecco i risultati:

Link

Sono cose goliardiche, certo, ma non sono esattamente quello che mi piace davvero. Perché?

Perché non è affatto semplice.

Per ottenere esattamente ciò che avete in mente, vi servirebbe una macchina che vi legge nel cervello. E non è ancora in commercio. Ci sono tanti altri motivi tecnici e creativi, ma il punto è chiaro: non è facile.

E poi, diciamola tutta: come vi permettete di dire “è facile” con aria sdegnata, quando il 90% della musica che ascoltate oggi è passata per l’autotune?

Com’è che quello non ha mai prodotto ondate di sdegno?


E infine, l’ultima domanda: ma perché proprio in latino?

La risposta corretta sarebbe: “E perché no?”

Ma in realtà la risposta giusta è un’altra: perché mi piace.

Perché ha una struttura secca, chiara. Perché ha una vocalità che emerge, che buca il suono. E poi, c’è anche un richiamo antico, potente.

Una delle prime testimonianze scritte del latino, infatti, sono i Carmina Arvalia — canti rituali usati da particolari sacerdoti della Roma agraria, all’alba della sua storia.

Si tratta di latino arcaico, primitivo, che presenta alcune oscuritaä, come lo stesso nome dei canti. Carmina Arvalia e' una forma classica per descriverli, anche se alcuni accademici dubitano un pochino. Potete rendervi conto di quanto fosse arcaico il latino osservandolo.

Ecco il testo:

### Carmina Arvalia

Enos Lases iuvate  
Enos Lases iuvate  
Enos Lases iuvate  

Neve lue rue Marmar sins incurrere in pleoris  
Neve lue rue Marmar sins incurrere in pleoris  
Neve lue rue Marmar sins incurrere in pleoris  

Satur fu, fere Mars, limen sali, sta berber  
Satur fu, fere Mars, limen sali, sta berber  
Satur fu, fere Mars, limen sali, sta berber  

Semunis alterni advocapit conctos  
Semunis alterni advocapit conctos  
Semunis alterni advocapit conctos  

Enos Marmor iuvato  
Enos Marmor iuvato  
Enos Marmor iuvato  

Triumpe  
Triumpe  
Triumpe  
Triumpe  
Triumpe

Il testo e' di difficilissima comprensione, perche' e' arcaico, e ci sono ancora delle discussioni su come tradurlo:

Per esempio:

Del resto, quel latino risale alla fondazione di Roma (VII-VI secolo a.C.). Persino il nome dei canti e' in discussione tra gli accademici. Ma come suonava?

Ora, immaginate un rituale: una processione religiosa, in cui questo canto veniva salmodiato dai Fratres Arvales, un collegio sacerdotale dedicato alla protezione dei campi.(in seguito la tradizione religiosa romana cambio').

Ovviamente, essendo cantato in processione, possiamo già intuire il tempo: il due quarti tipico della marcia. Perche'? Perche' e' quello che cantate se cantate camminando insieme: uno-due, dest-sinist, Ta-tum , ta-tum. Una cadenza regolare, quasi ossessiva, che accompagna il passo.

Ma poi, alla fine, succede qualcosa: si entra in un gutturale potentissimo, un crescendo che esplode in quel “Triumpe, Triumpe, Triumpe...”

A confronto, lo stupido “A-HU!” degli spartani hollywoodiani (che, tra parentesi, non è nemmeno storico di striscio) sembra il gridolino di chi ha dimenticato le chiavi di casa.

Questo sì che è evocativo. Questo sì che ha radici.

Ecco perche' il latino.

Io lo immagino cosi', se solo avessero avuto l'heavy metal

Di contro, l’inglese è facilissimo da cantare, per un motivo molto semplice: ha tantissime parole monosillabiche, ognuna con una vocale centrale allungabile.

Tipo:
Iuuuuuuuuu,
Looooooooovvvvv,
eccetera.

Per capire il mio sarcasmo, prendiamo la parola “miao”. Facciamo uno sviluppo:

Miao, Meeo, Maao, Muuo, Miiiio.

Con queste cinque variazioni, possiamo prendere qualsiasi canzone in inglese, sostituirle al testo, e la canzone suona uguale. Basta mettere che so io “Muuooo” dove si allunga la “u”, come in Youuuuuuu, mettere Miao dove si allunga la “a”, e cosi' via.

Miao Miao.

Gattini e tette. Ma senza le tette.

Quindi si, qualsiasi lingua. Ma non l'inglese. Per favore. Serve a miagolare, non a cantare.


Detto questo, ho appena dipinto un futuro.

Un futuro in cui, nelle case, non scaricheremo più musica.

Ci sarà una music box. Dentro, una AI. Una AI che, dopo aver capito i nostri gusti dialogando con noi, produrrà al momento esattamente la musica che vogliamo ascoltare.

Non più un buffet da cui scegliere il meno peggio.
Una cucina su misura. Al momento. Solo per te.

E vaffanculo al diritto d’autore.


E ora, come promesso, vi cito la risposta che Dreams.in.Sanity mi ha dato.

Ciao Uriel,

ti ringrazio sinceramente per aver dedicato tempo ed energie a scrivere un post sul mio progetto, nonostante possa sembrare un contenuto di nicchia.

Dalle YouTube Analytics ho visto che arrivano visitatori al canale proprio dal tuo sito, così ho letto con piacere il tuo articolo e ne ho approfittato per ampliare le mie conoscenze grazie alla tua vastissima cultura.

Poiché hai investito impegno nella stesura, mi sembra doveroso rispondere ai punti che hai sollevato. Se avrai altre domande, non esitare a contattarmi.

• Generazione dei testi
  Apprezzo il giudizio lusinghiero, ma attualmente i testi vengono generati quasi interamente dall’AI; io mi occupo di impostare il tema generale e di rifinire i dettagli. Come hai notato, il ritmo è fondamentale: se la metrica non combacia, modifico il testo finché non funziona musicalmente.

• Latino tardo e classico
  Sono consapevole della commistione fra latino tardo / medievale e latino classico. L’obiettivo è uniformare tutto al latino classico, ma sto ancora imparando la lingua e mi manca la competenza per distinguere ed applicare con precisione le varianti.

• Pronuncia nelle produzioni più recenti
  All’epoca di Lectio Diaboli alternavo ancora pronunce tarde e classiche; nei brani caricati di recente cerco invece di attenermi il più possibile alla fonetica classica.

• Limitazioni di SUNO
  Con l’AI che uso (SUNO) devo spesso inserire manualmente la traslitterazione fonetica, altrimenti la pronuncia ricade sul latino ecclesiastico. Per esempio, Gehenae diventa Gehenai, Regina va suddiviso in Reghina ecc. Non è un lavoro creativo, piuttosto un compito ripetitivo; ciononostante il risparmio di tempo e costi rispetto all’ingaggiare vocalist o session player è enorme.

• “Impronta” AI nella musica
  Che la musica suoni artificiale mi pare naturale; tuttavia, con la versione 4.5 di SUNO la qualità è cresciuta a tal punto che distinguere fra AI e musicisti umani diventerà sempre più arduo.

• Sincronizzazione video
  I problemi di sync sono colpa mia. Nei contenuti più recenti su Instagram ho già implementato transizioni a tempo di musica, e i futuri video di YouTube seguiranno la stessa linea.

• Dream.in.Sanity
  È un progetto interamente gestito da me. Nato su Instagram con semplici immagini, è evoluto quando, da metallaro con oltre 25 anni di ascolto alle spalle, non ho saputo resistere alle potenzialità della musica generata dall’AI. Jasmine Belle, mia amica di lunga data che faceva la modella, ha accettato volentieri di apparire nei video come parte di questo piccolo esperimento.

Spero che queste risposte abbiano chiarito i tuoi dubbi. Attendo con piacere i tuoi prossimi articoli.

– Sejin Chang🙏

Uriel Fanelli


Il blog e' visibile dal Fediverso facendo il follow a: @uriel@keinpfusch.net

Contatti: