DANTEDI’: Come la Statistica può analizzare la Divina Commedia.


Qualche giorno fa, abbiamo celebrato il Dantedì, giorno dedicato ad uno dei poeti più importanti della storia e della letteratura mondiale, nonché simbolo della cultura italiana nel mondo, esponente del Dolce Stilnovo. 

Foto di Rhodan59 da Pixabay

#4


29 MARZO 2020

Se padre Dante ci vedesse oggi, nel nuovo millennio, nel mondo dei Big Data e degli algoritmi di Artificial Intelligence, cosa direbbe? Lui che è vissuto ai tempi delle arti del Trivio (grammatica, dialettica e retorica) e del Quadrivio (aritmetica, geometria, astronomia e musica), cosa dovrebbe pensare della nostra dimensione culturale che, il più delle volte, sacrifica la poesia per una manciata di like, numeri ad ogni modo che risuonano nelle casse dei cosiddetti imprenditori digitali? 

Tutti l’abbiamo studiata, la Divina Commedia tanta amata e tanto odiata, e per il pedante (a volte) insegnamento ministeriale-didascalico, e per la sua, al tempo stesso, attualità madornale circa il comportamento dell’essere umano dai tratti sempre più infernali e carnascialeschi.

Non molti sanno che ai tempi di Dante Alighieri, non era permesso non conoscere le arti del Trivio prescindendo da quelle del Quadrivio; in altri termini poesia, matematica e musica erano sullo stesso piano. Matematica e musica sempre sorelle, hanno guidato la stesura dell’intero componimento dall’Inferno al Paradiso, passando per il Purgatorio dantesco. Benché la fortuna di queste si sia dissipata lungo il cammino dei nostri giorni, sembrerebbe addirittura blasfemo studiare matematicamente la secolare leggiadria e persistente solennità di un’opera come la Divina Commedia. 

Come molti sanno lo schema della Divina Commedia, nel suo districarsi in rime, segue criteri numerologici rigorosi, mediante la solerte presenza del numero 3: il numero divino per eccellenza nel ricordo della trinità divina. Per cui terzine si susseguono in uno schema preciso, musicale, talvolta pacato e altisonante e talvolta incessante nella rima viscerale, nei vissuti infernali del Poeta in compagnia di Virgilio. 

Questo post non vuole sicuramente essere una critica letteraria dell’opera, l’intento è quello di mostrare la matematica sottostante il canto del Poeta. La curiosità che desta quanto detto fin qui è: la Statistica (con i suoi algoritmi/modelli) può analizzare la Poesia?

La risposta è affermativa e trova il suo spazio nell’ambito dei metodi statistici afferenti alla Text Data Analysis: tali modelli permettono lo studio dei testi trattandoli come dati conseguenziali, come note musicali che trovano la loro aritmetica nel flusso del testo. 

Come precedentemente specificato, il componimento dantesco sperimenta spesso una musicalità per definizione, essendo cadenzato da rime ben programmate, dunque i costrutti letterali sono disposti secondo una progettazione specifica del Poeta. Come risulta possibile dunque, mediante la Statistica analizzare un testo? Come è possibile che la Data Science tratti la Divina Commedia come un dataset?  

I modelli menzionati precedentemente fanno fondamento sul flusso logico del testo, ossia su come le parole si dispongano in maniera spaziale, tra loro, dall’inizio alla fine del componimento. Di conseguenza, il ricorrere di alcuni costrutti letterali (per semplicità le parole intese come cellule elementari del testo) pone la possibilità di studiarne la frequenza. Dunque, per semplificare:


  • Spazio dei costrutti letterali;

Frequenza dei costrutti letterari. 

Esempio di configrazione spaziale del Testo.

Quest’ultimo aspetto rende misurabile il costrutto letterario mediante un concetto di distanza. La distanza tra frequenze è rappresentabile in uno spazio di dimensioni reali, geometricamente configurabile per via di alcune tecniche, come l’Analisi delle corrispondenze (Correspondence Analysis, CA, M. Greenacre & J. Blasius). Laddove queste vengono applicate, danno luogo a mappe di Cluster Analysis che permettono la rappresentazione concettuale di quanto, ad esempio, voluto dal Poeta. 

Qui di seguito abbiamo l’analisi del primo canto della Divina Commedia dell’Inferno Dantesco (lo conosciamo a memoria tutti noi) mediante le tecniche precedentemente menzionate: 

Density Plot, I canto Inferno – Divina Commedia

Nella figura precedente è mostrato il Text Density Plot del testo analizzato: 

  • Nel riquadro 1, vi è l’insieme del nucleo più “caldo” del primo canto, nel quale si evidenziano costrutti letterari indicativi dello stato di agitazione del Poeta per essersi recato all’Inferno, in un periodo della sua vita di smarrimento e di ricerca della grazia divina (Paradiso) con la mediazione della sua donna angelicata, Beatrice. “paradiso”, “pace”, “mano” sono stati individuati dall’algoritmo utilizzato quali nuclei più frequenti e geometricamente più vicini. 

  • Nel riquadro 2, si intravedono tutti i soggetti ricercati dal Poeta nella trinità divina di “dio”, “figliuol”, nella figura di salvezza e redenzione della Vergine individuate dai nuclei “grazia”, “maria” e “ora”, quasi ad invocare la sua presenza e apparizione immediata.
  • Nel riquadro 3, il nucleo “terra” individua il punto di partenza del viaggio del Poeta, alla ricerca de “li occhi” della donna che dovranno condurlo alla “luce” (Dio).

Mentre nell’ultimo grafico è stato applicato un algoritmo di Text Clustering, il quale mira ad individuare i nuclei da agglomerare per i due aspetti teorici sopra menzionati (Spazio e Frequenza testuale):

Text Clustering – I canto, Inferno, Divina Commedia

In questo grafico, i colori blu e celeste identificano le unità testuali che condividono lo spazio geometrico rappresentato dall’analisi. Infatti i nuclei “occhi” e “paradiso” fortificano quanto la critica letteraria abbia addotto alla letteratura dantesca ed, in generale, stilnovista; l’uso della “donna angelicata” quale mezzo di trasduzione dell’anima verso il Paradiso, in particolare nell’adorazione dei suoi occhi. Il gruppo rosso individua i soggetti “divini” dell’intera Divina Commedia, mentre gli altri gruppi evidenziano l’uso di avverbi tempo e di luogo che lasciano presagire circa lo stato burrascoso e di smarrimento del Poeta, il quale si ritrova spaventato e senza una guida all’inizio di un lungo viaggio. 

Questo era solo un esempio di quanto sia possibile con i metodi statistici, anche con un testo.

Ricordate una frase celebre di W.EDWARDS DEMING:

“Senza dati sei solo un’altra persona con un’opinione”

× Whatsapp