FMSDM — Grandezze estratte

Le grandezze del FMSDM.
Cosa viene estratto — e cosa significa.

Il Framework di Misurazione Semantica del Discorso Mediale (FMSDM) analizza la trascrizione integrale di ogni edizione di telegiornale e ne restituisce una struttura dati articolata in blocchi. Questa pagina descrive ogni grandezza estratta: cosa rappresenta, come viene prodotta e come va interpretata.

Tre livelli epistemologici

Dati oggettivi

Conteggi, posizioni, co-occorrenze lessicali. Verificabili direttamente nella trascrizione.

Dati classificati

Assegnazioni di tema, tipologia di entità. Il modello mappa segmenti su una tassonomia predefinita e chiusa. La tassonomia è fissa, la scelta di categoria è inferenziale.

Dati inferiti

Valence, frame narrativi, analisi del silenzio. Richiedono giudizi interpretativi complessi: il livello più ricco, ma anche più soggetto a variabilità.

Metadata — Le coordinate dell’analisi

I metadati non sono il prodotto dell’analisi semantica, ma il suo contesto di produzione. Senza di essi ogni analisi sarebbe un dato orfano, impossibile da confrontare.

Rete

transcription_source

Identifica la testata giornalistica che ha prodotto l’edizione analizzata: TG1, TG5, TG3, TG La7 e altre. Non indica la fonte della singola notizia, ma la redazione responsabile dell’intero confezionamento editoriale. È il filtro primario di ogni confronto.

Data di riferimento

analysis_date

La data di messa in onda dell’edizione, in formato ISO 8601. È il secondo asse fondamentale dell’analisi: consente di costruire serie storiche, tracciare l’evoluzione delle narrative nel tempo e individuare picchi di copertura correlabili con eventi esterni.

Versione del framework

framework_version

Identifica la versione del FMSDM utilizzata per l’analisi. Se in futuro la tassonomia dei temi o i criteri di valence vengono modificati, questo campo permette di isolare i dati prodotti con versioni diverse e garantire la comparabilità longitudinale.

Entità — Gli attori del discorso

Un’entità è un attore del discorso mediale: un soggetto che agisce, subisce un’azione o viene invocato come riferimento nella narrazione. Il framework adotta una definizione estesa, che include persone, organizzazioni, luoghi e anche concetti astratti ricorrenti.

Nome dell’entità

entity_name

Il nome proprio o la denominazione, normalizzato in forma canonica. Le varianti lessicali — “Meloni”, “la premier”, “la presidente del Consiglio” — convergono verso un’unica voce (“Giorgia Meloni”). Questa normalizzazione è fondamentale per la coerenza delle serie storiche.

Tipo di entità

entity_type

Classifica la natura dell’entità nel contesto in cui viene utilizzata. La distinzione è contestuale, non intrinseca: la stessa entità può essere classificata diversamente a seconda di come funziona nella narrazione.

PERSON

Individui (politici, esperti, personaggi pubblici)

ORG

Organizzazioni, istituzioni, aziende

GPE

Entità geo-politiche (stati, regioni, città con valenza politica)

LOCATION

Luoghi geografici senza valenza politica primaria

CONCEPT

Costrutti astratti ricorrenti che funzionano come quasi-entità

Conteggio menzioni

mention_count · direct_mentions_count · indirect_mentions_count

Mention count è il totale delle menzioni dirette e indirette. La scomposizione aggiunge una dimensione qualitativa: un’entità menzionata spesso indirettamente è considerata nota, presupposta condivisa con il pubblico. Una menzionata sempre per nome viene introdotta o enfatizzata.

Nota tecnica: i conteggi sono approssimazioni affidabili, non valori esatti. Un LLM non esegue un conteggio deterministico e può avere margini di variabilità su testi lunghi.

Posizioni e contesti

mentions_positions · mention_contexts

Mentions positions mappa la distribuzione dell’entità lungo l’arco narrativo del TG. Mention contexts sono brevi estratti testuali che mostrano come l’entità viene menzionata — campioni rappresentativi selezionati dal modello.

Temi associati

topics_associated · primary_topic

Ogni entità è collegata a uno o più temi. Il primary topic è il tema nel cui contesto l’entità compare più frequentemente. Rivela il framing tematico delle entità: un leader presentato prevalentemente in contesto di criminalità viene percepito diversamente dallo stesso leader presentato in contesto di economia.

Temi — La dieta informativa dell’edizione

Il blocco temi descrive la distribuzione tematica dello spazio narrativo. La tassonomia è chiusa: 16 categorie più la voce ALTRO, che coprono l’intero spettro del discorso giornalistico italiano.

POLITICA INTERNA · POLITICA ESTERA · ECONOMIA · SANITÀ · TECNOLOGIA · CRIMINALITÀ · CULTURA · AMBIENTE · SCIENZE · SPORT · SOCIETÀ · RELIGIONE · CRONACA · SCUOLA E UNIVERSITÀ · TRASPORTI E INFRASTRUTTURE · DIFESA E SICUREZZA · ALTRO

Distribuzione percentuale

distribution_pct

Mappa ciascuna categoria alla sua percentuale di spazio narrativo. I valori sommano sempre a 100. È la metrica più sintetica per descrivere l’agenda di un TG: di cosa parla?

Nota tecnica: la distribuzione è calcolata per paragrafi, non per tempo di trasmissione. Un paragrafo breve e uno lungo contribuiscono in egual misura.

Dettaglio per paragrafo

paragraph_details

Per ogni paragrafo: identificatore sequenziale, anteprima testuale, tema primario assegnato e punteggio di confidenza (0–1). Consente la verifica paragrafo per paragrafo e l’analisi della struttura narrativa: come si articola la sequenza dei temi?

Valence — Il tono del discorso

La valence è la coloritura emotiva, valutativa e retorica con cui un’entità viene presentata nel discorso mediale. È il cuore qualitativo dell’analisi FMSDM. La scelta di 7 categorie anziché una semplice polarità positivo/neutro/negativo riflette la complessità reale del linguaggio giornalistico.

Le 7 categorie

GLORIFICAZIONE

Lode esplicita, attribuzione di competenza o moralità positiva.

CRITICA COSTRUTTIVA

Insufficienza ragionevole, bisogno di miglioramento senza negazione totale.

CRITICA DISTRUTTIVA

Fallimento, inadeguatezza, incoerenza radicale, delegittimazione.

ALLARMISMO

Urgenza, pericolo, crisi imminente.

AVVERTIMENTO MODERATO

Cautela, prudenza, segnalazione misurata di rischi.

NEUTRALE / FACTUAL

Dato nudo, dichiarazione senza coloritura emotiva.

IRONICO / SARCASMO

Critica implicita, distacco, tono discordante rispetto al contenuto.

Distribuzione di valence

valence_distribution

Per ogni entità con un numero sufficiente di menzioni, la proporzione in ciascuna delle 7 categorie (somma a 1.0). Una rete che presenta sistematicamente un’entità con il 70% di GLORIFICAZIONE e un’altra con il 70% di CRITICA DISTRUTTIVA sta operando un framing valutativo misurabile e tracciabile.

Punteggio sintetico e direzione

valence_score · valence_direction

Il valence score condensa le 7 categorie in un singolo valore da -1 a +1. La valence direction è l’etichetta risultante: POSITIVO, NEGATIVO o NEUTRALE. Sono metriche di comodo per orientamenti rapidi — utili per visioni d’insieme, potenzialmente fuorvianti per analisi di dettaglio. Per approfondire è sempre disponibile la distribuzione completa.

Evidenze

evidence

Ogni classificazione è accompagnata da: frammento testuale analizzato, categoria assegnata, modalità enunciativa (asserzione diretta, alta probabilità, condizionale, discorso riportato, speculativa) e attore fonte del giudizio. Il sistema distingue tra ciò che il TG afferma in prima persona e ciò che riporta come dichiarazione altrui — distinzione cruciale per l’analisi editoriale.

Valence per tema

valence_by_topic

Quando disponibile, scompone la valence di un’entità per contesto tematico. Consente di rilevare che la stessa entità riceve un trattamento diverso in ambiti diversi: un paese può essere presentato positivamente in politica estera e con cautela in economia.

Co-occorrenze — Chi viene associato a chi

Le co-occorrenze misurano la prossimità associativa tra coppie di entità nel testo. Due entità che compaiono ripetutamente nello stesso contesto vengono associate dal discorso mediale, indipendentemente dalla natura esplicita della relazione. Questa associazione implicita è un potente strumento di framing: “Meloni” e “crisi” ripetutamente co-occorrenti costruiscono un’associazione cognitiva anche senza un nesso causale esplicito.

Coppia e frequenza

pair · frequency

Le coppie di entità che compaiono nello stesso contesto testuale, con la loro frequenza. Il sistema restituisce le coppie più significative per ciascuna edizione.

Prossimità media

proximity_avg_tokens

La distanza media in token tra le due entità quando co-occorrono. Valori bassi indicano prossimità stretta (potenzialmente nella stessa frase); valori alti indicano co-occorrenza nello stesso blocco tematico. Dieci co-occorrenze a distanza di 2 token sono molto più significative di dieci a distanza di 50.

Valence dell’associazione

co_valence_mean

Il tono medio delle menzioni in cui le due entità co-occorrono. Caratterizza emotivamente la relazione così come costruita dal TG.

Indice di esclusività

exclusivity_index

Rapporto tra la frequenza di co-occorrenza e il numero totale di menzioni dell’entità. Un valore alto indica che un’entità compare quasi esclusivamente in associazione con l’altra — è narrativamente “legata” a essa.

Frame narrativi — La storia che il TG racconta

Il frame è il costrutto analitico più sofisticato del FMSDM. Nella tradizione della framing theory, un frame è un pattern ricorrente di selezione, enfatizzazione e organizzazione dell’informazione che promuove una particolare interpretazione della realtà. Nel FMSDM, un frame è operazionalizzato come un pattern ricorrente di triple Soggetto-Verbo-Oggetto con valence associata.

Identificativo e nome

frame_id · frame_name

Ogni frame ha un identificativo univoco e un’etichetta sintetica generata dal modello — ad esempio “Italia-Mediatore”, “Trump-Peace-Initiative”. Le etichette emergono dal testo, non sono selezionate da un elenco chiuso. Questo le rende espressive ma potenzialmente variabili nella formulazione tra edizioni.

Struttura SVO

subject_entities · action_verbs · object_entities

Chi agisce, con quali verbi, su chi. Questa scomposizione permette analisi di agentività: chi è soggetto attivo e chi oggetto passivo? I verbi rivelano il repertorio d’azione attribuito dal TG: “media, dialoga, propone” costruisce un’immagine diversa da “minaccia, attacca, denuncia”.

Frequenza e peso

frequency · frequency_pct

Il numero assoluto di menzioni che incarnano il frame e la percentuale delle menzioni dell’entità principale che vi rientrano. Se un attore ha un frame dominante all’80%, la narrazione che lo riguarda è prevalentemente monocromatica.

Tono del frame

valence_mean

La valence media delle menzioni all’interno del frame. Un frame di mediazione con valence positiva racconta una storia diversa da un frame di mediazione con valence neutrale.

Menzioni esemplificative

example_mentions

Frasi selezionate dal testo che incarnano il frame, scelte per rappresentatività. Rendono il frame verificabile e comprensibile.

Prominenza — Quanto pesa un’entità nel TG

La prominenza quantifica la visibilità strutturale di un’entità nell’economia del telegiornale, andando oltre il semplice conteggio di menzioni. Tiene conto di dove l’entità è posizionata, con quale intensità emotiva è presentata e quale peso complessivo ha nella narrazione.

Punteggio di posizione

position_score

Da 0 a 100, riflette la posizione media delle menzioni nell’arco della trascrizione. 100 indica menzione prevalente in apertura, 0 in chiusura. Il principio è giornalistico: le notizie di apertura sono considerate più importanti dalla redazione.

Intensità lessicale

lexical_intensity

Misura la temperatura retorica del linguaggio usato nelle menzioni: alta sia se positivo che se negativo. “Travolto”, “esplosivo”, “devastante” indicano alta intensità; “partecipa”, “dichiara”, “osserva” indicano bassa intensità.

Punteggio di prominenza

prominence_score

Da 0 a 100, punteggio composito che sintetizza posizione, densità di menzioni e intensità lessicale. Non il più menzionato, ma il più visibile — il più enfatizzato, il più in primo piano.

Analisi delle assenze — Cosa il TG non dice

L’analisi del silenzio è il costrutto più innovativo e più delicato del FMSDM. Mentre tutti i blocchi precedenti analizzano ciò che il TG dice, questo blocco analizza ciò che il TG non dice. Il silenzio editoriale è un atto comunicativo: scegliere di non trattare un tema o di non menzionare un attore è una decisione con implicazioni significative.

Un’assenza non è una prova di omissione deliberata: è un’osservazione che acquista significato solo nel contesto e, soprattutto, nella ricorrenza nel tempo.

Entità assenti

missing_entities

Entità che il modello ritiene avrebbero dovuto essere menzionate dato il contesto dell’edizione, ma che non lo sono. Per ciascuna: ragione dell’aspettativa, benchmark di riferimento, implicazione ipotizzata.

I benchmark sono stime informate del modello, non dati storici calcolati. Con l’accumulo di dati saranno progressivamente sostituiti da benchmark empirici derivati dalle medie storiche reali.

Frame assenti

missing_frames

Frame narrativi che avrebbero potuto emergere ma che non sono stati adottati. Per ciascuno: frame atteso, frame effettivamente osservati e implicazione. L’assenza del frame “Italia-Debole” in un contesto di crisi, sostituita da “Italia-Mediatore”, suggerisce una scelta narrativa che evita la vulnerabilità. Vanno letti come ipotesi interpretative, non come evidenze.

Temi assenti

missing_topics

Categorie tematiche con copertura nulla o significativamente inferiore al benchmark atteso. La significatività emerge dalla ricorrenza nel tempo e dal confronto tra reti — non da una singola edizione.

Summary cards — Il profilo sintetico delle entità

Per le 5 entità più rilevanti di ciascuna edizione, il sistema produce una scheda sintetica che ricompone i dati più significativi in un formato compatto. Le summary cards non contengono dati nuovi: sono una ricomposizione presentazionale pensata per la consultazione rapida — punto di accesso ai dati completi, non sostituto.

Presenza

Menzioni totali, rapporto diretto/indiretto, tema primario, prominenza.

Profilo di valence

Categoria predominante, punteggio aggregato, tono dominante.

Frame principale

Nome, peso percentuale, tono medio.

Co-occorrenze

Entità associate con frequenza e valence dell'associazione.

Note strategiche

Osservazioni qualitative su aspetti notevoli o anomali.

Note sulla lettura dei dati

01

I punteggi sintetici sono indicatori, non misure esatte. La differenza tra un valence score di +0.62 e +0.58 è probabilmente nel margine di variabilità del modello.

02

I confronti tra reti richiedono normalizzazione. Un TG da 35 minuti e uno da 25 producono volumi di testo diversi: i conteggi assoluti vanno letti in rapporto alla durata.

03

Le evidenze sono sempre consultabili. Ogni classificazione — di tema, di valence, di frame — è accompagnata dai frammenti testuali che la sostengono.

04

Le assenze sono ipotesi, non accuse. L'analisi del silenzio identifica ciò che non viene detto, non il perché. L'interpretazione spetta al lettore.

Le grandezze del FMSDM.Cosa viene estratto — e cosa significa.