This dissertation examines the role of corporate communication in sustainability, focusing on alignment with the Sustainable Development Goals (SDGs) and the detection of greenwashing, using methodologies from Digital Humanities. In an era where transparency in sustainability reporting is increasingly scrutinized, this research sought to develop tools for analyzing a corpus of Italian companies’ sustainability reports, published in PDF format. By leveraging advanced Natural Language Processing (NLP) and Artificial Intelligence (AI) tools, the study offers innovative solutions to automate information extraction from natural language texts into easily computable formats, facilitating the monitoring of corporate impact in alignment with global sustainability goals. The research centers around two key questions: (1) What tools or approaches can effectively extract relevant data from sustainability reports? and (2) How can greenwashing be described and analyzed to facilitate its detection? To address them, the study integrates AI models, such as OpenAI’s GPT, for information extraction, highlighting both the potential and the limitations of automated data extraction. Despite challenges posed by document variability, results demonstrate high accuracy in extracting greenhouse gas (GHG) emissions data, paving the way for broader applications. Additionally, the proposed use of interactive dashboards illustrates the practical potential of data monitoring and analysis within corporate environments. A core component of the research examines greenwashing through a linguistic-pragmatic framework, particularly focusing on vague language that can obscure a company’s true environmental impact. This approach identifies patterns in the use of vague language, distinguishing between misleading and neutral communicative strategies. The proposed framework not only contributes to a deeper understanding of corporate greenwashing but also provides a methodological basis for future computational applications aimed at detecting such practices. Additionally, a case study compares extracted data with external sources, revealing potential discrepancies and highlighting other forms of greenwashing. The implications of this study are wide-ranging, offering practical tools for companies to enhance the transparency of their sustainability communications and for researchers seeking to explore greenwashing more systematically. While the study opens promising avenues, future work should expand the corpus of analyzed reports, refine data extraction techniques, and explore new methodologies, such as ontologies, knowledge graphs and sustainability-specific sentiment analysis. Ultimately, this research contributes to both academic and corporate efforts to promote sustainable development and improve accountability in corporate sustainability reporting.

Questa tesi analizza il ruolo della comunicazione aziendale nella sostenibilità, con particolare attenzione all’allineamento con i Sustainable Development Goals (SDGs) e all'identificazione del greenwashing, adottando metodologie delle Digital Humanities. In un contesto in cui la trasparenza nella rendicontazione di sostenibilità è sottoposta a crescente attenzione, questa ricerca ha sviluppato strumenti per analizzare un corpus di report di sostenibilità di aziende italiane, pubblicati in formato PDF. Utilizzando tecnologie avanzate di Natural Language Processing (NLP) e Intelligenza Artificiale (IA), il lavoro propone soluzioni innovative per automatizzare l’estrazione di informazioni da testi in linguaggio naturale e convertirle in formati computabili, agevolando il monitoraggio dell’impatto aziendale in relazione agli obiettivi globali di sostenibilità. La ricerca si articola attorno a due domande principali: (1) Quali strumenti o approcci possono essere utilizzati per estrarre i dati di sostenibilità dai report? e (2) Come possiamo descrivere ed analizzare il fenomeno del greenwashing in modo tale da facilitarne l’identificazione? Per rispondere a tali interrogativi, sono stati integrati modelli di IA, come GPT di OpenAI, per l’estrazione delle informazioni, evidenziando sia il potenziale sia i limiti dell’automazione in questo ambito. Nonostante le difficoltà legate alla variabilità dei documenti, i risultati mostrano un’elevata accuratezza nell’estrazione dei dati relativi alle emissioni di gas serra (GHG), aprendo la strada a ulteriori applicazioni. Inoltre, l’uso di dashboard interattive dimostra il potenziale pratico di monitoraggio e analisi dei dati in contesti aziendali. Un elemento centrale della ricerca riguarda lo studio del greenwashing attraverso una prospettiva linguistico-pragmatica, con particolare attenzione all’uso di un linguaggio vago che può celare il vero impatto ambientale di un'azienda. Questo approccio consente di identificare schemi linguistici che distinguono tra strategie comunicative fuorvianti e neutre. Il framework proposto offre non solo una comprensione più approfondita del fenomeno, ma anche una base per applicazioni computazionali future mirate a individuarlo. Inoltre, un caso studio ha confrontato i dati estratti con fonti esterne, evidenziando discrepanze potenziali e altre forme di greenwashing. Le implicazioni di questo lavoro sono molteplici, offrendo strumenti concreti per migliorare la trasparenza della comunicazione aziendale e per ampliare le prospettive di ricerca sul greenwashing. Il lavoro suggerisce l’espansione del corpus analizzato, il perfezionamento delle tecniche di estrazione e l’esplorazione di nuove metodologie, quali ontologie, knowledge graphs e sentiment analysis applicata alla sostenibilità. In definitiva, questa ricerca contribuisce sia agli studi accademici sia agli sforzi aziendali per promuovere lo sviluppo sostenibile e migliorare la rendicontazione in materia di sostenibilità.

Sostenibilità e greenwashing: verso l'analisi automatizzata dei report di sostenibilità aziendali / Cutuli, Erica. - (2025 Mar 21).

Sostenibilità e greenwashing: verso l'analisi automatizzata dei report di sostenibilità aziendali

CUTULI, ERICA
2025-03-21

Abstract

This dissertation examines the role of corporate communication in sustainability, focusing on alignment with the Sustainable Development Goals (SDGs) and the detection of greenwashing, using methodologies from Digital Humanities. In an era where transparency in sustainability reporting is increasingly scrutinized, this research sought to develop tools for analyzing a corpus of Italian companies’ sustainability reports, published in PDF format. By leveraging advanced Natural Language Processing (NLP) and Artificial Intelligence (AI) tools, the study offers innovative solutions to automate information extraction from natural language texts into easily computable formats, facilitating the monitoring of corporate impact in alignment with global sustainability goals. The research centers around two key questions: (1) What tools or approaches can effectively extract relevant data from sustainability reports? and (2) How can greenwashing be described and analyzed to facilitate its detection? To address them, the study integrates AI models, such as OpenAI’s GPT, for information extraction, highlighting both the potential and the limitations of automated data extraction. Despite challenges posed by document variability, results demonstrate high accuracy in extracting greenhouse gas (GHG) emissions data, paving the way for broader applications. Additionally, the proposed use of interactive dashboards illustrates the practical potential of data monitoring and analysis within corporate environments. A core component of the research examines greenwashing through a linguistic-pragmatic framework, particularly focusing on vague language that can obscure a company’s true environmental impact. This approach identifies patterns in the use of vague language, distinguishing between misleading and neutral communicative strategies. The proposed framework not only contributes to a deeper understanding of corporate greenwashing but also provides a methodological basis for future computational applications aimed at detecting such practices. Additionally, a case study compares extracted data with external sources, revealing potential discrepancies and highlighting other forms of greenwashing. The implications of this study are wide-ranging, offering practical tools for companies to enhance the transparency of their sustainability communications and for researchers seeking to explore greenwashing more systematically. While the study opens promising avenues, future work should expand the corpus of analyzed reports, refine data extraction techniques, and explore new methodologies, such as ontologies, knowledge graphs and sustainability-specific sentiment analysis. Ultimately, this research contributes to both academic and corporate efforts to promote sustainable development and improve accountability in corporate sustainability reporting.
21-mar-2025
Questa tesi analizza il ruolo della comunicazione aziendale nella sostenibilità, con particolare attenzione all’allineamento con i Sustainable Development Goals (SDGs) e all'identificazione del greenwashing, adottando metodologie delle Digital Humanities. In un contesto in cui la trasparenza nella rendicontazione di sostenibilità è sottoposta a crescente attenzione, questa ricerca ha sviluppato strumenti per analizzare un corpus di report di sostenibilità di aziende italiane, pubblicati in formato PDF. Utilizzando tecnologie avanzate di Natural Language Processing (NLP) e Intelligenza Artificiale (IA), il lavoro propone soluzioni innovative per automatizzare l’estrazione di informazioni da testi in linguaggio naturale e convertirle in formati computabili, agevolando il monitoraggio dell’impatto aziendale in relazione agli obiettivi globali di sostenibilità. La ricerca si articola attorno a due domande principali: (1) Quali strumenti o approcci possono essere utilizzati per estrarre i dati di sostenibilità dai report? e (2) Come possiamo descrivere ed analizzare il fenomeno del greenwashing in modo tale da facilitarne l’identificazione? Per rispondere a tali interrogativi, sono stati integrati modelli di IA, come GPT di OpenAI, per l’estrazione delle informazioni, evidenziando sia il potenziale sia i limiti dell’automazione in questo ambito. Nonostante le difficoltà legate alla variabilità dei documenti, i risultati mostrano un’elevata accuratezza nell’estrazione dei dati relativi alle emissioni di gas serra (GHG), aprendo la strada a ulteriori applicazioni. Inoltre, l’uso di dashboard interattive dimostra il potenziale pratico di monitoraggio e analisi dei dati in contesti aziendali. Un elemento centrale della ricerca riguarda lo studio del greenwashing attraverso una prospettiva linguistico-pragmatica, con particolare attenzione all’uso di un linguaggio vago che può celare il vero impatto ambientale di un'azienda. Questo approccio consente di identificare schemi linguistici che distinguono tra strategie comunicative fuorvianti e neutre. Il framework proposto offre non solo una comprensione più approfondita del fenomeno, ma anche una base per applicazioni computazionali future mirate a individuarlo. Inoltre, un caso studio ha confrontato i dati estratti con fonti esterne, evidenziando discrepanze potenziali e altre forme di greenwashing. Le implicazioni di questo lavoro sono molteplici, offrendo strumenti concreti per migliorare la trasparenza della comunicazione aziendale e per ampliare le prospettive di ricerca sul greenwashing. Il lavoro suggerisce l’espansione del corpus analizzato, il perfezionamento delle tecniche di estrazione e l’esplorazione di nuove metodologie, quali ontologie, knowledge graphs e sentiment analysis applicata alla sostenibilità. In definitiva, questa ricerca contribuisce sia agli studi accademici sia agli sforzi aziendali per promuovere lo sviluppo sostenibile e migliorare la rendicontazione in materia di sostenibilità.
Sustainability; Artificial Intelligence; Greenwashing; Natural Language Processing; Vagueness
Sostenibilità; Intelligenza Artificiale; Greenwashing; Natural Language Processing; Vaghezza
Sostenibilità e greenwashing: verso l'analisi automatizzata dei report di sostenibilità aziendali / Cutuli, Erica. - (2025 Mar 21).
File in questo prodotto:
File Dimensione Formato  
Cutuli Erica - Tesi di dottorato - Sostenibilità e greenwashing.pdf

accesso aperto

Tipologia: Tesi di dottorato
Licenza: PUBBLICO - Pubblico con Copyright
Dimensione 4.24 MB
Formato Adobe PDF
4.24 MB Adobe PDF Visualizza/Apri

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.11769/690691
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact