This doctoral dissertation explores the fusion of deep learning and state-of-the-art models, to advance the fields of audio forensics, audio intelligibility, and enhancement. In an era where audio recordings hold critical significance across multiple domains, the ability to authenticate and enhance them is paramount.Deep learning models, such as convolutional and recurrent neural networks, are harnessed to detect tampered audio recordings, enhancing the authentication process. Additionally, cutting-edge Transformers, renowned for their sequence-to-sequence capabilities, are employed to tackle the challenges of audio intelligibility and enhancement. These models can effectively denoise and clarify audio recordings, improving their overall quality. Practical tools and methodologies are developed to address real-world scenarios, accounting for noise, compression artifacts, and variations in recording devices. The research contributes significantly to the reliability of audio evidence, benefiting fields like law enforcement, legal proceedings, and digital media forensics. In summary, this doctoral research represents a substantial advancement in the realm of audio forensics, intelligibility, and enhancement. By combining deep learning state-of-the-art models, it offers comprehensive solutions to the authentication, clarity, and enhancement of audio recordings in the information-driven era.

Questa tesi di dottorato esplora la fusione di apprendimento profondo e modelli all'avanguardia per avanzare nei campi della forense audio, dell'intelligibilità audio e dell'ottimizzazione. In un'epoca in cui le registrazioni audio hanno una rilevanza critica in molteplici settori, la capacità di autenticarle e migliorarle è fondamentale. Modelli di apprendimento profondo, come le reti neurali convoluzionali e ricorrenti, vengono utilizzati per rilevare registrazioni audio manomesse, potenziando il processo di autenticazione. Inoltre, i rivoluzionari Transformers, noti per le loro capacità sequenziali, sono impiegati per affrontare le sfide legate all'intelligibilità e all'ottimizzazione audio. Questi modelli sono in grado di ridurre efficacemente il rumore e chiarire le registrazioni audio, migliorandone la qualità complessiva. Vengono sviluppati strumenti e metodologie pratici per affrontare scenari del mondo reale, tenendo conto di rumori, artefatti di compressione e variazioni nei dispositivi di registrazione. La ricerca contribuisce in modo significativo alla affidabilità delle prove audio, beneficiando settori come le forze dell'ordine, le procedure legali e la forense dei media digitali. In sintesi, questa ricerca dottorale rappresenta un notevole progresso nel campo della forense audio, dell'intelligibilità e dell'ottimizzazione. Unendo modelli di apprendimento profondo e all'avanguardia, offre soluzioni complete per l'autenticazione, la chiarezza e l'ottimizzazione delle registrazioni audio nell'era guidata dalle informazioni.

Analisi audio tramite apprendimento profondo per scopi forensi e investigativi / Puglisi, VALERIO FRANCESCO. - (2024 Feb 12).

Analisi audio tramite apprendimento profondo per scopi forensi e investigativi.

PUGLISI, VALERIO FRANCESCO
2024-02-12

Abstract

This doctoral dissertation explores the fusion of deep learning and state-of-the-art models, to advance the fields of audio forensics, audio intelligibility, and enhancement. In an era where audio recordings hold critical significance across multiple domains, the ability to authenticate and enhance them is paramount.Deep learning models, such as convolutional and recurrent neural networks, are harnessed to detect tampered audio recordings, enhancing the authentication process. Additionally, cutting-edge Transformers, renowned for their sequence-to-sequence capabilities, are employed to tackle the challenges of audio intelligibility and enhancement. These models can effectively denoise and clarify audio recordings, improving their overall quality. Practical tools and methodologies are developed to address real-world scenarios, accounting for noise, compression artifacts, and variations in recording devices. The research contributes significantly to the reliability of audio evidence, benefiting fields like law enforcement, legal proceedings, and digital media forensics. In summary, this doctoral research represents a substantial advancement in the realm of audio forensics, intelligibility, and enhancement. By combining deep learning state-of-the-art models, it offers comprehensive solutions to the authentication, clarity, and enhancement of audio recordings in the information-driven era.
12-feb-2024
Questa tesi di dottorato esplora la fusione di apprendimento profondo e modelli all'avanguardia per avanzare nei campi della forense audio, dell'intelligibilità audio e dell'ottimizzazione. In un'epoca in cui le registrazioni audio hanno una rilevanza critica in molteplici settori, la capacità di autenticarle e migliorarle è fondamentale. Modelli di apprendimento profondo, come le reti neurali convoluzionali e ricorrenti, vengono utilizzati per rilevare registrazioni audio manomesse, potenziando il processo di autenticazione. Inoltre, i rivoluzionari Transformers, noti per le loro capacità sequenziali, sono impiegati per affrontare le sfide legate all'intelligibilità e all'ottimizzazione audio. Questi modelli sono in grado di ridurre efficacemente il rumore e chiarire le registrazioni audio, migliorandone la qualità complessiva. Vengono sviluppati strumenti e metodologie pratici per affrontare scenari del mondo reale, tenendo conto di rumori, artefatti di compressione e variazioni nei dispositivi di registrazione. La ricerca contribuisce in modo significativo alla affidabilità delle prove audio, beneficiando settori come le forze dell'ordine, le procedure legali e la forense dei media digitali. In sintesi, questa ricerca dottorale rappresenta un notevole progresso nel campo della forense audio, dell'intelligibilità e dell'ottimizzazione. Unendo modelli di apprendimento profondo e all'avanguardia, offre soluzioni complete per l'autenticazione, la chiarezza e l'ottimizzazione delle registrazioni audio nell'era guidata dalle informazioni.
Artificial Intelligence; Deep Learning; Audio Analysis; Speech Enhancement; Automatic Speech Recognition
Intelligenza Artificiale; Apprendimento Profondo; Analisi Audio; Miglioramento del parlato; Trascrizione Automatica; Localizzazione di sorgenti sonore
Analisi audio tramite apprendimento profondo per scopi forensi e investigativi / Puglisi, VALERIO FRANCESCO. - (2024 Feb 12).
File in questo prodotto:
File Dimensione Formato  
PhD_Thesis_Valerio_Francesco_Puglisi.pdf

accesso aperto

Tipologia: Tesi di dottorato
Licenza: PUBBLICO - Pubblico con Copyright
Dimensione 18.33 MB
Formato Adobe PDF
18.33 MB Adobe PDF Visualizza/Apri

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.11769/598191
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact