Deep learning's ability to handle complex and variable data offers advantages over traditional methods in addressing real-world challenges. The core motivation lies in Deep Learning's potential to significantly improve human life, industrial processes, and overall efficiency by tackling these challenges. The research establishes a foundation in machine learning, deep learning, and computer vision, providing context for subsequent exploration of Deep Learning applications. Case studies examine human imagery applications including facial image compression, leveraging Deep Learning to achieve high compression ratios while maintaining recognition accuracy. Additionally, the work explores Deep Learning tools for estimating COVID-19 infection percentages from medical images, aiming to improve healthcare efficiency. In the industrial sector, the research analyses Deep Learning applications in solar cell defect classification and natural gas leak detection. Traditional inspection methods were found to be labor-intensive and error-prone. The work explores Deep Learning models using convolutional neural networks for defect classification and recurrent neural networks for leak detection, demonstrating significant improvements in efficiency, accuracy, and cost-effectiveness compared to traditional methods. Beyond deep learning, the work investigates real-world applications of blind video deblurring for challenging scenarios like long exposures and limited resources. It analyses state-of-the-art methods based on optimization and image priors, offering a quantitative and qualitative evaluation of these techniques. Finally, the research addresses challenges in optimizing training efficiency for deep learning models, focusing on the impact of hyperparameters. A novel learning rate scheduler is introduced that dynamically adjusts the learning rate based on gradients, reducing manual tuning and enhancing training efficiency. By investigating these applications, enhancements, and efficiency considerations, this work demonstrates deep learning's potential to significantly improve various real-world domains.
La capacità del deep learning di gestire dati complessi e variabili offre vantaggi rispetto ai metodi tradizionali nell'affrontare le sfide del mondo reale. La motivazione principale risiede nel potenziale del deep learning di migliorare significativamente la vita umana, i processi industriali e l'efficienza complessiva, affrontando queste sfide. La tesi espone le basi di machine learning, deep learning e computer vision fornendo il contesto per l'esplorazione successiva delle applicazioni del deep learning. I casi studio analizzano applicazioni legate alle immagini umane tra cui la compressione di immagini facciali, sfruttando il deep learning per ottenere alti rapporti di compressione mantenendo l'accuratezza nel riconoscimento. Inoltre, il lavoro di tesi esplora strumenti di deep learning per stimare le percentuali di infezione da COVID-19 partendo da immagini mediche, con l'obiettivo di migliorare l'efficienza nel settore sanitario. Nel settore industriale, la ricerca analizza le applicazioni del deep learning nella classificazione dei difetti delle celle solari e nel rilevamento di perdite di gas naturale. I metodi tradizionali di ispezione sono risultati laboriosi e soggetti a errori. Lo studio esplora modelli di deep learning che utilizzano reti neurali convoluzionali per la classificazione dei difetti e reti neurali ricorrenti per il rilevamento delle perdite, dimostrando miglioramenti significativi in termini di efficienza, accuratezza e costi rispetto ai metodi tradizionali. Oltre al deep learning, il lavoro di ricerca esamina applicazioni pratiche come il deblurring (rimozione della sfocatura) nei video in condizioni difficili quali esposizioni prolungate e risorse limitate. Vengono analizzati i metodi all'avanguardia basati sull'ottimizzazione e su priors delle immagini, offrendo una valutazione quantitativa e qualitativa di queste tecniche. Infine, la ricerca affronta le sfide legate all'ottimizzazione dell'efficienza del training per i modelli di deep learning concentrandosi sull'impatto degli iperparametri. Viene introdotto un nuovo scheduler del learning rate che regola dinamicamente quest'ultimo in base al gradiente riducendo la necessità di regolazioni manuali e migliorando l'efficienza del training. Analizzando queste applicazioni, i miglioramenti e le considerazioni sull'efficienza, questo lavoro di ricerca dimostra il potenziale del deep learning nel migliorare in modo significativo diversi ambiti reali.
Advanced Applications of Deep Learning in Challenging Real-World Scenarios [Applicazioni avanzate di Deep Learning in contesti reali sfidanti] / Napoli Spatafora, Maria Ausilia. - (2025 Feb 10).
Advanced Applications of Deep Learning in Challenging Real-World Scenarios [Applicazioni avanzate di Deep Learning in contesti reali sfidanti]
NAPOLI SPATAFORA, Maria Ausilia
2025-02-10
Abstract
Deep learning's ability to handle complex and variable data offers advantages over traditional methods in addressing real-world challenges. The core motivation lies in Deep Learning's potential to significantly improve human life, industrial processes, and overall efficiency by tackling these challenges. The research establishes a foundation in machine learning, deep learning, and computer vision, providing context for subsequent exploration of Deep Learning applications. Case studies examine human imagery applications including facial image compression, leveraging Deep Learning to achieve high compression ratios while maintaining recognition accuracy. Additionally, the work explores Deep Learning tools for estimating COVID-19 infection percentages from medical images, aiming to improve healthcare efficiency. In the industrial sector, the research analyses Deep Learning applications in solar cell defect classification and natural gas leak detection. Traditional inspection methods were found to be labor-intensive and error-prone. The work explores Deep Learning models using convolutional neural networks for defect classification and recurrent neural networks for leak detection, demonstrating significant improvements in efficiency, accuracy, and cost-effectiveness compared to traditional methods. Beyond deep learning, the work investigates real-world applications of blind video deblurring for challenging scenarios like long exposures and limited resources. It analyses state-of-the-art methods based on optimization and image priors, offering a quantitative and qualitative evaluation of these techniques. Finally, the research addresses challenges in optimizing training efficiency for deep learning models, focusing on the impact of hyperparameters. A novel learning rate scheduler is introduced that dynamically adjusts the learning rate based on gradients, reducing manual tuning and enhancing training efficiency. By investigating these applications, enhancements, and efficiency considerations, this work demonstrates deep learning's potential to significantly improve various real-world domains.File | Dimensione | Formato | |
---|---|---|---|
tesi-NapoliSpatafora.pdf
accesso aperto
Tipologia:
Tesi di dottorato
Licenza:
PUBBLICO - Pubblico con Copyright
Dimensione
27.21 MB
Formato
Adobe PDF
|
27.21 MB | Adobe PDF | Visualizza/Apri |
I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.