This dissertation collects all the research work done by the PhD candidate at the Catania site of STMicroelectronics. The research has been aimed at solving some practical issues coming from the production line in the STMicroelectronics factory. The problem to be attacked is about the classification of Electrical Wafer Sorting (EWS) images. This kind of images are generated daily during the wafer testing phase of semiconductor device fabrication. Classification of these images is relevant to signal defective wafers to be stopped from further processing in the production line. Yield detractors are identified by specific and characteristic anomalies signatures in the images. Unfortunately, new anomalies signatures may appear among the huge amount of EWS maps generated per day. This makes unfeasible, in a real case scenario, to adopt a stable reference set of possible signatures. It is important for the factory to quickly identify and correct the triggering causes of the defect to maintain a high yield rate from the production flow. A correct and quick classification of the images provide clues to the possible cause of the defects and is hence a valuable tool for an efficient production. One may hope in a fixed association between class of defects recognized in the images and problems with the factory processes. The images produced daily in the production line have hence to be fast labeled into categories that would help the system manager to identify the technical problem in the production. Unfortunately it is not possible to resort to a predefined and fixed set of label for the observed defects in the images. New kinds of defects may rise daily in an unpredictable way and in this case new labels have to be produced. The nature of the problem hence asks for a semi supervised classification approach. The solution demonstrated in this Thesis works in successive phases. At first, an unsupervised learning algorithm creates an initial set of clusters from the available images collected off-line. Then, a supervised algorithm classifies the images as they are daily produced into one of the previously created clusters if there is a suitable one. If none of the existing cluster is suitable for the new image a new cluster is added to the collection. This brings out a new issue: the amount of images belonging to newly created classes is, at first, negligible. To alleviate this unbalanced situation one needs to quickly fill these new classes with synthesized images. To make further classification more robust we propose an algorithm that exploits the shape of the silicon wafer to quickly synthesize new instances of most of the kind of defects that could be encountered. These new synthetic images are hence added to the training set. During the research it become natural to look for methods to detect causal relations between negative production events (alarms) and low yield. A basket analysis approach has been adopted in search for rare association rules mining. To this aim proper customization of the state of the art algorithms has been developed. On the side of the main research done during the Ph.D. Training period the candidate has been involved in quite different topics. More precisely interesting results have been obtained in the field of design and tools for digital gaming. These results are collected in the Appendix of the Thesis.

Questa dissertazione raccoglie tutto il lavoro di ricerca svolto dal dottorando presso la sede di Catania della STMicroelectronics. La ricerca è stata finalizzata a risolvere alcune problematiche pratiche provenienti dalla linea di produzione nello stabilimento STMicroelectronics. Il problema da affrontare riguarda la classificazione delle immagini EWS (Electrical Wafer Sorting). Questo tipo di immagini viene generato quotidianamente durante la fase di test dei wafer appartenente alla linea di produzione di semiconduttori. La classificazione di queste immagini è importante per segnalare che i wafer difettosi non devono subire ulteriori lavorazioni nella linea di produzione. I detrattori della resa sono identificati da pattern specifici e caratteristici nelle immagini. Sfortunatamente, nuovi pattern potrebbero apparire tra l'enorme quantità di mappe EWS generate ogni giorno. Ciò rende impossibile, in uno scenario reale, adottare un set di riferimento stabile di possibili pattern. È importante che la fabbrica identifichi e corregga rapidamente le cause scatenanti del difetto per mantenere un alto tasso di rendimento dal flusso di produzione. Una corretta e rapida classificazione delle immagini fornisce indizi sulla possibile causa dei difetti ed è quindi uno strumento prezioso per una produzione efficiente. Si può sperare in un'associazione fissa tra classi di difetti riconosciuti nelle immagini e problemi con i processi di fabbrica. Le immagini prodotte quotidianamente nella linea di produzione devono quindi essere rapidamente etichettate in categorie che aiuterebbero il responsabile del sistema a identificare il problema tecnico nella produzione. Purtroppo non è possibile ricorrere a un set di etichette predefinito e fisso per i difetti osservati nelle immagini. Nuovi tipi di difetti possono sorgere quotidianamente in modo imprevedibile e in questo caso devono essere prodotte nuove etichette. La natura del problema richiede quindi un approccio di classificazione semi supervisionato. La soluzione dimostrata in questa Tesi funziona in fasi successive. In un primo momento, un algoritmo di apprendimento non supervisionato crea una serie iniziale di cluster dalle immagini disponibili raccolte off-line. Quindi, un algoritmo supervisionato classifica le immagini che vengono prodotte quotidianamente in uno dei cluster creati in precedenza se ce n'è uno adatto. Se nessuno dei cluster esistenti è adatto per la nuova immagine, viene aggiunto un nuovo cluster alla raccolta. Questo fa emergere un nuovo problema: la quantità di immagini appartenenti alle classi appena create è, all'inizio, trascurabile. Per alleviare questa situazione di squilibrio è necessario riempire rapidamente queste nuove classi con immagini sintetizzate. Per rendere più robusta l'ulteriore classificazione proponiamo un algoritmo che sfrutta la forma del wafer di silicio per sintetizzare rapidamente nuove istanze della maggior parte dei tipi di difetti che potrebbero essere riscontrati. Queste nuove immagini sintetiche vengono quindi aggiunte al set di addestramento. Durante la ricerca è diventato naturale cercare metodi per rilevare le relazioni causali tra eventi negativi di produzione (allarmi) e bassa resa. È stato adottato un approccio denominato basket analysis in grado di ricercare regole di associazione rare. A tal fine è stata sviluppata una adeguata personalizzazione di algoritmi già noti. A fianco delle principali ricerche svolte durante il dottorato, Durante il periodo di formazione il candidato è stato coinvolto in argomenti molto diversi. Risultati interessanti sono stati ottenuti nel campo del design e degli strumenti per i giochi digitali. Questi risultati sono raccolti nell'Appendice della Tesi.

Analisi dei Big Data per il rilevamento dei guasti nella produzione dei microprocessori / Viagrande, LUIGI CLAUDIO. - (2021 Feb 02).

Analisi dei Big Data per il rilevamento dei guasti nella produzione dei microprocessori

VIAGRANDE, LUIGI CLAUDIO
2021-02-02

Abstract

This dissertation collects all the research work done by the PhD candidate at the Catania site of STMicroelectronics. The research has been aimed at solving some practical issues coming from the production line in the STMicroelectronics factory. The problem to be attacked is about the classification of Electrical Wafer Sorting (EWS) images. This kind of images are generated daily during the wafer testing phase of semiconductor device fabrication. Classification of these images is relevant to signal defective wafers to be stopped from further processing in the production line. Yield detractors are identified by specific and characteristic anomalies signatures in the images. Unfortunately, new anomalies signatures may appear among the huge amount of EWS maps generated per day. This makes unfeasible, in a real case scenario, to adopt a stable reference set of possible signatures. It is important for the factory to quickly identify and correct the triggering causes of the defect to maintain a high yield rate from the production flow. A correct and quick classification of the images provide clues to the possible cause of the defects and is hence a valuable tool for an efficient production. One may hope in a fixed association between class of defects recognized in the images and problems with the factory processes. The images produced daily in the production line have hence to be fast labeled into categories that would help the system manager to identify the technical problem in the production. Unfortunately it is not possible to resort to a predefined and fixed set of label for the observed defects in the images. New kinds of defects may rise daily in an unpredictable way and in this case new labels have to be produced. The nature of the problem hence asks for a semi supervised classification approach. The solution demonstrated in this Thesis works in successive phases. At first, an unsupervised learning algorithm creates an initial set of clusters from the available images collected off-line. Then, a supervised algorithm classifies the images as they are daily produced into one of the previously created clusters if there is a suitable one. If none of the existing cluster is suitable for the new image a new cluster is added to the collection. This brings out a new issue: the amount of images belonging to newly created classes is, at first, negligible. To alleviate this unbalanced situation one needs to quickly fill these new classes with synthesized images. To make further classification more robust we propose an algorithm that exploits the shape of the silicon wafer to quickly synthesize new instances of most of the kind of defects that could be encountered. These new synthetic images are hence added to the training set. During the research it become natural to look for methods to detect causal relations between negative production events (alarms) and low yield. A basket analysis approach has been adopted in search for rare association rules mining. To this aim proper customization of the state of the art algorithms has been developed. On the side of the main research done during the Ph.D. Training period the candidate has been involved in quite different topics. More precisely interesting results have been obtained in the field of design and tools for digital gaming. These results are collected in the Appendix of the Thesis.
2-feb-2021
Questa dissertazione raccoglie tutto il lavoro di ricerca svolto dal dottorando presso la sede di Catania della STMicroelectronics. La ricerca è stata finalizzata a risolvere alcune problematiche pratiche provenienti dalla linea di produzione nello stabilimento STMicroelectronics. Il problema da affrontare riguarda la classificazione delle immagini EWS (Electrical Wafer Sorting). Questo tipo di immagini viene generato quotidianamente durante la fase di test dei wafer appartenente alla linea di produzione di semiconduttori. La classificazione di queste immagini è importante per segnalare che i wafer difettosi non devono subire ulteriori lavorazioni nella linea di produzione. I detrattori della resa sono identificati da pattern specifici e caratteristici nelle immagini. Sfortunatamente, nuovi pattern potrebbero apparire tra l'enorme quantità di mappe EWS generate ogni giorno. Ciò rende impossibile, in uno scenario reale, adottare un set di riferimento stabile di possibili pattern. È importante che la fabbrica identifichi e corregga rapidamente le cause scatenanti del difetto per mantenere un alto tasso di rendimento dal flusso di produzione. Una corretta e rapida classificazione delle immagini fornisce indizi sulla possibile causa dei difetti ed è quindi uno strumento prezioso per una produzione efficiente. Si può sperare in un'associazione fissa tra classi di difetti riconosciuti nelle immagini e problemi con i processi di fabbrica. Le immagini prodotte quotidianamente nella linea di produzione devono quindi essere rapidamente etichettate in categorie che aiuterebbero il responsabile del sistema a identificare il problema tecnico nella produzione. Purtroppo non è possibile ricorrere a un set di etichette predefinito e fisso per i difetti osservati nelle immagini. Nuovi tipi di difetti possono sorgere quotidianamente in modo imprevedibile e in questo caso devono essere prodotte nuove etichette. La natura del problema richiede quindi un approccio di classificazione semi supervisionato. La soluzione dimostrata in questa Tesi funziona in fasi successive. In un primo momento, un algoritmo di apprendimento non supervisionato crea una serie iniziale di cluster dalle immagini disponibili raccolte off-line. Quindi, un algoritmo supervisionato classifica le immagini che vengono prodotte quotidianamente in uno dei cluster creati in precedenza se ce n'è uno adatto. Se nessuno dei cluster esistenti è adatto per la nuova immagine, viene aggiunto un nuovo cluster alla raccolta. Questo fa emergere un nuovo problema: la quantità di immagini appartenenti alle classi appena create è, all'inizio, trascurabile. Per alleviare questa situazione di squilibrio è necessario riempire rapidamente queste nuove classi con immagini sintetizzate. Per rendere più robusta l'ulteriore classificazione proponiamo un algoritmo che sfrutta la forma del wafer di silicio per sintetizzare rapidamente nuove istanze della maggior parte dei tipi di difetti che potrebbero essere riscontrati. Queste nuove immagini sintetiche vengono quindi aggiunte al set di addestramento. Durante la ricerca è diventato naturale cercare metodi per rilevare le relazioni causali tra eventi negativi di produzione (allarmi) e bassa resa. È stato adottato un approccio denominato basket analysis in grado di ricercare regole di associazione rare. A tal fine è stata sviluppata una adeguata personalizzazione di algoritmi già noti. A fianco delle principali ricerche svolte durante il dottorato, Durante il periodo di formazione il candidato è stato coinvolto in argomenti molto diversi. Risultati interessanti sono stati ottenuti nel campo del design e degli strumenti per i giochi digitali. Questi risultati sono raccolti nell'Appendice della Tesi.
Big Data, Machine Learning, Association Rules, Microprocessors
Big Data, Machine Learning, Regole di associazione, Microprocessori
Analisi dei Big Data per il rilevamento dei guasti nella produzione dei microprocessori / Viagrande, LUIGI CLAUDIO. - (2021 Feb 02).
File in questo prodotto:
File Dimensione Formato  
Tesi di dottorato - VIAGRANDE LUIGI CLAUDIO 20210124151918.pdf

accesso aperto

Tipologia: Tesi di dottorato
Licenza: PUBBLICO - Pubblico con Copyright
Dimensione 2.75 MB
Formato Adobe PDF
2.75 MB Adobe PDF Visualizza/Apri

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.11769/581602
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact