The visual ability of humans and other animals is the result of the complex interaction of light, eyes and brain. We are unaware of how extremely complex is the shape analysis performed by the brain, since it is mainly done subconsciously, with no need to involve the higher level of cognition. Hence, although to see and understand seems natural and straightforward, the design of versatile and robust computer vision system is a tough task. In computer era, the attempt to imitate the human ability to understand shapes led to the fields of computer vision and pattern recognition, having been motivated by a wide spectrum of important applications such as in robotics, biology, security and so on. In computer vision, accordingly to the great variety of applications, there is a wide range of possible computer s eyes , which can be very different from a human eye (e.g. tomography devices, ultrasonic range sensors). Among all different aspect underlying visual information, the shape of objects plays a very important role, which will be emphasized in this dissertation showing how such a fundamental feature can be efficiently used to solve a wide range of relevant problems in Computer Vision, Pattern Recognition and Computer Graphics, in both the 2-D and 3-D realms. In almost all cases the input data is a set of one or more images, demonstrating that they convey enough information about the shape, if a proper setup is used. The input devices we use range from DSLR cameras to MRI devices, with great differences in the imaging techniques and in the quality of produced images. Starting from the input images, we show how to accurately model the surface of the depicted objects using polarization cues or how to parameterize shapes using state of the art descriptors, based on statistical properties of the object classes or simply on the individual objects surface or silhouette.

L'abilità di vedere degli umani e degli animali è il risultato di una complessa interazione della luce con gli occhi ed il cervello. Non siamo coscienti di quanto estremamente complessa sia l'analisi delle forme degli oggetti che viene svolta dal nostro cervello, poiché questa viene prevalentemente svolta a livello subconscio, senza la necessità di richiedere l'intervento di più elevato livelli cognitivi. Pertanto, sebbene "vedere e comprendere" sembri semplice e naturale, la realizzazione di un sistema di Computer Vision versatile e robusto è un compito difficile. Nell'era dei computer, il tentativo di imitare l'abilità umana di comprendere le forme ha portato alla nascita dei campi della Computer Vision e Pattern Recognition, motivato da importanti applicazioni in diversi campi. Coerentemente con la grande varietà di applicazioni, esiste un ampio spettro di possibili "occhi" che permettono ad un computer di "vedere", molto diversi dall'occhio umano (apparecchiature per tomografia, sensori ultrasonici, ecc.). Il ruolo predominante della forma degli oggetti, rispetto alle altre caratteristiche visuali, verrà enfatizzato nel corso di questa dissertazione, mostrando come tale caratteristica può essere utilizzata per risolvere una vasta gamma di problemi aperti nei campi della Computer Vision, Pattern Recognition e Computer Graphics. In quasi tutti i casi analizzati i dati in input sono costituiti da immagini bidimensionali, dimostrando che queste ultime contengo una quantità sufficiente di informazioni sulla forma degli oggetti raffigurati. I dispositivi tramite i quali le immagini sono state acquisite spaziano dalle Digital Still Cameras sino ai dispositivi per Risonanza Magnetica, con notevoli differenze quindi sia nelle tecnologie che nella qualità delle immagini prodotte. A partire da tali dati di input, nel corso di questa dissertazione verrà mostrato come modellare accuratamente la superficie 3D di un oggetto a partire da una analisi della polarizzazione della luce riflessa o come parametrizzare le forme usando dei descrittori di forma allo stato dell'arte, basati su proprietà statistiche delle classi di oggetti o semplicemente sulle singole superfici 3D o contorni degli oggetti.

Shape Modeling and Description from 2D Images / Guarnera, Giuseppe. - (2012 Dec 10).

Shape Modeling and Description from 2D Images

GUARNERA, GIUSEPPE
2012-12-10

Abstract

The visual ability of humans and other animals is the result of the complex interaction of light, eyes and brain. We are unaware of how extremely complex is the shape analysis performed by the brain, since it is mainly done subconsciously, with no need to involve the higher level of cognition. Hence, although to see and understand seems natural and straightforward, the design of versatile and robust computer vision system is a tough task. In computer era, the attempt to imitate the human ability to understand shapes led to the fields of computer vision and pattern recognition, having been motivated by a wide spectrum of important applications such as in robotics, biology, security and so on. In computer vision, accordingly to the great variety of applications, there is a wide range of possible computer s eyes , which can be very different from a human eye (e.g. tomography devices, ultrasonic range sensors). Among all different aspect underlying visual information, the shape of objects plays a very important role, which will be emphasized in this dissertation showing how such a fundamental feature can be efficiently used to solve a wide range of relevant problems in Computer Vision, Pattern Recognition and Computer Graphics, in both the 2-D and 3-D realms. In almost all cases the input data is a set of one or more images, demonstrating that they convey enough information about the shape, if a proper setup is used. The input devices we use range from DSLR cameras to MRI devices, with great differences in the imaging techniques and in the quality of produced images. Starting from the input images, we show how to accurately model the surface of the depicted objects using polarization cues or how to parameterize shapes using state of the art descriptors, based on statistical properties of the object classes or simply on the individual objects surface or silhouette.
10-dic-2012
L'abilità di vedere degli umani e degli animali è il risultato di una complessa interazione della luce con gli occhi ed il cervello. Non siamo coscienti di quanto estremamente complessa sia l'analisi delle forme degli oggetti che viene svolta dal nostro cervello, poiché questa viene prevalentemente svolta a livello subconscio, senza la necessità di richiedere l'intervento di più elevato livelli cognitivi. Pertanto, sebbene "vedere e comprendere" sembri semplice e naturale, la realizzazione di un sistema di Computer Vision versatile e robusto è un compito difficile. Nell'era dei computer, il tentativo di imitare l'abilità umana di comprendere le forme ha portato alla nascita dei campi della Computer Vision e Pattern Recognition, motivato da importanti applicazioni in diversi campi. Coerentemente con la grande varietà di applicazioni, esiste un ampio spettro di possibili "occhi" che permettono ad un computer di "vedere", molto diversi dall'occhio umano (apparecchiature per tomografia, sensori ultrasonici, ecc.). Il ruolo predominante della forma degli oggetti, rispetto alle altre caratteristiche visuali, verrà enfatizzato nel corso di questa dissertazione, mostrando come tale caratteristica può essere utilizzata per risolvere una vasta gamma di problemi aperti nei campi della Computer Vision, Pattern Recognition e Computer Graphics. In quasi tutti i casi analizzati i dati in input sono costituiti da immagini bidimensionali, dimostrando che queste ultime contengo una quantità sufficiente di informazioni sulla forma degli oggetti raffigurati. I dispositivi tramite i quali le immagini sono state acquisite spaziano dalle Digital Still Cameras sino ai dispositivi per Risonanza Magnetica, con notevoli differenze quindi sia nelle tecnologie che nella qualità delle immagini prodotte. A partire da tali dati di input, nel corso di questa dissertazione verrà mostrato come modellare accuratamente la superficie 3D di un oggetto a partire da una analisi della polarizzazione della luce riflessa o come parametrizzare le forme usando dei descrittori di forma allo stato dell'arte, basati su proprietà statistiche delle classi di oggetti o semplicemente sulle singole superfici 3D o contorni degli oggetti.
Shape, Descriptors, Vision, Graphics
Shape Modeling and Description from 2D Images / Guarnera, Giuseppe. - (2012 Dec 10).
File in questo prodotto:
File Dimensione Formato  
tesi_pdfa.pdf

accesso aperto

Tipologia: Tesi di dottorato
Licenza: PUBBLICO - Pubblico con Copyright
Dimensione 14.64 MB
Formato Adobe PDF
14.64 MB Adobe PDF Visualizza/Apri

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.11769/587596
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact