Home /Research /Statistical Local Appearance Models for Object Recognition
PERCEPTION

Statistical Local Appearance Models for Object Recognition

David Guillamet Monfulleda

Year
2004
Citations
3

Abstract

Durant els ultims anys, hi ha hagut un interes creixent en les tecniques de reconeixement d'objectes basades en imatges, on cadascuna de les quals es correspon a una aparenca particular de l'objecte. Aquestes tecniques que unicament utilitzen informacio de les imatges son anomenades tecniques basades en l'aparenca i l'interes sorgit per aquestes tecniques es degut al seu exit a l'hora de reconeixer objectes. Els primers metodes basats en l'aparenca es recolzaven unicament en models globals. Tot i que els metodes globals han estat utilitzats satisfactoriament en un conjunt molt ampli d'aplicacions basades en la visio per computador (per exemple, reconeixement de cares, posicionament de robots, etc), encara hi ha alguns problemes que no es poden tractar facilment. Les oclusions parcials, canvis excessius en la il·luminacio, fons complexes, canvis en l'escala i diferents punts de vista i orientacions dels objectes encara son un gran problema si s'han de tractar des d'un punt de vista global. En aquest punt es quan els metodes basats en l'aparenca local van sorgir amb l'objectiu primordial de reduir l'efecte d'alguns d'aquests problemes i proporcionar una representacio molt mes rica per ser utilitzada en entorns encara mes complexes. Usualment, els metodes basats en l'aparenca local utilitzen descriptors d'alta dimensionalitat a l'hora de descriure regions locals dels objectes. Llavors, el problema de la malediccio de la dimensionalitat (curse of dimensionality) pot sorgir i la classificacio dels objectes pot empitjorar. En aquest sentit, un exemple tipic per alleujar la malediccio de la dimensionalitat es la utilitzacio de tecniques basades en la reduccio de la dimensionalitat. D'entre les possibles tecniques per reduir la dimensionalitat, es poden utilitzar les transformacions lineals de dades. Basicament, ens podem beneficiar de les transformacions lineals de dades si la projeccio millora o mante la mateixa informacio de l'espai d'alta dimensio original i produeix classificadors fiables. Llavors, el principal objectiu es la modelitzacio de patrons d'estructures presents als espais d'altes dimensions en espais de baixes dimensions. La primera part d'aquesta tesi utilitza primordialment histogrames color, un descriptor local que ens proveeix d'una bona font d'informacio relacionada amb les variacions fotometriques de les regions locals dels objectes. Llavors, aquests descriptors d'alta dimensionalitat es projecten en espais de baixes dimensions tot utilitzant diverses tecniques. L'analisi de components principals (PCA), la factoritzacio de matrius amb valors no-negatius (NMF) i la versio ponderada del NMF son 3 transformacions lineals que s'han introduit en aquesta tesi per reduir la dimensionalitat de les dades i proporcionar espais de baixa dimensionalitat que siguin fiables i mantinguin les estructures de l'espai original. Una vegada s'han explicat, les 3 tecniques lineals son ampliament comparades segons els nivells de classificacio tot utilitzant una gran diversitat de bases de dades. Tambe es presenta un primer intent per unir aquestes tecniques en un unic marc de treball i els resultats son molt interessants i prometedors. Un altre objectiu d'aquesta tesi es determinar quan i quina transformacio lineal s'ha d'utilitzar tot tenint en compte les dades amb que estem treballant. Finalment, s'introdueix l'analisi de components independents (ICA) per modelitzar funcions de densitat de probabilitats tant a espais originals d'alta dimensionalitat com la seva extensio en subespais creats amb el PCA. L'analisi de components independents es una tecnica lineal d'extraccio de caracteristiques que busca minimitzar les dependencies d'alt ordre. Quan les seves assumpcions es compleixen, es poden obtenir caracteristiques estadisticament independents a partir de les mesures originals. En aquest sentit, el ICA s'adapta al problema de reconeixement estadistic de patrons de dades d'alta dimensionalitat. Aixo s'aconsegueix utilitzant representa

Keywords

Object (grammar)Artificial intelligenceComputer scienceActive appearance modelComputer visionPattern recognition (psychology)

Related papers

Browse all PERCEPTION papers