Introducción a Convolución

 

Embed or link this publication

Description

Tutorial introductorio a cómo a partir de las convoluciones espaciales podemos realizar procesamiento en imágenes.

Popular Pages


p. 1

escola d enginyeria uab detecció de punts característics introducciÓ a la convoluciÓ espacial memòria novembre 2009 rafael moreno hermosilla

[close]

p. 2

detecció de punts característics introducciÓ a la convoluciÓ espacial escola d enginyeria uab versió data 1.0 novembre 2009 taula de continguts 1 detecció de característiques 1.1 1.2 2 tipus de trets característics classificació dels principals detectors de característiques 3 4 5 5 6 7 7 18 18 22 27 29 29 34 36 36 41 43 44 45 3 filtratge bàsic 2.1 2.2 2.3 2.4 tractament inicial la convolució el filtratge filtres bàsics 3 matriu d autocorrelació second moment matrix i detector de harris 3.1 3.2 3.3 matriu autocorrelació detector de harris cantonades matriu autocorrelació veps i vaps 4 espai escala i blobs 4.1 4.2 espai escala blobs 5 blobs log i dog 5.1 5.2 laplacian of gaussian log difference of gaussian approach dog 6 espai escala harris laplace 6.1 6.2 concepte exemple implementació detecció de punts característics escola d enginyeria uab pàg 2

[close]

p. 3

memòria 1 detecció de característiques la detecció de trets característics fa referència al mètode al que sotmetem una imatge per tal d extreure o ressaltar d alguna manera algunes parts d aquesta que considerem característiques i que volem estudiar localment això ens permetrà un nivell d abstracció de la imatge en pro de detectar allò que busquem no hi ha una definició concreta associada al que entenem en aquest context com a tret característic tot i això podem afirmar que es tracta d una part interessant de la nostra imatge que desperta més interès que la resta la detecció de trets característics d una imatge esdevindrà un procés a baix nivell a nivell de píxel i força costós ja que es basarà en comprovar píxel a píxel si es tracta d una regió característica si hi pertany els detectors de característiques valoren una propietat per damunt de totes les demés la repetibilitat la repetibilitat fa referència a si el mateix tret es detectat en 2 o més imatges de la mateixa escena les característiques que extraurem seran punts podríem triar com a característiques línees o contorns però els punts presenten una sèrie d avantatges sobre aquests són més fàcils de detectar ens permeten una millor correlació .si extraiem línees depenent de la posició de la càmera obtindrem una o altre perspectiva i al utilitzar la correlació presentarà dificultats per estimar quines característiques són iguals les imatges contenen una gran quantitat d informació i ens interessa extreure-la de la manera més eficaç i robusta possible És per això que les característiques han de complir una sèrie de condicions la seva extracció a partir de la imatge ha de ser el menys costosa possible la seva localització ha de ser el més precisa possible han de ser característiques robustes i estables finalment destacar que normalment aplicarem a les imatges un pre-procès de suavitzat mitjançant un filtre gaussià amb l objectiu d eliminar soroll de la imatge i optimitzar en conseqüència la detecció de característiques 1.1 tipus de trets característics a l hora de realitzar la detecció de trets característics d una imatge hem de prefixar d alguna manera quin és aquell tret o característica que volem ressaltar de la nostra imatge a continuació tenim les característiques més comunes contorns edges es tracta de punts on hi ha un límit entre 2 o més regions en general aquest límit entre regions es detecta pel fet que els punts que hi pertanyen tenen una alta magnitud del gradient en termes de derivada un major canvi suposa una major magnitud detecció de punts característics escola d enginyeria uab pàg 3

[close]

p. 4

així doncs en el cas de detecció de contorns ens interessarà discernir aquelles zones on es produeixi un fort canvi d intensitat és a dir una forta discontinuïtat en la intensitat de la imatge discontinuïtats dins el conjunt de píxels veurem que podrem basar-nos en l ús de la primera o de la segona derivada per a l obtenció d aquets tipus de punts cantonades corners la detecció de cantonades o punts d interès està molt lligada a la detecció de contorns si més no les cantonades són contorns dobles és a dir suposen una limitació en el pla vertical i horitzontal a la vegada així utilitzarem mecanismes que parteixen de la base anterior on buscarem màxims locals al gradient de la nostra imatge amb això el que volem transmetre és que partint del càlcul de contorns buscarem màxims que suposaran cantonades blobs el concepte de blob trenca una mica amb els 2 cassos anteriors ja que no es tracta de punts concrets de la imatge sinó més bé de regions els blobs els entenem com zones de la imatge amb intensitat diferent a l entorn principal que l envolta en definitiva els detectors de blobs ens permetran donar amb aquelles parts de la imatge que en si esdevenen una entitat pròpia subseccions de la nostra imatge que presenten rellevància 1.2 classificació dels principals detectors de característiques a continuació presentem una taula amb els detectors principals i quina característica són capaços de detectar detecció de punts característics escola d enginyeria uab pàg 4

[close]

p. 5

2 filtratge bàsic la idea és partir d una imatge de mida reduïda i que el seu contingut sigui força significatiu a l hora de poder analitzar diferents característiques d aquesta així partim de la següent imatge És tracta d una imatge de mida 13x16 píxels on tenim un quadrat negre al mig i tot el voltant blanc esdevenint màxim contrast 2.1 tractament inicial per processar les diferents imatges haurem de sotmetre-les a un tractament inicial aquest tractament consisteix a limitar-les a 1 sol canal ja que inicialment tenen 3 rgb i a canviar les dades de format passem de uint8 a double im imread cuadro.bmp img rgb2grayim img doubleimg un cop pre-tractada la imatge obtenim la matriu d intensitat que la defineix veiem que es tracta tot de color blanc al voltant 255 i una zona cèntrica negre 0 que limita amb tota la resta aquesta imatge serà el nostre punt de partida a l hora d analitzar els diferents detectors i operadors de convolució en imatges detecció de punts característics escola d enginyeria uab pàg 5

[close]

p. 6

2.2 la convolució la convolució és un operador matemàtic que realitza una transformació de 2 funcions en una tercera que d alguna manera representa la magnitud en la que se superposen la primera funció i una versió traslladada i invertida de la segona matemàticament la convolució queda definida de la següent forma la definim com la integral del producte de les dues funcions després de que una sigui invertida i desplaçada una distancia el rang d integració dependrà del domini sobre el que estiguin definides les funcions pel que fa a la convolució ens interessa la seva vessant que implica al processament d imatges on la funció `f farà referència a la pròpia imatge i la funció `g al kernel de convolució el kernel serà una màscara que aplicarem sobre la imatge de manera successiva fins a cobrir tota la seva dimensió i amb una finalitat específica normalment els kernels de convolució són de dimensió 3x3 5x5 9x9 i es caracteritzen perquè a l hora d aplicar-los cal rotar la màscara 180º així doncs la idea fonamental al aplicar un filtre de convolució seria la següent · partim d un bloc de la imatge de mida igual a la dimensió de la màscara i de la màscara de convolució · realitzem l operació de convolució entre els 2 elements de manera que esdevenim una operació local amb píxels de l entorn per tal de definir cada un dels píxels donem pesos als veïns del píxel [ponderació detecció de punts característics escola d enginyeria uab pàg 6

[close]

p. 7

en definitiva la idea essencial serà definir els coeficients i la mida de la nostra màscara de convolució a fi d assolir l objectiu pel qual l apliquem els objectius pels que apliquem una convolució podran ser diversos suavitzar una imatge detectar contorns detectar cantonades detectar seccions semblants 2.3 el filtratge el filtratge és l operació en la que ens basarem i es basa en aplicar filtres o màscares a les imatges aquest pot ser espacial on treballem a nivell de píxels ens centrem en aquest freqüencial en aquest cas necessitarem treballar a nivell freqüencial i per això haurem d aplicar la transformada de fourier amb el filtratge podem aplicar molts efectes a les nostres imatges com per exemple suavitzar-la reduint les variacions d intensitat dels píxels veïns eliminar soroll eliminant píxels que el seu nivell d intensitat sigui molt diferent al dels veïns contorns detectant píxels on es produeixi canvi brusc d intensitat així doncs ens centrarem en el filtratge espacial treballarem a nivell de píxels i concretament dins de l espacial en un filtratge lineal utilitzant màscares de convolució veurem que un factor molt important al treballar amb els kernels serà el de definir el coeficient de veïnatge que ens marca la dimensió de la màscara és a dir quin rang de píxels veïns estic disposat a tenir en compte per calcular cada píxel 2.4 filtres bàsics filtre de la mitjana suavitza És un filtre que ens permetrà suavitzar la nostra imatge és a dir reduir els canvis bruscs d intensitat que en ella hi pugui haver només ens cal definir la mida del nostre filtre i els seus coeficients seran el promig del nombre d elements si tenim una màscara de n elements doncs cada elements serà 1/n per exemple w fspecial average 3 w 0.1111 0.1111 0.1111 0.1111 0.1111 0.1111 0.1111 0.1111 0.1111 detecció de punts característics escola d enginyeria uab pàg 7

[close]

p. 8

podem aplicar el filtre a la nostra imatge img i analitzar els resultats obtinguts res imfilterimg,w veiem com els píxels propers a la frontera han variat el valor ja no tenim el canvi brusc de 0 a 255 en la frontera a més veiem que els píxels del voltant també han patit un canvi degut al tractament que fa la convolució en els límits de la imatge per poder calcular els píxels dels límits considera `0 les zones sense imatge la mida de la finestra és un factor molt important per determinar quin grau de suavitat volem aplicar a la imatge és a dir el rang d incidència que volem que tinguin els veïns filtre gaussià suavitza elimina soroll el filtre gaussià es troba regit per la funció gaussiana que queda definida per normalitza la seva gràfica és la següent figure1 gaus=fspecial gaussian 100,10 surfgaus l àrea entre la gràfica i l eix x val `1 detecció de punts característics escola d enginyeria uab pàg 8

[close]

p. 9

un paràmetre força important al treballar amb la gaussiana és o que fan referència a la desviació típica o a la variància en l ordre en que apareixen aquest paràmetre és molt important ja que ens determina la rapidesa amb que varien els valors de la distribució del centre cap als extrems és a dir contra més gran sigui la variància més lentament decrementa els valors des del centre cap als extrems així doncs la gaussiana ens prové una distribució més real que la mitjana ja que no realitza purament un càlcul promig sinó que dona màxima ponderació al píxel central i va disminuint el pes conforme és separa d aquest veiem com afecta el valor de 2 2 la campana serà més baixa i més ample i per tant els elements de la distribució coeficients de la màscara disminuiran més ràpidament suavitza la campana serà més alta i més estreta i per tant els elements de la distribució coeficients de la màscara disminuiran més lentament suavitza 2 2 2 així doncs variant el paràmetre de la mida de finestra contemplem més o menys veïns a l hora de calcular el píxel i la variació de la sigma afecta al pes que donem als veïns respecte al píxel central pot variar més o menys ràpidament g=fspecial gaussian 3,2 detecta contorn exacte ja que mira en ambdues direccions des del contorn g=fspecial gaussian 3,5 detecció de punts característics escola d enginyeria uab pàg 9

[close]

p. 10

veiem que contra més gran sigui la sigma necessitarem una finestra més gran per compensar el grau de distorsió de la imatge pèrdua resolució filtres del gradient detecta contorn És una primera aproximació a la detecció de contorns on pretenem detectar aquell conjunt de punts on la variació d intensitat es produeix més ràpidament per tant es poden detectar fent ús de les derivades de la imatge a la pràctica els contorns s assemblen més a una rampa que a un graó així que si optem per calcular la derivada de la imatge en aquells punts on es produeixin canvis d intensitat més forts la derivada suposarà un pic més alt figura aleshores els mètodes del gradient tracten de buscar els màxims de la primera derivada de la imatge en aquest context tenim els filtres de prewitt o els de sobel que ens permeten calcular el gradient vertical i horitzontal de la imatge el gradient apunta a la direcció amb el canvi de velocitat màxim detecció de punts característics escola d enginyeria uab pàg 10

[close]

p. 11

i els podem obtenir en matlab directament h fspecial prewitt [1 1 1;0 0 0 1 -1 -1 transposar si volem contorns verticals h fspecial sobel [1 2 1;0 0 0 1 -2 -1 transposar si volem contorns verticals per aplicar el filtre a la nostra imatge només caldria dx fspecial prewitt dy dx ix conv2img,dx same iy conv2img,dy same un cop calculats els gradients podem observar la seva representació veient com ressalten els contorns horitzontals i verticals respectivament surfix i surfiy És interessant veure els valors que ha pres la matriu d intensitat relativa a la figura per comprovar com el càlcul del gradient ens dona una matriu de valors on els majors es troben en la regió d interès detecció de punts característics escola d enginyeria uab pàg 11

[close]

p. 12

ix iy tot i això tenim una alternativa al càlcul del gradient mitjançant les matrius de prewitt i sobel i és que podem treballar amb el càlcul dels vectors del gradient dx suposa la derivada de la gaussiana on sigma és un paràmetre que definim sigma de la gaussiana en aquest cas `dx i `dy no són matrius sinó vectors tot i això el càlcul de ix i iy es realitza igual detecció de punts característics escola d enginyeria uab pàg 12

[close]

p. 13

filtre laplacià detecta cantonades/contorns el filtre laplacià també es basa en la derivada de la imatge però aquest cop en la 2a derivada el laplacià queda expressat per on cada un dels elements derivades parcials s expressa l estratègia que desenvolupem en aquest cas per trobar els punts de contorn és la de zerocrossing ja que si realitzem la segona derivada de la imatge els punts de contorn seran aquells que passin per `0 mesura diferències entre superficies situades a diferents alçades així no detecta exactamente la cantonada sino punt proper a cantonada dins superfície més intensa detecció de punts característics escola d enginyeria uab pàg 13

[close]

p. 14

la següent màscara ens mostra l aproximació del laplacià a kernel de 3x3 És molt important que si el coeficient del centre és positiu la resta no ho siguin i viceversa ja que es tracta d una derivada i la seva suma ha de ser `0 si recuperem la imatge amb la que hem estat treballant podem aplicar-li el filtre laplacià que ens proporciona matlab lap fspecial laplacian resultado conv2img,lap surfresultado veiem que es tracta d un filtre ideal per detectar contorns i més concretament per detectar cantonades així tenim que si la variació de intensitat és produeix en més d una direcció cantonada el valor és encara major tenim a continuació la matriu d intensitat resultant al aplicar el filtre detecció de punts característics escola d enginyeria uab pàg 14

[close]

p. 15

i fins i tot podem fer un imshow del resultat i veiem com marca concretament els contorns tot i això el laplacià no s utilitza massa per a la detecció de contorns ja que és massa sensible al soroll per usar la derivada i no permet detectar la direcció del contorn filtre laplacià de gaussiana log detecta cantonades blobs al tancar l apartat del laplacià hem vist que tot i que suposa un bon detector de contorns te les seves limitacions pel fet de basar-se en derivades factor que el fa molt sensible al soroll la idea parteix de la base de que podem aplicar 1 un filtre gaussià `g per eliminar el soroll 2 un filtre laplacià `l per detectar contorns com la convolució és una operació commutativa aleshores tenim el laplacià de la gaussiana és la 2a derivada de la gaussiana respecte `r podem veure els resultats d aplicar el filtre en la nostra imatge inicial f fspecial log 3,10 convo surfconv2img,f same veiem que els contorns i les cantonades són els píxels més potents del resultat de la convolució hem aplicat un filtre de mida 3x3 amb una sigma de valor 10 recordem que la sigma determina el grau de resolució que presenta la imatge al aplicar la gaussiana que la suavitza detecció de punts característics escola d enginyeria uab pàg 15

[close]

Comments

no comments yet

YOUBLISHER
About
What Others Say
Sitemap
Impressum

PUBLISHERS
Login
Signup
Tutorials
FAQ
Support

BUSINESS
Overview
Advertising
Support

DEVELOPERS
API

LEGAL
Report a Copyright Violation
Copyright FAQ
Terms of Use
Privacy Policy