Skip to content

VICENT CASELLES COSTA

by a 23 Juny 2010

«Podem recrear jugades de futbol i veure-les des de qualsevol angle»

Va començar a treballar en el processament d’imatges a la Universitat de Mallorca mogut pel seu interès a fer matemàtiques aplicades. Es va formar amb investigadors d’Israel, França i els EUA que treballaven en visió per ordinador i ara treballa des de la Universitat Pompeu Fabra dissenyant programes informàtics per a la televisió del futur.

Quina és la diferència entre el processament d’imatges i la visió per ordinador?

–«En el processament d’imatges l’entrada i la sortida són imatges. Per exemple, quan comprimim imatges, n’entra una a l’ordinador, es fan una sèrie d’operacions per reduir el volum de bites que ocupa i en surt una altra imatge codificada. Un altre procés d’aquesta mena és aquell en què entra una imatge amb soroll i surt una imatge neta…»
Entra una imatge borrosa…
–«… i surt una imatge nítida. Això són exemples de processament d’imatge. La visió per ordinador té altres objectius. Un és la interpretació d’una escena tridimensional a partir d’imatges. Posem una sèrie de càmeres que ens permeten reconstruir i interpretar l’escena tridimensional. Nosaltres tenim dos ulls, posicionats a una determinada distància, que ens permeten reconstruir un punt en tres dimensions. La visió per ordinador també fa anàlisi d’escenes, que és una de les coses en què estic treballant.»
–En quin projecte, concretament?
–«Doncs en l’anàlisi de la publicitat en panells mòbils, per exemple a les tanques publicitàries durant els partits de futbol. Els auditors demanen tenir eines per saber quina és la publicitat que s’està emetent en cada instant i quina és la visibilitat que ha tingut.»
–Suposo que està en funció de la retransmissió que s’ha fet i si en Messi ha fet un gol quan hi havia la teva publicitat posada?
–«Sí, exactament això.»
–Com treballen aquestes eines?
–«Desenvolupem sistemes informàtics per poder determinar en cada instant quin logotip ha estat visible i quines són les seves característiques de visibilitat. Si la presa ha estat de prop, de lluny, si s’ha vist tot el logotip o no…»
–Així, agafen el vídeo i el passen per l’ordinador i s’esperen els resultats. Ja es pot fer això?
–«Sí, el més complicat és fer-ho en temps real, perquè hi ha 25-30 imatges per segon. Aquest problema és de reconeixement de formes. El cervell humà està molt acostumat a analitzar i a interpretar escenes a l’instant, però que es pugui fer automàticament amb un ordinador és més difícil. I això és un exemple dels més senzills que hi ha, perquè el logotip d’una marca no té una gran variabilitat.»
–S’aplica en altres camps el reconeixement de formes?
–«Les aplicacions del reconeixement de formes són molt nombroses. Una variant del problema dels logotips és el reconeixement de la publicitat en un diari, com apareix, sota quina notícia. I un altre problema és el reconeixement de cares…»
–Crec que aquest sistema ja s’ha començat a provar en aeroports…»
–«Jo treballo en el reconeixement de logotips, però la tècnica és la mateixa. Les persones, les cares, els objectes tenen una sèrie de trets característics que els diferencien. Primer hem de saber que el que veu la càmera és una cara, encara que no identifiqui l’individu, però després si volem esbrinar qui és necessitem una base de dades on buscar-lo i veure quins trets característics coincideixen.»
–Distància d’ulls, volum del nas…
–«Sí, i amb això i altres trets es pot buscar la identitat de la persona.»
–Quines possibilitats ofereixen les
imatges en 3-D?
–«Doncs per exemple visitar les ciutats en tres dimensions. Es prenen fotografies des de l’aire, es fan càlculs i es fa una triangulació que dóna la configuració tridimensional. Un altre exemple, en el qual també treballo, és la síntesi de vistes virtuals d’esdeveniments esportius. Partits de futbol, per exemple. Si posem diverses càmeres en un estadi de futbol que adquireixen l’escena, podem fer-ne una recreació virtual i visualitzar l’escena des d’altres angles. Hi ha televisions que comencen a fer ús d’aquest tipus de recreacions. Ara per ara, bàsicament identifiquen la posició dels peus dels jugadors i la seva silueta i hi posen a sobre un personatge virtual, simplement perquè és més fàcil de calcular i perquè per fer-ho amb imatges reals encara cal fer un xic més de recerca per obtenir millor qualitat en temps real.»
Format a la Universitat de València, Caselles (Gata,1960) és expert en processament d’imatges. Ha rebut la distinció de la Generalitat per a la recerca o el premi ICREA Acadèmia
Anuncis

From → Treball

Feu un comentari

Deixa un comentari

Fill in your details below or click an icon to log in:

WordPress.com Logo

Esteu comentant fent servir el compte WordPress.com. Log Out / Canvia )

Twitter picture

Esteu comentant fent servir el compte Twitter. Log Out / Canvia )

Facebook photo

Esteu comentant fent servir el compte Facebook. Log Out / Canvia )

Google+ photo

Esteu comentant fent servir el compte Google+. Log Out / Canvia )

Connecting to %s

%d bloggers like this: