A látószögek és a kamerás megfigyelés 2 - az arcfelismerés és a pixelek harca

Elsődleges fülek

Korábbi bejegyzésünk (bár szerettük volna) nem volt mindenki számára elég érthető, ezért arra gondoltunk még emészthetőbben magyarázzuk el, hogy mit is jelent a látószög (és ha már írunk, akkor) a felbontással együtt.

Nap mint nap érkezik olyan kérdés főleg telefonon, de most itt a hozzászólások között is, hogy "...5-10 méter távolságból fel lehet-e ismerni egy emberi arcot a 640x480 pixeles felvételről...". Nézzük csak szépen sorjában, azaz jöhet a logikai ki-mit-tud.

Bizonyára látogatóink többsége nézett már távcsőbe eddigi élete során. Távcsőbe rendszerint azért nézünk távoli objektumok után kutatva, hogy közelebbinek, nagyobbnak lássuk őket anélkül, hogy közelebb kellene sétálnunk hozzájuk. Tesszük ezt azért, mert lusták vagyunk a sétáláshoz, vagy mert akadályoztatva vagyunk a megközelítésben. Biztonsági kamera esetén nyilván utóbbi a nyerő, merthogy a kamera nem tud helyet változtatni, legalábbis egyelőre még nem.

A 60 fokos látószögű kamera bár nagyobb teret lát be, elvesznek a részletek a sok információ miatt

 

A 42 fokos látószöggel már jobban kivehetők a távolabbi részletek is

 

A 22 fokos látószög alkalmazása mellett a távoli objektumok megfigyelhető közelségbe kerülnek

 

Ahhoz, hogy a távoli objektumokat közelebbinek láthassuk, valamit fel kell áldoznunk a fizika oltárán. Ez a valami pedig nem más, mint a látószög. Távcsőben sem lehet nagyobbnak láttatni úgy a távoli objektumokat, hogy a szemünkkel azért mégiscsak mindent láthassunk egyazon időben, hiszen ha változatlanul mindent látnánk, akkor a megfigyelni kívánt objektum nem is tűnne közelebbinek számunkra. Gyakorlatilag ilyenkor nem távcsőbe néznénk, hanem egy szimpla csövön át szemlélnénk a világot változatlan arányaiban tovább és maximum csak szűk látókörűnek nevezhetnénk magunkat.

 
Fordítsuk visszájára a helyzetet. Mi történik akkor, ha fordítva nézünk bele a távcsőbe? Tapasztaltabb gyerekek rögtön rávágják, hogy kissebbnek látjuk rajta az embereket... és milyen igazuk van! A gyerekek gyakran okosabbak nálunk.

Ha fordítva nézünk bele a távcsőbe, a tárgyak távolabbinak és kisebbnek fognak tűnni. Látszólag értelmetlennek tűnik ez a változat, de valami érthetetlen okból mégis mindenki erre törekszik amikor kamerát keres. Mindenki hatalmas látószögeket és a fizikával ellentétben felismerhető arcokat akar. De akkor mégis mi teendő? 

Teljesen más a helyzet, ha a kisebb látószögű kamera felvételét nézzük, mint a
nagyob látószögű felvétel kinagyított részletét
 Tehát mivel a fizika egyelőre megkerülhetetlennek látszik kénytelenek vagyunk választani a szűk látószög (így a közelebbi objektumok), vagy a nagy látószög (de kisebb objektumok) lehetőségeink közül... vagy esetleg kinyitjuk elménket (ill. pénztárcánkat) és tovább lépünk a lehetséges megoldások irányába. Hogyan tudjuk nagyobbnak láttatni a távoli tárgyakat úgy, hogy közben mégis mindent láthassunk mellette utólag? Fogas kérdés, de az ember azért ember, hogy mindenre találjon megoldást.
 
Le mernénk fogadni, hogy szinte már minden látogatónk fényképezett iskolai, óvodai, koncert vagy bármilyen tömeges rendezvényeken és a többségük mind belefutott abba a kínos helyzetbe, hogy a fényképezőink sohasem rendelkeznek akkora zoom-mal, ami elegendő lenne számunkra. De mégis mi történik, ha elfogy az optikai zoom, de mi még mindig nagyobbnak, közelebbinek szeretnénk látni szeretteinket vagy érdekesnek tartott kiszemeltjeinket abban a bizonyos, soha vissza nem térő és rendkívül fontos pillanatban? Nyomjuk és csak nyomjuk tovább a zoom-ot, majd azt vesszük észre, hogy a gép tényleg zoom-ol tovább. De mégis hogyan, ha nincs is több optikai zoom benne? Sikerült rá érezünk a következő lépcsőre a gondolatmenetben?
 
Ha elfogy az optikai, már nincs más megoldás, mint a digitális zoom. Itt egyelőre már csak ő jöhet szóba. A digitális zoom egy végtelenül egyszerű történet. A digitális zoom-olás során nem csinálunk semmi mást, mint a kész fényképet (videót, esetleg élő adást) addig toljuk a szemünkbe, amíg még ki bírunk hámozni belőle valami értékelhetőt. Ja, hogy egy idő után szemcsés lesz? Természetes, hiszen a fizika itt is pórázon tart bennünket. Ha nincs több információ, amit nagyítani lehetne, a végén már csak egyetlen pixelt, azaz egyetlen képpontot fogunk nézegetni. De mégis, hogyan tudnánk még tovább nagyítani a kész információt, hogy a képen (videón) az embereket, tárgyakat a lehető legjobban ki tudjuk nagyítani? Kezd leesni? Ha nem, lökjünk rajta egyet és biztosan mindenki meg fogja érteni. Iszonyat nagy felbontással le kell fényképzenünk mindent amit csak a kameránk láthat...
 
Amikor valaki fényképezőgépet vásárol, céltudatosan megy neki a minél nagyobb pixel számnak. Azonban ha ez az átlag valaki IP kamerát szeretne vásárolni, rendszerint pontosan fordítva működik a gondolatmenete. A vevők többsége céltudatosan keresi a legolcsóbb és legkisebb felbontással működő kamerákat, miközben azt várja el tőlük, amit a CSI valamelyik verziójában látott néhány epizóddal korábban, amikor a biztonsági kamera felvételén a 100 méterre lévő, 3 pixel méretű arcból tüköréles ábrázatot varázsol a célszoftver, stb.
 
Amivel etetnek bennünket - ezeknek nincs köze a valósághoz
 

Ki kell ábrándítsunk mindenkit, hogy amit a TV-ben látunk, az nem a valóság! Attól, hogy az USA-tól egy óceán választ el bennünket, még ott sem működnek a biztonsági kamerák 1000 megapixeles felbontásokkal ahhoz, hogy 3 pixel helyett 100 méterről is 12 megapixeles minőségű arcot láthassunk. Ott is nagyon fontos, hogy a kamera olcsó, de használható legyen és igyekeznek ott is kompromisszumot kötni az ár/érték arányban. A TV-ben pedig Jerry Bruckheimer filmjei hülyítsenek csak tovább bennünket. Ha nem is hisszük el az ott látottakat, legalább szórakoztató számunkra...

Hozzászólások

Nem kis mesélők vagytok ! De a lényeg benne van!

Üdvözletem.
Kérdésem (az itt olvasottak figyelembe vételével) :
Adott egy zárt folyosó, világítása közepes (tudom, ez hülye kifejezés,de nem találok most jobbat) és állandó. kb 4-5 m távolságtés max 8 - 9 m távolságig kellene olyan minőségű felvétel, hogy az emberi arc jól kivehető, felismerhető legyen. Tudom, most jön a látószög kérdés. A folyosó 1m széles, tehát a látószög kicsi
Mit javasolnak, vagy javasoltok (nem kívánt törlendő), melyik kamerát? Mennyi az ára annak, amit javasoltok.
Köszönöm : Vendég

Legyen a 60 fokos látószög az alap példa. VGA (640x480p) felbontásnál idegenek esetében az arc azonosíthatóság megáll kb. 3-4 méter távolságban. Ismerősöket nyilván 15-20 méterről is felismerünk a felvételen. Ha ugrunk az 1.3 megapixel magasságához (1280x960p), változatlan látószög mellett az arc 2x lesz nagyobb, azaz a 640 pixel méretről a kép mérete 1280 pixel lesz. Tehát a felismerési távolság is 6-8 méternél fog megállni. Ha még egyet ugrunk az 5 megapixelig (2592x1920p), a felvétel mérete ismét duplázódik, az eredetihez képest viszont már 4x szélesebb lesz az arc a felvételen, ezért az azonosíthatóság az eredeti VGA-hoz képest is 4x nagyobb lesz. A felismerhetőségi távolság is változik természetesen vele 12-16 méterre.

Ha 60 helyett csak 30 fokkal dolgoznánk, akkor minden arc 2x nagyobb lenne minden felvételen.

Üdvözletem!
Nemrég tettem szert egy Foscam FI9821W IP kamerára. Beltérben, üzletben használom. Kérdésem hogy lehet-e manuáliasan élességet állítani a kamerán? Azt vettem észre, hogy a lencse körüli perem, elfordítható, vagy ennek semmi szerepe?
A másik gondom, hogy elég sötét a képe, ha nincs a világítás felkapcsolva az üzletben. A kamera a kirakattal, ajtóval szemben van, mert azt szeretném ha figyelné. Lehet hogy a szembe fény miatt van?
Köszönöm!
Üdv!
Péter