imagazin arrow2-left arrow2-right arrow2-top arrow-up arrow-down arrow-left arrow-right cart close dossiers education fb instagram menu notification oander rss rss-footer search service shuffle speech-bubble star store stores tests twitter youtube

Kipróbáltuk az iPhone XS Max-ot

Megnéztük hogyan teljesít hosszabb távon!

Szuperokos videó lassítási rendszeren dolgozik az Nvidia


Egy új kutatás lehetővé teszi, hogy normál képkockaszámú felvételeket is négyszeres lassításnak vessünk alá egy MI technológia segítségével. A módszer erőforrás és üzemidő szempontjából is előnyös lehet az okostelefonnal készült videók számára.

Napjaink csúcstelefonjainak alapkelléke a slowmotion felvételi mód, az az könnyedén készíthetünk szuperlassítást az iPhone-unk segítségével. A 120-240 képkockás felvételek készítése teljesen általánossá vált, ugyanakkor technikai oldalról nem is olyan egyszerű dolog ez, mint amennyire annak tűnik. Ha olyan fényképezőgépet vagy kamerát szeretnénk vásárolni, amely azonos fps számot tesz lehetővé, mint az iPhone X vagy az iPhone 8, akkor azok értékének nagyon sokszorosát kell fizetnünk érte.

Ez főleg azért van, mert bár kívülről nem tűnik komplikáltnak, a magas képkockaszám rögzítés komoly erőforrást igényel, és jelentős az energiafelhasználása. Ezért van az, hogy ha huzamosabb ideig videózol így a telefonoddal, akkor hamar átmelegszik a telefon és rohamosan merülni kezd az akkumulátor.

Ezt orvosolná az Nvidia azzal, hogy nem hardveres, hanem szoftveresen tenné lehetővé a lassított felvételek rögzítését egy deep learning algoritmus kidolgozásával. A tanulmányuk során pedig egészen jó eredményeket kaptak.

Az emberi szem akkor alakítja az alló képeket mozgóvá, ha minimum 24-et lát belőle 1 másodperc alatt. Ekkora képkockaszámmal látjuk a moziban a filmeket, a tévékben a 25 vagy 30 az elterjedt sztenderd.

Az ennél magasabb fps-t sokkal dinamikusabbnak, kevésbé filmszerűnek látjuk, éppen ezért még ha több képet is rögzítenek a filmesek másodpercenként, mint 24 azt utólag visszaredukálják. Logikusan több kép, több információ, így ha azt megnyújtjuk, akkor egységnyi idő alatt tisztábban értelmezhető képet kapunk.

Éppen ezért a hagyományos 24, 25, 30 képkockát nem lehet úgy lassítani, hogy az ne maszatolódna, esne szét  vagy válna értelmezhetetlenné. Az Nvidia kutatása viszont ezekre a fizikai korlátokra cáfolna rá, tudománnyal.

A profi videóvágó programok régóta kísérleteznek hasonlókkal, ott a frame mintavételezése vagy a keverése között váltogathatunk, ezzel jobb végereményt kapva. Ez akkor működik nagyon jól, ha szoftver pontosan tudja hogy éppen mit lát a képen.

A deep learning algoritmus pedig pont itt jön a képbe. Az összegyűlt információkból próbálja azonosítani az objektumot és az alapján kettőzi a képkockákat vagy arrébb tologat képpontokat. Ezt egyrészt utómunka során nagyon jól lehetne alkalmazni, hiszen a vágó olyan helyzetekben is nyúlhatna a lassítás eszközéhez, amelyekben fizikailag nem adott a lehetőség. Másrészt az okostelefonokban utólag is lehetne szuperlassítást csinálni, ezzel processzor teljesítményt és üzemidőt megspórolva, a tárhelyről már nem is beszélve.

A kutatás egyelőre kezdeti fázisban van és mélytanuló algoritmus lévén, egy ideig még várnunk kell mire egyáltalán ezt az eszközt a felhasználók kezébe adja a cég. Ez pedig hosszú és kínkeserves folyamat, a szoftvernek többszáz milió kompozíciót, tárgyat és szituációt kell megtanítani, ehhez pedig hozzájönnek még a külső tényezők, mint a kamera mozgatása, a fényviszonyok és az egyes okostelefonok képstabilizáló rendszerei. Így ez is csak egy izgalmas fejlesztés marad, egyelőre.

Forrás: The Verge

iPad Pro 2018

Ezt már olvastad?

A Sirinek ez is az egyik baja, hogy mindenki a célközönség. Valószínűleg hatékonyabb lenne, ha először jól működő modulokat hoznának létre egy-egy funkcióra szabva.

Miért nem ismeri anyanyelvünket az Apple virtuális asszisztense? - Klikk ide!