A Google AI csapata egy blogbejegyzésben azt írta: a televíziókhoz és az asztali számítógépekhez készített felvételek általában 16:9 vagy 4:3 formátumban elérhetők, de az okostelefonos felhasználókhoz sokszor értelmezhetetlen képarányban jutnak el.
A probléma megoldásához általában a szerkesztőknek manuálisan kell azonosítaniuk az egyes képkockák tartalmát, nyomon kell követniük a változásokat és az átmeneteket képkockáról képkockára, majd az egyes jelenetekhez kell igazítaniuk a vágási régiókat – írja a hirado.hu.
Ezt az erőforrásigényes folyamatot küszöböli ki a nyílt forráskódú AutoFlip, amely videóstabilizátor-szerű technikákat alkalmaz, hogy a kamera fókuszát azon tartsa, ami fontos. Az eszköz objektum-felismerési és nyomkövető technológiákat használ a videotartalom intelligens megértésére, így képes állítani a videó képkockáit felvétel közben is.