GQN
VIDEO: AI može zamisliti 3D model iz 2D slike
Neuralna mreže koja može učiti iz svojeg okruženja predstavlja veliki iskorak.
Stvaranje umjetne inteligencije koja će biti uspješna u vizualnom prepoznavanju računalnim je znanstvenicima prilično teška zadaća, jer AI ima s time velikih poteškoća za razliku od ljudskog mozga koji to radi savršeno.
Kada čovjek uđe u nepoznato područje jednostavno mu je prepoznati i kategorizirati što se sve tamo nalazi, bez obzira iz kojeg ugla promatrao svoje okruženje. Umjetnoj inteligenciji je tako nešto prilično teško jer vizualno prepoznavanje temelji na poznavanju baze podataka u kojoj su objekti poslagani i prikazani prema određenim uzorcima.
Znanstvenici koji rade na Googleovom DeepMind AI-u stoga razvijaju neuralnu mrežu koja će biti u stanju biti uspješna u vizualnom prepoznavanju kao ljudski mozak.
Njihova nova neuralna mreža pod nazivom GQN (General Query Network) se razlikuje od ostalih jer je programirana da promatra svoje okruženje i uvježbava se isključivo na temelju tih podataka, a ne onima kojima ga "pune" znanstvenici. Kao rezultat toga dobili su neuralnu mrežu koja uči kako dobiti smisao u svijetu i primijeniti naučeno na nove scene s kojima se suočava, kao što objašnjava znanstvenik Ali Eslami u ovom videu.
Nakon što su GQN izložili okruženju u kontroliranim uvjetima, znanstvenici su ga izlagali novim okruženjima po slučajnom odabiru. AI je bio u stanju zamisliti scenu iz različitih uglova i izvesti 3D renderiranje 2D slike. Pored toga mogao je prepoznati i klasificirati objekte bez unaprijed ubačenih primjera u bazu na temelju onoga što vidi.
U sadašnjoj fazi istraživanja GQN je ograničen na prepoznavanje umjetnih scena, pa tek treba vidjeti kako će se snaći u pravom svijetu, no znanstvenici kažu da je već i ovo veliki iskorak u potpuno automatiziranom razumijevanju scena.
Učitavam komentare ...