Računarski vid

Kompjuterski vid je područje umjetne inteligencije koje se bavi prepoznavanjem dvodimenzionalnih i/ili trodimenzionalnih predmeta – na primjer, ljudskog lica. Bez razvijenog kompjuterskog vida robot se ne može snalaziti u prostoru, što znači da može biti potencijalno opasan u slučaju ljudske prisutnosti u istom području.

Zadaci računarskog vida uključuju metode za sticanje, obradu, analizu i razumijevanje digitalnih slika, te ekstrakciju visokodimenzionalnih podataka iz stvarnog svijeta kako bi se proizvele numeričke ili simboličke informacije, npr. u obliku odluka.[1][2][3][4] Razumijevanje u ovom kontekstu znači transformaciju vizualnih slika (unos u mrežnicu u ljudskom analogu) u opise svijeta koji imaju smisla za misaone procese i mogu izazvati odgovarajuću akciju. Ovo razumijevanje slike može se posmatrati kao razdvajanje simboličkih informacija od slikovnih podataka korištenjem modela konstruiranih uz pomoć geometrije, fizike, statistike i teorije učenja.

Naučna disciplina računarskog vida bavi se teorijom koja stoji iza vještačkih sistema koji izvlače informacije iz slika. Podaci o slici mogu imati različite oblike, kao što su video sekvence, prikazi sa više kamera, višedimenzionalni podaci sa 3D skenera, 3D oblaci tačaka od LiDaR senzora ili medicinski uređaji za skeniranje. Tehnološka disciplina računarskog vida nastoji da svoje teorije i modele primijeni na konstrukciju sistema računarskog vida.

Poddomeni računarskog vida uključuju rekonstrukciju scene, detekciju objekata, detekciju događaja, prepoznavanje aktivnosti, praćenje video zapisa, prepoznavanje objekata, procjenu 3D poze, učenje, indeksiranje, procjenu kretanja, vizuelni servis, 3D modeliranje scena i restauraciju slike.

Usvajanje tehnologije računarskog vida može biti mukotrpan za organizacije jer za to ne postoji jedinstveno rješenje. Postoji vrlo malo kompanija koje pružaju jedinstvenu i distribuiranu platformu ili operativni sistem gdje se aplikacije kompjuterskog vida mogu lako implementirati i upravljati.

Detekcija objekata na fotografiji.

Primjene

uredi
 
Učenje 3D oblika bio je izazovan zadatak u računarskom vidu. Nedavni napredak u dubokom učenju omogućio je istraživačima da izgrade modele koji su u stanju da generišu i rekonstruišu 3D oblike iz mapa dubine ili silueta sa jednim ili više prikaza na neprimjetan i efikasan način.[5]

Također pogledajte

uredi

Reference

uredi
  1. ^ Klette, Reinhard (4. 1. 2014). Concise Computer Vision: An Introduction into Theory and Algorithms (jezik: engleski). Springer Science & Business Media. ISBN 978-1-4471-6320-6.
  2. ^ Shapiro, Linda G.; Stockman, George C. (2001). Computer Vision (jezik: engleski). Prentice Hall. ISBN 978-0-13-030796-5.
  3. ^ Morris, Tim (9. 9. 2003). Computer Vision and Image Processing (jezik: engleski). Macmillan Education UK. ISBN 978-0-333-99451-1.
  4. ^ Jähne, Bernd; Haussecker, Horst (2000). Computer Vision and Applications: A Guide for Students and Practitioners (jezik: engleski). Academic Press. ISBN 978-0-12-379777-3.
  5. ^ Soltani, A. A.; Huang, H.; Wu, J.; Kulkarni, T. D.; Tenenbaum, J. B. (2017). "Synthesizing 3D Shapes via Modeling Multi-view Depth Maps and Silhouettes with Deep Generative Networks". 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). str. 1511–1519. doi:10.1109/CVPR.2017.269. hdl:1721.1/126644. ISBN 978-1-5386-0457-1.
  6. ^ Wäldchen, Jana; Mäder, Patrick (7. 1. 2017). "Plant Species Identification Using Computer Vision Techniques: A Systematic Literature Review". Archives of Computational Methods in Engineering (jezik: engleski). 25 (2): 507–543. doi:10.1007/s11831-016-9206-z. ISSN 1134-3060. PMC 6003396. PMID 29962832.

Literatura

uredi