Računarski vid

Kompjuterski vid je područje umjetne inteligencije koje se bavi prepoznavanjem dvodimenzionalnih i/ili trodimenzionalnih predmeta – na primjer, ljudskog lica. Bez razvijenog kompjuterskog vida robot se ne može snalaziti u prostoru, što znači da može biti potencijalno opasan u slučaju ljudske prisutnosti u istom području.

Zadaci računarskog vida uključuju metode za sticanje, obradu, analizu i razumijevanje digitalnih slika, te ekstrakciju visokodimenzionalnih podataka iz stvarnog svijeta kako bi se proizvele numeričke ili simboličke informacije, npr. u obliku odluka.^[1]^[2]^[3]^[4] Razumijevanje u ovom kontekstu znači transformaciju vizualnih slika (unos u mrežnicu u ljudskom analogu) u opise svijeta koji imaju smisla za misaone procese i mogu izazvati odgovarajuću akciju. Ovo razumijevanje slike može se posmatrati kao razdvajanje simboličkih informacija od slikovnih podataka korištenjem modela konstruiranih uz pomoć geometrije, fizike, statistike i teorije učenja.

Naučna disciplina računarskog vida bavi se teorijom koja stoji iza vještačkih sistema koji izvlače informacije iz slika. Podaci o slici mogu imati različite oblike, kao što su video sekvence, prikazi sa više kamera, višedimenzionalni podaci sa 3D skenera, 3D oblaci tačaka od LiDaR senzora ili medicinski uređaji za skeniranje. Tehnološka disciplina računarskog vida nastoji da svoje teorije i modele primijeni na konstrukciju sistema računarskog vida.

Poddomeni računarskog vida uključuju rekonstrukciju scene, detekciju objekata, detekciju događaja, prepoznavanje aktivnosti, praćenje video zapisa, prepoznavanje objekata, procjenu 3D poze, učenje, indeksiranje, procjenu kretanja, vizuelni servis, 3D modeliranje scena i restauraciju slike.

Usvajanje tehnologije računarskog vida može biti mukotrpan za organizacije jer za to ne postoji jedinstveno rješenje. Postoji vrlo malo kompanija koje pružaju jedinstvenu i distribuiranu platformu ili operativni sistem gdje se aplikacije kompjuterskog vida mogu lako implementirati i upravljati.

Primjene uredi

Učenje 3D oblika bio je izazovan zadatak u računarskom vidu. Nedavni napredak u dubokom učenju omogućio je istraživačima da izgrade modele koji su u stanju da generišu i rekonstruišu 3D oblike iz mapa dubine ili silueta sa jednim ili više prikaza na neprimjetan i efikasan način.^[5]

Automatska inspekcija, npr. u proizvodnim aplikacijama;
Pomaganje ljudima u zadacima identifikacije, npr. sistem identifikacije vrsta;^[6]
Kontrolisanje procesa, npr. industrijski robot;
Otkrivanje događaja, npr. za vizuelni nadzor ili brojanje ljudi, npr. u restoranskoj industriji;
Interakcija, npr., kao ulaz u uređaj za interakciju računar-ljudi;
Modeliranje objekata ili okruženja, npr. analiza medicinske slike ili topografsko modeliranje;
Navigacija, npr . autonomnim vozilom ili mobilnim robotom;
Organiziranje informacija, npr . za indeksiranje baza podataka slika i sekvenci slika.
Praćenje površina ili ravni u 3D koordinatama za omogućavanje doživljaja proširene stvarnosti.

Također pogledajte uredi

Vještačke neuronske mreže

Reference uredi

^ Klette, Reinhard (4. 1. 2014). Concise Computer Vision: An Introduction into Theory and Algorithms (jezik: engleski). Springer Science & Business Media. ISBN 978-1-4471-6320-6.
^ Shapiro, Linda G.; Stockman, George C. (2001). Computer Vision (jezik: engleski). Prentice Hall. ISBN 978-0-13-030796-5.
^ Morris, Tim (9. 9. 2003). Computer Vision and Image Processing (jezik: engleski). Macmillan Education UK. ISBN 978-0-333-99451-1.
^ Jähne, Bernd; Haussecker, Horst (2000). Computer Vision and Applications: A Guide for Students and Practitioners (jezik: engleski). Academic Press. ISBN 978-0-12-379777-3.
^ Soltani, A. A.; Huang, H.; Wu, J.; Kulkarni, T. D.; Tenenbaum, J. B. (2017). "Synthesizing 3D Shapes via Modeling Multi-view Depth Maps and Silhouettes with Deep Generative Networks". 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). str. 1511–1519. doi:10.1109/CVPR.2017.269. hdl:1721.1/126644. ISBN 978-1-5386-0457-1.
^ Wäldchen, Jana; Mäder, Patrick (7. 1. 2017). "Plant Species Identification Using Computer Vision Techniques: A Systematic Literature Review". Archives of Computational Methods in Engineering (jezik: engleski). 25 (2): 507–543. doi:10.1007/s11831-016-9206-z. ISSN 1134-3060. PMC 6003396. PMID 29962832.

Literatura uredi

Image Processing, Analysis, and Machine Vision, isbn=978-0-495-08252-1
Computer Vision, A Modern Approach, isbn=978-0-13-085198-7
E. Roy Davies (2005). Machine Vision: Theory, Algorithms, Practicalities. Morgan Kaufmann. ISBN 978-0-12-206093-9.
Turek, Fred (juni 2011). "Machine Vision Fundamentals, How to Make Robots See". NASA Tech Briefs Magazine. 35 (6). pages 60–62
Steger, Carsten; Markus Ulrich; Christian Wiedemann (2018). Machine Vision Algorithms and Applications (2nd izd.). Weinheim: Wiley-VCH. str. 1. ISBN 978-3-527-41365-2. Arhivirano s originala, 15. 3. 2023. Pristupljeno 30. 1. 2018.
Dana H. Ballard; Christopher M. Brown (1982). Computer Vision. Prentice Hall. ISBN 978-0-13-165316-0.
Huang, T. (19. 11. 1996). Vandoni, Carlo, E (ured.). Computer Vision : Evolution And Promise (PDF). 19th CERN School of Computing. Geneva: CERN. str. 21–25. doi:10.5170/CERN-1996-008.21. ISBN 978-9290830955. Arhivirano (PDF) s originala, 7. 2. 2018.
Margaret Ann Boden (2006). Mind as Machine: A History of Cognitive Science. Clarendon Press. str. 781. ISBN 978-0-19-954316-8.
Papert, Seymour (1. 7. 1966). "The Summer Vision Project". MIT AI Memos (1959 - 2004). hdl:1721.1/6125.
Richard Szeliski (30. 9. 2010). Computer Vision: Algorithms and Applications. Springer Science & Business Media. str. 10–16. ISBN 978-1-84882-935-0.

[1] Klette, Reinhard (4. 1. 2014). Concise Computer Vision: An Introduction into Theory and Algorithms (jezik: engleski). Springer Science & Business Media. ISBN 978-1-4471-6320-6.

[2] Shapiro, Linda G.; Stockman, George C. (2001). Computer Vision (jezik: engleski). Prentice Hall. ISBN 978-0-13-030796-5.

[3] Morris, Tim (9. 9. 2003). Computer Vision and Image Processing (jezik: engleski). Macmillan Education UK. ISBN 978-0-333-99451-1.

[4] Jähne, Bernd; Haussecker, Horst (2000). Computer Vision and Applications: A Guide for Students and Practitioners (jezik: engleski). Academic Press. ISBN 978-0-12-379777-3.

[3DVAE-5] Soltani, A. A.; Huang, H.; Wu, J.; Kulkarni, T. D.; Tenenbaum, J. B. (2017). "Synthesizing 3D Shapes via Modeling Multi-view Depth Maps and Silhouettes with Deep Generative Networks". 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). str. 1511–1519. doi:10.1109/CVPR.2017.269. hdl:1721.1/126644. ISBN 978-1-5386-0457-1.

[6] Wäldchen, Jana; Mäder, Patrick (7. 1. 2017). "Plant Species Identification Using Computer Vision Techniques: A Systematic Literature Review". Archives of Computational Methods in Engineering (jezik: engleski). 25 (2): 507–543. doi:10.1007/s11831-016-9206-z. ISSN 1134-3060. PMC 6003396. PMID 29962832.

[1]

[2]

[3]

[4]

[5]

[6]