Computer vision (wizja komputerowa)
Zaktualizowano:
Wizja komputerowa (Computer Vision) koncentruje się na rozwijaniu metod, które pozwalają maszynom na pozyskiwanie, przetwarzanie, analizowanie i rozumienie danych wizualnych. Obejmuje to szeroki zakres zadań, od prostego rozpoznawania obiektów po złożone interpretacje scen i śledzenie ruchu.
Kluczowe zadania w wizji komputerowej to:
- Klasyfikacja obrazów: przypisywanie etykiet do całych obrazów (np. "kot", "pies").
- Detekcja obiektów: identyfikacja i lokalizacja wielu obiektów na obrazie, często z rysowaniem ramek ograniczających.
- Segmentacja semantyczna: przypisywanie etykiety do każdego piksela obrazu, grupując piksele należące do tej samej kategorii obiektu.
- Segmentacja instancji: rozróżnianie poszczególnych wystąpień obiektów tej samej klasy (np. "pies 1", "pies 2").
- Śledzenie obiektów: monitorowanie ruchu obiektów w sekwencjach wideo.
- Rekonstrukcja 3D: tworzenie trójwymiarowych modeli scen lub obiektów na podstawie dwuwymiarowych obrazów.
Techniki wizji komputerowej wykorzystują algorytmy uczenia maszynowego, w tym głębokie sieci neuronowe (zwłaszcza konwolucyjne sieci neuronowe – CNN), do nauki wzorców i cech z ogromnych zbiorów danych wizualnych. Znajduje zastosowanie w autonomicznych pojazdach, medycynie (analiza obrazów medycznych), robotyce, systemach bezpieczeństwa, kontroli jakości w przemyśle oraz w interfejsach użytkownika.