Opis projektu

Cel projektu

Celem projektu jest stworzenie zbioru oznaczonych danych na podstawie, których będzie możliwe wyszkolenie sieci neuronowej umożliwiającej skuteczne wykrywanie obiektów na powierzchni wody z perspektywy lotu ptaka. Projekt ten (razem z wyszkoleniem powyższej sieci) jest tematem mojej pracy inżynierskiej na Akademii Górniczo-Hutniczej w Krakowie, o dokładnym tytule: „Wykrywanie obiektów dryfujących dla celów ratunkowych z wykorzystaniem metod widzenia komputerowego”.

Krótko o sieciach neuronowych i widzeniu komputerowym

Widzenie komputerowe to dynamicznie rozwijająca się dziedzina nauki ściśle związana ze sztuczną inteligencją. Programy oparte o sieci neuronowe (struktury matematyczne wzorowane na biologicznym mózgu) na podstawie bardzo dużej ilości oznaczonych danych są wstanie „nauczyć się” jak wyglądają konkretne obiekty i rozpoznawać je na zdjęciach lub filmach. Proces uczenia się maszyny różni się jednak od tego jak ludzie uczą się klasyfikować obiekty. Przykładowo, gdybyśmy pokazali człowiekowi jabłko, który nigdy wcześniej go nie widział i powiedzieli, że tak wygląda jabłko, prawdopodobnie umiałby on od razu rozpoznać go na innych zdjęciach, pod innym kątem i w innym otoczeniu. Natomiast komputer musi wpierw zobaczyć wiele (mowa tu o tysiącach) zdjęć, na których oznaczony i nazwany będzie dany obiekt w zmieniających się warunkach zewnętrznych, aby później umieć go sklasyfikować. Właśnie dlatego tak istotną rolę w uczeniu komputerowym (a zarazem też w widzeniu) odgrywa duży i różnorodny zbiór danych. Innym wymaganiem jest bardzo duża moc obliczeniowa, ponieważ komputer musi wielokrotnie analizować te same obrazy, wykonując za każdym razem tysiące obliczeń. Dlatego też do wyszkolenia sieci neuronowej, która będzie wykrywać obiekty w moim projekcie zostanie użyty Prometeusz – jeden z najpotężniejszych komputerów w Polsce.

Przykłady działania mojego obecnego programu (poniższe obiekty zostały oznaczone przez komputer)

Oznaczony zbiór danych

Aby tworzony przeze mnie program był użyteczny musi on umieć rozpoznawać obiekty niezależnie od warunków w jakich będzie używany. Powinien on umieć klasyfikować konkretne dryfujące obiekty niezależnie od wysokości na jakiej znajduje się dron, koloru wody, zafalowania i innych zmiennych środowiskowych. W tym celu dane, na których uczy się program muszą być zróżnicowane i najlepiej zebrane z różnych akwenów.

W te wakacje wynajętym dronem wykonałem kilka filmów nad polskim morzem i to głównie na nich na razie bazuje mój program. Chciałbym jednak ulepszyć jego działanie dodając do danych, na których się on szkoli również materiały z innych miejsc. W tym celu serdecznie proszę o przesyłanie, w celu ulepszenia mojego projektu, swoich zdjęć i filmów wykonanych z drona.

Co jednak znaczy, że dane są „oznaczone”?

Komputerowi do nauki nie wystarczą zwykłe zdjęcia lub filmy, potrzebuje on jeszcze wiedzieć co się na nich znajduje. Dlatego też wszystkie dane jakie mam dostępne do nauki muszę manualnie oznaczyć – zaznaczyć dla maszyny, że w tym miejscu znajduje się człowiek, a w tym motorówka itd. Oznaczone zbiory danych stanowią dużą wartość w świecie widzenia komputerowego. Nie istnieje żaden publicznie dostępny duży zbiór danych obiektów na powierzchni wody wykonany z drona, dlatego po stworzeniu swojego projektu chcę udostępnić na tej stronie wszystkie zebrane i oznaczone przeze mnie dane dla innych programistów z całego świata, aby mogli je wykorzystać do swoich projektów naukowych. Jeśli zdecydujesz się na przesłanie choćby kilku minut swoich filmów będziesz miał również w tym swój udział.

Przykłady oznaczonych zdjęć, na których obecnie szkoli się mój program

Gdzie może przydać się taka technologia?

Taka technologia miałaby usprawnić poszukiwania osób i obiektów (np. statków) zaginionych na morzu, pomóc w rozpoznaniu sytuacji (np. w przypadku katastrofy okrętu oszacować ile osób znajduje się w wodzie i jak duża pomoc jest potrzebna), odpowiednio wyposażony dron mógłby nawet samodzielnie przeprowadzić akcje ratunkową dla pojedynczej topiącej się osoby. Dodatkowo ze względu na to, że po wykonaniu przeze mnie pracy inżynierskiej cały zbiór danych zostanie udostępniony do publicznego użytku, możliwe jest, że inni programiści wpadną na inne pomysły i wykorzystają go do stworzenia odmiennych projektów.

Kliknij w poniższy przycisk, aby wesprzeć mój projekt przesyłając tak potrzebne mi zdjęcia i filmy.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *