슈코딩

[머신러닝] 모델설계 본문

개발일지/Project

[머신러닝] 모델설계

Roshu 2022. 5. 24. 22:35

 

머신러닝 프로젝트를 진행을 하던중 우리팀원은 각자 모델을 한번씩 만들어서 가장 좋은 이미지분류 모델을 

사용하기로 결정했었다. 이에 앞서서 머신러닝에 대해 배운강의를 토대로 모델을 만들었어야했는데,

그렇게 하면 너무 배우는게 없을것 같아서 여러가지 모델을 참고로 조합하기로 결정했다.

 

그러나 이생각이 곧 엄청난 벽을 느끼게 만드는 계기가되었다. 우선은 튜토리얼들의 코랩 코드들을 참고해서

우리가 사용할 이미지 데이터셋을 적용시켜보고싶었는데, 대부분 튜토리얼이 케라스내부의 데이터셋을 가지고 

학습을 시켜서 다운로드받은 데이터셋을 적용시키는데도 간단하지가 않았다. 

이렇게 데이터를 케라스에서 가져오는 반면 나는 캐글에있던 데이터셋중에서도 12클래스에서 4개의 클래스로

추려낸 데이터셋을 따로 저장을해놨었기때문에 이것을 적용시키는 코드를 찾는것부터 헤맸었다.

우선은 구글드라이브를 마운트 시켜서 연동을 했고

base_dir라는 변수로 경로를 지정해줘서 사용을했다. 이후부터는 튜토리얼의 코드들을 적용시켜보면서 

하나 둘씩 적용해갔다. 하지만 생각했던만큼 단순한 코드들은 적용이됐지만,

전이학습을 시키거나 이미지증강기법을 적용시키니 학습이 진행이 안되고 에러가 계속 났었다.

확실히 1주일만에 머신러닝을 하기에는 벅찼고, 쉬운 분야가 아니다보니 많은 어려움을 느꼈었다.

 

팀원들의 모델성능을 비교하기로한 날에 팀장님의 모델을 보고 정확도도 높고 잘 구성한것을보고

어떻게 했냐고 물으니 캐글데이터셋에 다른사람들이 그 데이터셋을 사용해 만든 모델들을 

보고 참고해서 만들었다고했다. 캐글데이터셋을 나도 활용해봤다면하는 아쉬움이 남지만,

다음엔 내가 만든 모델로 사물인식이나 이미지분류를해서 프로젝트를 만들어보고 싶단 생각을

했다. 머신러닝 정말 어렵지만 그렇기에 더 잘하고싶다는 그런 생각을 했던것같다.

내가 만든 모델은 정확도도 60%고, 그래프도 뒤죽박죽이지만 다음에는 더 높아지지 않을까..?

 

우리팀의 모델(팀장님)

https://colab.research.google.com/drive/1WZ6FJdBVtcZtJaod0B-5VqzH2OiSJ1H5?usp=sharing 

 

10cycle.ipynb

Colaboratory notebook

colab.research.google.com

 

Comments