국문과 유목민

[일일리포트] Day 55 (Level2_PStage_11) 본문

IT 견문록/2022_부스트캠프 AITech 3기(100일)

[일일리포트] Day 55 (Level2_PStage_11)

논곰 2022. 4. 7. 23:11

해당 일일리포트에서는 네이버 커넥트에서 진행하는 '부스트캠프 AI Tech 3기'에서 배운 내용을 다루고 있습니다. 저작권 이슈 때문에 관련 자료를 올릴 수는 없기에 핵심 이론과 코드를 요약해서 올리고 있기에 내용이 부족할 수 있습니다.

▶ 오늘 한 일

모델 앙상블 

 프로젝트 마지막 날이라 성능을 끌어올릴 수 있게 팀원들과 상의를 해서 모델 앙상블을 진행했다. 팀원들과 2시부터 7시까지 지금까지 제출했었던 모델들을 하나씩 보면서 어떻게 조합하면 좋을 지 많이 상의를 했었다. 오늘 하루 남은 제출 중 8번 이상을 앙상블 모델을 만들어 제출했는데, 결과적으로 마지막 앙상블 모델에서 가장 높은 성능을 달성할 수 있었다. 

모델 Ensemble을 진행하면서, Ensemble 진행 이전과 이후 모델의 Difference나 Label Distribution등을 비교하고 실제 예측 Label 등을 Print해 보기도 했다. 그 과정에서 많은 가설들을 세웠고, 어떤 모델들을 Ensemble할 지에 대해서 생각을 오래했었던 것 같다. 최종적으로 비슷한 성적을 가지지만, 다르게 학습된 모델들을 Ensemble했을 때 가장 좋은 성능을 얻을 수 있었다.  해당 앙상블이 좋은 성적을 낼 수 있었던 이유로는 각 모델이 예측하는 Label의 값이 서로 달랐기 때문에 좀 더 덜 편향적인 모델이 될 수 있었을 것이라고 본다. Public에서는 6등 정도로 마무리 됐었는데, Private에서 1등이 올라서 4등으로 마무리를 할 수 있었다.

 초기 우리 팀의 목표는 이전 기수의 점수만 넘어보자는 것이었다. 그리고 그 목표를 달성했었고, 또 나름 상위권으로 마감을 했기 때문에 다들 만족한 점수였다. 

▶ 내일 할 일

  • Wrapup 리포트 작성
  • 팀원들과 후기 나누기

앙상블을 하는 내 모습...