[일일리포트] Day 90 (FinalProject_9)

해당 일일리포트에서는 네이버 커넥트에서 진행하는 '부스트캠프 AI Tech 3기'에서 배운 내용을 다루고 있습니다. 저작권 이슈 때문에 관련 자료를 올릴 수는 없기에 핵심 이론과 코드를 요약해서 올리고 있기에 내용이 부족할 수 있습니다.
▶ Today I Learned (핵심 요약 정리)
FinalProject_9 (모델 실험 및 와이어프레임)
이전의 와이어프레임은 웹 형식으로 만들어져 있었는데, 접근성이 어렵고 우리가 생성한 QA 데이터 형식이 구어체로 되어 있기 때문에 챗봇 형식을 차용하고자 했다. 그래서 간단하게 와이어프레임을 작성해서 팀원들과 공유했고, 어느정도 방향을 잡게 됐다. 다음 주 부터는 서빙 쪽에 시간을 투자해서 프로젝트를 최대한 구체화하는 쪽으로 방향을 잡고자 한다.
또한, 모델도 계속해서 실험을 진행하고 있는데 어제 자기 전 파라미터 튜닝을 해놓은 모델에 대해서 분석을 진행했고, 성능이 좋은 것들을 기준으로 모델 테스트를 수행했다. 모델의 성능 판단 기준으로는 loss와 F1 중 어느 것으로 해야하는지에 대한 얘기가 나왔었는데, 동일한 모델에서 나온 체크포인트 파일 중 F1이 높은 것과 loss가 낮은 모델을 가져와 Inference를 수행했을 때, F1이 높은 경우 Score가 더 높았다. 따라서 이번 프로젝트에서 reader모델을 선정할 때 F1을 기준으로 잡을 것 같다. 추가적으로 이번 튜닝 결과 어느정도 성능 향상이 있던 모델은 가장 기본적인 klue/roberta-large모델이었기 때문에 이전 대회 때 만들어 둔 모델을 통해서도 하이퍼 파라미터 튜닝을 진행하는데 성능 향상이 있어 보이고, Reader모델에 대한 추가적인 실험은 여기서 멈추는 것도 좋은 것 같다는 생각이 든다.
▶ Review (생각)
오늘은 뭔가 열심히 하려고 했는데, 또 막상 한 것을 보면 그렇게 많이 한 것 같지 않다는 생각이 드는 것 같다. 아무튼 오늘은 모델 Product Serving 단계에서 구조를 아예 바꿔, 챗봇 형식으로 제안을 했는데 반응이 긍정적이어서 다행이었다. 내일은 다른 일이 있어서 프로젝트를 하기 좀 어려울 것 같기는 한데, 일요일부터는 FastAPI 강의를 정리하고, 실습과 최종 프로젝트를 같이 병행하는 방식으로 FastAPI와 Streamlit을 동시에 공부해봐야겠다. 내가 주장한 거니까 다음 주까지 어느정도 그림을 그려놔야, 그래야 바로 서빙 단계를 진행할 수 있을 것 같다.
이번 주 회고는 주간 회고에서 정리해야겠다.