국문과 유목민

[10주차] 개인회고 본문

IT 견문록/2022_부스트캠프 AITech 3기(100일)

[10주차] 개인회고

논곰 2022. 3. 25. 23:41

1) 강의 복습 내용

Day 42

 

[일일리포트] Day 42 (NLP 개괄, 전처리, BERT)

해당 일일리포트에서는 네이버 커넥트에서 진행하는 '부스트캠프 AI Tech 3기'에서 배운 내용을 다루고 있습니다. 저작권 이슈 때문에 관련 자료를 올릴 수는 없기에 핵심 이론과 코드를 요약해서

cold-soup.tistory.com

Day 43

 

[일일리포트] Day 43 (단일 문장 분류)

해당 일일리포트에서는 네이버 커넥트에서 진행하는 '부스트캠프 AI Tech 3기'에서 배운 내용을 다루고 있습니다. 저작권 이슈 때문에 관련 자료를 올릴 수는 없기에 핵심 이론과 코드를 요약해서

cold-soup.tistory.com

Day 44

 

[일일리포트] Day 44 (두 문장 관계 분류)

해당 일일리포트에서는 네이버 커넥트에서 진행하는 '부스트캠프 AI Tech 3기'에서 배운 내용을 다루고 있습니다. 저작권 이슈 때문에 관련 자료를 올릴 수는 없기에 핵심 이론과 코드를 요약해서

cold-soup.tistory.com

Day 45

 

[일일리포트] Day 45 (Level2_PStage_1)

해당 일일리포트에서는 네이버 커넥트에서 진행하는 '부스트캠프 AI Tech 3기'에서 배운 내용을 다루고 있습니다. 저작권 이슈 때문에 관련 자료를 올릴 수는 없기에 핵심 이론과 코드를 요약해서

cold-soup.tistory.com

Day 46

 

[일일리포트] Day 46 (Level2_PStage_2)

해당 일일리포트에서는 네이버 커넥트에서 진행하는 '부스트캠프 AI Tech 3기'에서 배운 내용을 다루고 있습니다. 저작권 이슈 때문에 관련 자료를 올릴 수는 없기에 핵심 이론과 코드를 요약해서

cold-soup.tistory.com

2) 과제 수행 과정 / 결과물 정리

3) 피어세션 정리

 이번 주 피어세션의 경우 프로젝트 주간이라서 프로젝트만 할 것이라 생각했지만, 생각보다 강의의 퀄리티가 너무 좋았다. 그래서 팀원들과 얘기를 해서 화요일까지 강의를 좀 들었다. 강의를 들으면서 스페셜 미션도 진행하고, 강의에 대한 내용들을 같이 공부했는데 급한 마음이 들지 않았다.

 수요일부터 프로젝트를 진행하기 위한 회의를 진행했다. git commit rule에 대해서 얘기도 하고, 프로젝트 칸반보드 사용법도 얘기하고, wandb사용 등에 대해서도 얘기를 하면서 몇 가지 규칙을 설정했다. 그리고 데이터 EDA와 전처리 학습을 진행했다.

 데이터 전처리는 다양한 측면에서 중복 데이터 및 Label 잘못된 데이터 제거하고, Sentence에서 발생하는 기호나 한자 등을 분류할 수 있는 코드를 만들었다. 추가적으로 학습 데이터를 load할 때 발생하는 부분들도 살펴보면서 코드들을 수정했다. 금요일 오전으로 해서 데이터 전처리 작업을 다 끝냈고, 이제 모델 개선을 위한 다양한 방법을 시도하고자 한다. 

4) 학습 회고

 이번 주 학습의 경우 꽤 만족스러웠다. 저번 주 코로나로 인해서 제대로 학습을 하지 못한 것 같아 내심 아쉬워서 이번 주에 조금 더 열정적으로 임하려고 헀던 것 같다. 그리고 수요일에 팀프로젝트를 진행하면서 팀원들에게 git 사용을 건의하면서 이번 프로젝트가 포트폴리오가 될 수 있게 잘 준비해보자라고 얘기를 했었다. 그런데 금요일 팀 회고를 진행하면서 긍정적으로 반응을 해주셔서 내심 다행이었다. git을 다루는데 나도 아직 익숙하지 않았기 때문에 '얘기를 먼저 꺼내놓고 무책임하네'라는 생각이 안들게 필요한 부분에 대해서 공부했는데, 그렇게 공부하면서 나도 더 익숙해졌다. 그리고 프로젝트 칸반보드를 잘 활용하시고, 아직은 git사용에 익숙하지 않지만 우리가 만든 규칙을 하나하나 적용시켜가면서 협업을 하는 모습을 보니 뿌듯했다. 

 추가적으로 오늘 멘토링 중 협업에 대한 얘기를 하다가 멘토님께서 Generalist와 Speciallist에 대해서 말씀을 하셨다. 협업을 할 때, '어느 부분을 하셨나요?'라는 질문에 대해 '전 과정에 다 참여했어요'라는 대답은 매력적이지 않다는 말씀을 하셨다. 나도 어느정도 공감을 했고, 현재 우리 팀의 경우 배우자는 입장으로 다같이 전 과정에 참여하기로 했기 때문에 얘기를 나누게 됐다.

 그리고 결론적으로 General하게 참여했다고 하더라도 Special한 부분을 가지고 있어야 한다는 것이었다. 당연한 얘기일 수도 있겠지만, 이를 의식하는 것과 의식하지 않는 것의 차이는 큰 차이가 있다. 모두 같은 과정에 참여했더라도 세부적으로 한 일이 다를 것이고, 그 과정에서 어떤 Task를 왜 수행했는지 그리고 어떻게 수행했는지에 대해서 설명할 수 있다면 충분히 해당 Task에 대해서 Specialist로 참여했다고 볼 수 있다고 생각한다. 그리고 멘토님께서도 그런 식으로 준비하고 정리할 수 있다면 모두 다 같이 참여했다고 하더라도 충분히 어필할 수 있을 것 같다고도 말씀을 해주셨다. 그래서 앞으로는 모두 다 같이 참여하더라도 내가 수행하는 Task에 대해 잘 이해하고 정리해야겠다는 생각을 했다.    

 오늘까지 데이터 부분에서 할 수 있을만한 부분은 해결한 것 같다. 그래서 다음 주에는  Input데이터를 어떻게 태깅해서 넣어줄 지, 어떤 Tokenize를 사용해야 할 지 등에 대해서 생각하고 실험을 진행할 것 같다. 느리지만 확실하게 짚고 넘어가야겠다. 그리고 다들 실력좋고 성격도 좋은 팀원들인 것 같아서 급하지 않게 꼼꼼히 갈 수 있을 것 같다.

중요한 것은 '내가 얼마나 했다'를 얘기할 수 있는 자신감인 것 같다.

 

Comments