첫 모임에 세 팀원들이 서울역 위워크에 모였습니다.
- 캐글 사용법 (커널 사용법, 포크, 팀 구성 등)
- 본 컴페티션의 데이터 및 목적 파악
- 본 프로젝트의 진행 방향 이야기(전체적인 구조, 전처리, 기법, 참고할만한 강의와 예시 등)
위와 같은 항목들에 대해 이야기 나누었습니다.
함께 살펴본 내용들은 아래와 같습니다.
Description
- Quora is a platform that empowers people to learn from each other. On Quora, people can ask questions and connect with others who contribute unique insights and quality answers.
- Toxic and divisive content filtering.
- A key challenge is to weed out insincere questions -- those founded upon false premises, or that intend to make a statement rather than look for helpful answers.
- Develop more scalable methods to detect toxic and misleading content.
Evaluation
- F1 Score (조화평균)
- 이진 분류 문제 (0, *1)
참고 커널
- https://www.kaggle.com/deffro/text-pre-processing-techniques 영어에 필요한 전처리(정규 표현식, 불용어 및 축약어 처리 등)에 대해 설명된 커널
- https://www.kaggle.com/kernels/notebooks/new?forkParentScriptVersionId=8072036&userName=kyubong
딥러닝 프레임워크에 대해 설명된 커널
참고 강의
- https://www.inflearn.com/course/nlp-imdb-%ED%8C%8C%EC%9D%B4%EC%8D%AC-%EC%9E%90%EC%97%B0%EC%96%B4-%EC%B2%98%EB%A6%AC/
IMDB 영화리뷰 감정 분석을 통한 파이썬 자연어 처리 인프런 강의
- https://www.edwith.org/deepnlp/joinLectures/17363
조경현 교수 딥러닝을 이용한 자연어 처리 강의
향후 계획
- 중간 발표까지 다양한 방법론들을 적용하며 발생하는 의문점과 새로운 인사이트에 대해 이야기 나누며 모임을 진행. 이후에는 성능 향상을 위한 작업에 집중