연구성과
최종 데모데이를 통해서 현재까지 연구한 결과물을 발표하고 정보를 공유하는 뜻깊은 시간이 되었습니다.
3가지 접근 방식을 통해서 감정 분석을 시도 하였고 의미있는 결과물을 만들었습니다.
첫번째 접근 : 분류 결과에 대한 차원축소 접근
A. 목적 : 가지고 있는 데이터를 기반으로, 6가지(감정으로) “적절하게”분류하고자 함
B. 과정 : tokenizing 이후 선형변환을 통해 단어를 분류, 문장분류까지 확장하고자 함 - AAE 방법을 통해, 단어 분류를 2차원에 표기
C. 한계 : 현재 coding이 진행되지 못함
두번째 접근 : 사전을 이용한 감정분류 접근
A. 목적 : 한글 사전이 없다는 것을 전제로, 영문 사전을 활용한 문장/단어 분류 진행
B. 과정 : tokenizing 이후, 주어진 사전을 통해 단어/문장을 분류하고자 함.
- (사전의 n가지 분류 후, 조합 또는 2차원 분포를 하는 방식으로 설정함)
C. 한계 : 단어/문장에 대한 구분이 명확하지 않았음
- 이후, 문장분류/단어분류로 구분하여 각각이 진행됨
세번째 접근 : 문장에 label이 있는 자료 분류
A. 목적 : 가지고 있는 데이터를 기반으로, 6가지(감정으로) “적절하게”분류하고자 함
B. 과정 : tokenizing 이후, 딥러닝 모형을 통해 문장을 분류하고자 함 - 각 모델 (NN / CNN / RNN)별로 결과를 비교/분석 (learning tool : Keras)
C. tip : CNN 학습시, 10개의 단문을 합쳐 하나의 data 단위로 설정함
- 차원을 적정수준으로 설정하여 학습, 이후 결과문장은 단문으로 test 가능
관련링크
두번째 접근 : 사전을 이용한 감정분류 접근
( code: https://github.com/KyoungHa-Park/NLP_lab )
세번째 접근 : 문장에 label이 있는 자료 분류
( code : https://github.com/goodhhw1112/nlp )
NLP 기본이론 정리
( presentation : https://www.slideshare.net/dongjolim7/tf-idf-123609543 )
3개월동안 고생 많으셨습니다.