연구활동
중간발표 이후에 각각의 연구방향성을 확장하는 시간을 가졌습니다. 연구원 분들마다 감정분석을 할 수 있는 다양한 방법을 연구하였고 그 결과를 공유 할 수 있는 시간이었습니다.
- 허형완 / 랩장 :
이전에 확보한 ISEAR데이터 기준으로 LSTM을 이용한 학습 모델을 구현해보았습니다. 하지만 Overfitting이 발생하며 학습이 30%이상 오르지 않는 문제를 확인하였으며, RNN으로 문장을 multi-classification이 힘들다는 결과를 냈습니다. 현재는 CNN을 이용한 문장단위의 분류를 위한 모델을 구현하고 있습니다.
- 박경하 / 연구원 :
R을 이용하여 tidytext(깔끔한 텍스트 방식)로 단어단위의 감정분석을 연구했습니다.
문서를 단어단위로 변환 후 tidytext에 포함되어 있는 감정사전을 기준으로 감정분석하는 방식을 사용하였습니다.
긍부정 단어 및 감성 추세, 감성 표현에 많이 사용된 단어들에 대해서 결과를 그래프로 도출해 냈으며 다양한 감성분석이 가능하다는것을 보여주었습니다.
- 임동조 / 연구원 :
텍스트 데이터 분석에 대해서 자세히 연구하였습니다. 텍스트 분석 절차와 데이터 마이닝과 텍스트 마이닝의 차이, 형태소 분석 방법 및 텍스트 전처리 등 핵심적인 요소를 확인하였으며 연구 결과를 리뷰하는 자리를 가졌습니다. 또한 TF-IDF를 이용하여 문서의 유사도 및 중요한 단어를 계산하는 알고리즘을 구현하였습니다.
토의내용
현재까지 적용된 사항들을 리뷰하는 자리를 가졌으며 다음 모임까지 완료 할 부분들에 대한 계획을 세웠습니다. 오토 인코더를 이용한 감성분석의 시각화와 word2vec과 TF-IDF의 차이 및 문장단위의 감정분류를 연구하고 취합하여, 데모데이에 마지막 결과물을 공개할 수 있도록 준비하는 시간을 가졌습니다.