NG팀 181208 회의 및 진행사항
1. 반어법 학습을 시키기 위한 방법
데이터 수집 : 드라마 vs 라디오
드라마 장점 : 대사집이 있다. 화자 구분가능.
드라마 단점 : 깔끔한 분리가 어렵다. 타임코드가 제공이 되지 않는다.(이것은 극복가능한 부분.)
라디오 장점 : 깔끔한 음원 수집 가능, 중첩음원이 거의 없다.
라디오 단점 : 대사집 유무, 그러나 자막처리로 확보 가능할 것이다.(어느정도의 오차는 존재함)
데이터 수집 후에 반어법을 사용하는 구간의 추출은 어떻게 할 것인가?
미해결
1) 반어법을 맞추는 구간
2) 반어법을 못맞추는 구간 : 상대방이 알지 못하는 반어법
3) 일반 의문문.
ex) 63빌딩에 어떻게 가요? -의문문
ex) 나 예쁘지 ? - 아니?, 그렇다치자! -> 반어법
=> 모든 상황에 맞는 인공지능은 1기에서는 무리가 따른다.
범위를 한정시켜 연구를 진행하는 방향으로 나아가자.