Xinterest 팀은 자연어 처리를 통한 매체의 성향 분석을 목표로 하고 있습니다. 성향 분석이란 대상에 대하여 긍정적인지, 부정적인지 등을 포함하며, 나아가 사회의 다양한 주제들에 대하여 어떤 연관관계를 가지고 있는지 파악해 보는 것을 주제로 합니다.
언어로부터 정보를 추출하는 과정을 텍스트 마이닝(Text mining)이라 합니다. 언어 뭉치에서 단어들의 빈도 또는 연관 관계 등을 분석할 수 있고, 이 정보들로부터 새로운 정보들을 이끌어낼 수 있습니다. 공학적으로는 단어간의 관계를 수학적으로 분석하여 벡터 공간으로 사상(m