텍스트 마이닝

1. 텍스트 마이닝의 정의
텍스트 마이닝이란? '텍스트에서 고품질 정보를 추출하는 과정(the process of deriving high-quality information from text)' 고품질 정보란? '패턴이나 트렌드를 통해 얻어짐을 말함'(High-quality information is typically obtained by devising patterns and trends)' 즉, 텍스트 마이닝이란 텍스트에 숨어있는 패턴을 발견하고 이용하여 어떤 사건을 예측할 수 있음을 말한다. 패턴을 찾을 수 있는가에 대한 질문에 대해 통계적 패턴 학습은 무엇이 있는가? 첫 번째로 대부분 정형적인 데이터(structured data)를 대상으로 하는 방법론으로 머신러닝이 있다. 비정형 텍스트 데이터를 정형화하는 작업도 필요하..