본문 바로가기
Study_공부/경영학

데이터 분석_data mining, text mining, web mining

by smiletown10 2018. 7. 2.
반응형

▣ Data mining이란?


다른 말로 knowledge discovery in database라고 불린다

Datamining해서 그 결과 knowledge가 도출된다는 의미이다.

보통 gold mining하면 mining을 해서 gold를 얻는 것이지만, data mining에서는 data 자체를 mining하는 것이다.


Datamining의 분석기법은 총 5가지가 있다.(연관, 순차, 분류, 군집, 예측). 


연관 기법은 가장 많이 사용하며 x를 한 사람은 y를 꼭한다는 의미이다

순차기법은 순서대로 한다는 것으로 x를 한 다음 y가 발생할 때 시간차이가 존재한다는 것이다

분류기법은 data를 의미있는 class로 나누는 것으로 분류기준이 있다. 대표적으로 RFM분석( recency, frequency, money)가 있다

군집기법은 데이터 간 분포 및 거리를 측정해서 구분하는 것으로 분류기준은 없다

마지막으로 예측 기법이 있다

5가지 이지만 예측 기법을 제외하기도 한다.

 

▣ Text mining이란?


Text mining은 데이터를 분석할 때, 설문지를 분석할 때 사용된다

Sentiment analysis가 대표적이다. Sentiment analysis는 자사 혹은 자신에 대한 여론이 긍정적, 부정적, 중립적인지 알기 위해서 중요하며, 외부로부터 이러한 공격을 받을 수 있으니까 제대로 대응 할 수 있어야 한다.


▣ Web mining 이란?


Webminingwebpagemining하는 것으로 webpage를 복사붙여넣기하는 것이 아니라 


트위터 API, 구글 API등의 API로 데이터를 불러와서 분석하는 방법이다.



*API 란?


운영체제와 응용프로그램 사이의 통신에 사용되는 언어나 메시지 형식을 말한다. (출처; 네이버 지식백과)

JAVA 같은 것이다. 모든 CPU에 소프트웨어가 시행될수 있도록 API라는 어댑터를 끼게 된다.

반응형

'Study_공부 > 경영학' 카테고리의 다른 글

구매의사결정이란?  (0) 2018.08.13
BCG 매트릭스란?  (0) 2018.07.04
마이클 포터의 경쟁 모델을 이용한 IS 전략  (0) 2018.07.02
마케팅분석도구_SWOT분석  (0) 2018.06.22
마케팅_브랜드명 전략  (0) 2018.06.21