[정보관리기술사 129회 3교시 3번] 데이터 마이닝

## 이 글을 작성하는 지금 글 작성자는 3년차 주니어입니다.
정확한 정보가 아닐 수 있습니다.

정보관리기술사 129회 3교시 3번 문제입니다.

데이터 마이닝

데이터 마이닝에 대하여 다음을 설명하시오.

가. 데이터 마이닝과 통계의 차이점

데이터 마이닝 : 대규모로 저장된 데이터안에서 체계적이고 자동적으로 통계적 규칙이나 짜임을 분석하여 가치있는 정보를 추출해내는 과정.

통계 : 집단에 대한 현상을 체계적인 숫자로 표현한 것.

데이터마이닝과 통계의 정의로 비교해보았을 때 통계는 분석이나 정보의 추출이 들어가지 않은 Raw Data로서의 역할을 하는 반면, 데이터마이닝은 대규모 저장 데이터안에서 의미있고 가치있는 정보를 추출해내는 과정이 포함되어있다.

정리하자면, 통계는 Raw Data, 데이터 마이닝은 이 통계에서 의미있고 가치있는 정보를 추출해내는 과정으로 볼 수 있다.

또 다른 견해로는 가설이나 가정에 따른 분석, 검증을 진행하는 통계분석과 달리 데이터마이닝은 다양한 수리 알고리즘을 이용해 데이터베이스로부터 의미있는 정보를 추출해낸다는 차이점이 있다고 합니다.





나. 정형 데이터 마이닝과 비정형 데이터 마이닝의 차이점

정형 데이터마이닝비정형 데이터마이닝
데이터 형태구조화된 데이터
- 테이블
- 관계형 데이터베이스
- 행과 열로 이루어진 데이터
비구조화된 데이터
- 텍스트
- 이미지
- 비디오
분석 방법통계적인 방법
머신러닝 알고리즘
텍스트 마이닝
영상 처리
음성 인식
관련 알고리즘기계학습기법
- 분류, 회귀, 군집화, 연관규칙
딥러닝과 같은 심층학습 알고리즘




다. 오피니언 마이닝(Opinion Mining) 수행 절차를 설명하고, 텍스트 마이닝(Text Mining)과의 비교

오피니언 마이닝텍스트 마이닝
분석 대상텍스트 데이터에서 주관적인 의견, 감성, 태도를 추출하고 분석하는 것을 목적텍스트 데이터의 내용을 이해하고 유용한 정보를 추출하는 것에 중점
분석 방법감성 분석(Sentiment Analysis)과 같은 텍스트 데이터에서 주관적인 의견과 감정을 추출
주로 자연어 처리(NLP) 기술과 기계 학습 기법을 활용하여 텍스트 데이터를 분석

텍스트의 의미와 구조를 이해하고 정보를 추출
활용분야셜 미디어 감성 분석, 제품 리뷰 평가, 브랜드 감성 모니터링, 정치 선거 예측, 고객 의견 분석문서 분류, 정보 검색, 문서 군집화, 토픽 모델링, 텍스트 요약, 문서 감성 분석, 키워드 추출

– 오피니언 마이닝 수행절차
1. 데이터 수집
2. 데이터 전처리
3. 감성 분류
4. 감성 분석 및 특징 추출
5. 결과 분석 및 시각화
6. 응용 및 평가

– 텍스트 마이닝 수행절차
1. 데이터 수집
2. 데이터 전처리
3. 문서표현
4. 분석 및 모델링
5. 결과 분석
6. 응용 및 평가





정리하자면, 오피니언 마이닝은 데이터에서 감성적이고 주관적인 부분에서 의미있는 데이터를 추출하여 활용한다고 볼 수 있는 반면, 텍스트 마이닝은 데이터를 통해 내용을 이해하고 유용한 정보를 추출할 수 있는데 도움을 주는 데이터마이닝 기법으로 볼 수 있다.

 

 

Leave a Comment