반응형
ㅇ 데이터 웨어하우스란?
관리자의 결정을 돕는 Subject-oriented, integrated, time-variant, nonvolatile의 특성을 갖는 데이터 집합이다.
“A data warehouse is a subject-oriented, integrated, time-variant, and nonvolatile collection of data in support of management’s decision-making process.”—W. H. Inmon
ㅇ Subject-Oriented
- 복잡하게 설명하고 있는데, 결론은 필요한 분야에 맞도록 주제를 정해서 데이터베이스를 만들라는 말인듯 하다.
ㅇ Integrated
- 결국 수 많은 곳에 분포되어 있는 데이터베이스가 있는 경우, 그걸 통합을 어떻게 할 것인가에 관한 것이다. 왜냐하면 각 데이터베이트는 같은 속성도 다르게 표현 할 수 있고, 형식 또한 다를 수 있기 때문이다.
ㅇ Time Variant
- 데이터베이스는 엄청나게 몇년(5~10년)동안 모아온 데이터일 수 있기 때문에 time element를 포함 할 수 있고, 어떤 시간적인 속성을 포함하고 있다?
ㅇ Nonvolatile
- 데이터웨어하우스에서는 갱신이 발생하지 않는다. 오직 두가지의 동작만 요구된다.
- 초기 데이터 로딩(initial loading of data)과 데이터 엑세스(access of data)
ㅇ Multi-dimensional Data Model
ㅇ Data Warehouse : A Multi-Tiered Architecture
정리
내 생각 : 데이터 웨어하우스는 결국 데이터베이스를 경영자 측면에서 보기 쉽게 만든 어떤 특이한 형태의 데이터베이스 통합버전 이라고 보면 될듯하다. 다시 말해서 결정을 하기 위한 데이터 베이스 이기 때문에 자주 업데이트를 할 필요도 없고 수년간 쌓아온 데이터를 어떤 작업을 통해 이쁘게 만들어서 경영자가 쉽게 논리적인 결정을 내릴 수 있는 하나의 수단이 되는 데이터베이스가 아닐까
OLAP : 이 또한 데이터 웨어하우스는 단순히 통합된 이쁜 데이터베이스라면 OLAP은 이 데이터베이스로 부터 사용자가 원하는 결과를 도출 해 낼 수 있는 하나의 인터페이스가 아닐까 싶다.
이 부분은 너무나 이론적인 부분이라, 책을 읽는 편이 날 듯하다.
본 게시물이 도움이 되었다면, 꾸~욱~ 눌러주세요.
포스팅 하는데 많은 힘이 됩니다~~~
반응형
'Study > 데이터 마이닝' 카테고리의 다른 글
[데이터 마이닝5] Cluster Analysis #2 (1) | 2012.06.15 |
---|---|
[데이터 마이닝5] Cluster Analysis #1 (0) | 2012.06.15 |
[데이터 마이닝 4] Classification And Prediction (0) | 2012.06.13 |
[데이터 마이닝 3] 마이닝 관련 알고리즘 (1) | 2012.04.23 |
[데이터 마이닝 1] 데이터 전처리 (1) | 2012.04.22 |