[데이터 마이닝 2] 데이터 웨어 하우스 & OLAP (data warehouse & Online Analytical Processing)

2012. 4. 22. 23:20

ㅇ 데이터 웨어하우스란? 

   관리자의 결정을 돕는 Subject-oriented, integrated, time-variant, nonvolatile의 특성을 갖는 데이터 집합이다.

“A data warehouse is a subject-oriented, integrated, time-variant, and nonvolatile collection of data in support of management’s decision-making process.”—W. H. Inmon

ㅇ Subject-Oriented
  - 복잡하게 설명하고 있는데, 결론은 필요한 분야에 맞도록 주제를 정해서 데이터베이스를 만들라는 말인듯 하다.

ㅇ Integrated
  - 결국 수 많은 곳에 분포되어 있는 데이터베이스가 있는 경우, 그걸 통합을 어떻게 할 것인가에 관한 것이다. 왜냐하면 각 데이터베이트는 같은 속성도 다르게 표현 할 수 있고, 형식 또한 다를 수 있기 때문이다.

ㅇ Time Variant
   - 데이터베이스는 엄청나게 몇년(5~10년)동안 모아온 데이터일 수 있기 때문에 time element를 포함 할 수 있고, 어떤 시간적인 속성을 포함하고 있다?

ㅇ Nonvolatile
   - 데이터웨어하우스에서는 갱신이 발생하지 않는다. 오직 두가지의 동작만 요구된다.
         - 초기 데이터 로딩(initial loading of data)과 데이터 엑세스(access of data)

ㅇ Multi-dimensional Data Model




ㅇ Data Warehouse : A Multi-Tiered Architecture



정리

내 생각 : 데이터 웨어하우스는 결국 데이터베이스를 경영자 측면에서 보기 쉽게 만든 어떤 특이한 형태의 데이터베이스 통합버전 이라고 보면 될듯하다. 다시 말해서 결정을 하기 위한 데이터 베이스 이기 때문에 자주 업데이트를 할 필요도 없고 수년간 쌓아온 데이터를 어떤 작업을 통해 이쁘게 만들어서 경영자가 쉽게 논리적인 결정을 내릴 수 있는 하나의 수단이 되는 데이터베이스가 아닐까 

   

OLAP : 이 또한 데이터 웨어하우스는 단순히 통합된 이쁜 데이터베이스라면 OLAP은 이 데이터베이스로 부터 사용자가 원하는 결과를 도출 해 낼 수 있는 하나의 인터페이스가 아닐까 싶다.


이 부분은 너무나 이론적인 부분이라, 책을 읽는 편이 날 듯하다.

 

본 게시물이 도움이 되었다면, 꾸~욱~ 눌러주세요.

포스팅 하는데 많은 힘이 됩니다~~~