Hurtownie danych – wprowadzenie

Witam na blogu, poświęconym zagadnieniom związanym z hurtownią danych. Chciałabym w tym miejscu przedstawić podstawowe pojęcia związane z samym rozwiązaniem problemu rozproszenia danych, jak i z ich analizą.

Czy hurtownie danych są w ogóle potrzebne? Wyobraźmy sobie następującą sytuację. Mamy za zadanie przeprowadzić kompleksową analizę wszelkich danych, które pozwolą na podniesienie efektywności danej firmy. Dane, którymi dysponujemy są rozproszone, co sprawia, że tworzymy wielostronnicowe raporty każdej z nich, a następnie z kilkusetnego raportu staramy się wydobyć sedno tak, aby do naszego szefa trafiły tylko te informacje, które pozwolą na podjęcie kluczowych decyzji. Oprócz tego, że dane są rozproszone bardzo często umieszczone są w różnych systemach bazodanowych, co z kolei wydłuża czas, jaki musimy przeznaczyć na zapoznanie się z każdym z nich. Jakby tego było mało informacji jest tak dużo, że ciężko je segregować, czy przetwarzać w taki sposób, którego akurat potrzebujemy. Te główne czynniki, a także kilka mniejszych składają się na to, że nasza praca wydłuża się kilkakrotnie, a w ostateczności szef i tak nie jest zadowolony i każe wprowadzić poprawki, albo co gorsza wykonać raport raz jeszcze.

Właśnie dlatego powstają hurtownie danych (data warehouse), które są wydzielonymi centralnymi bazami danych służącymi właśnie do zarządzania organizacją, w której występuje nadmiar informacji. Ich struktura i narzędzia sprzyjają sporządzaniu analiz (gromadzi dane w sposób tematyczny), a dane w nich zawarte są kopiami tych, które znajdują się w poszczególnych bazach operacyjnych. Ich dodatkową zaletą jest przechowywanie tzw. zmaterializowanych agregatów, czyli wyliczonych wartości obliczeń, w tym sum i średnich, pozwalające na uzyskanie informacji za pośrednictwem paru kliknięć. Kolejną zaletą hurtowni jest fakt, iż w momencie dostarczania nowych danych zestawienia i wyliczenia automatycznie się aktualizują. Dodatkowo liczba danych w hurtowni stale rośnie, gdyż nic nie jest usuwane.

Właśnie ze względu na te cechy hurtownie danych zdają się mieć rację bytu, nawet w mniejszych organizacjach, gdyż czas przeznaczony na podejmowanie kluczowych decyzji znacznie się skraca.

Leave a Reply

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *