Hurtownia danych

Opis
Hurtownia danych – rodzaj bazy danych, która jest zorganizowana i zoptymalizowana pod kątem pewnego wycinka rzeczywistości.

Charakterystyka
Hurtownia danych jest wyższym szczeblem abstrakcji niż zwykła relacyjna baza danych (choć do jej tworzenia używane są także podobne technologie). W skład hurtowni wchodzą zbiory danych zorientowanych tematycznie (np. hurtownia danych klientów). Dane te często pochodzą z wielu źródeł, są one zintegrowane i przeznaczone wyłącznie do odczytu.

W praktyce hurtownie są bazami danych integrującymi dane ze wszystkich pozostałych systemów bazodanowych w przedsiębiorstwie. Ta integracja polega na cyklicznym zasilaniu hurtowni danymi systemów produkcyjnych (może być tych baz lub systemów dużo i mogą być rozproszone).

Architektura schematu hurtowni danych
Hurtownia danych jest z definicji systemem, ktory gromadzi dane o dzialalnosci danego przedsiebiorstwa zarowno te biezace jak i historyczne. Jej glownym zadaniem nie jest przetwarzanie tranzakcyjne (systemy OLTP) ale przetwarzanie analityczne (systemy OLTP) - czyli pomoc kierownictwu w podejmowaniu decyzji biznesowych dotyczacych danego przedsiebiorstwa poprzez transformacje danych w uzyteczna informacje przy uzyciu narzedzi BI, roznego rodzaju raportow, analiz OLAP czy data mining'u. Uwzgledniajac wymagania jakie sa stawiane przed hurtownia danych przy projektowaniu jej schematu danych nalezy szczegolnie zwrocic uwage na dwa aspekty :


 * bardzo duza ilosc danych (biezace + historyczne)


 * osiagniecie zadawalajacego poziomu efektywnosci zapytan analitycznych.

Aby sprostac tym wymaganiom na potrzeby hurtowni danych zostaly stworzone wyspecjalizowane schematy fizyczne danych. Do podstawowych schematow hurtowni danych zaliczamy:

- schemat gwiazdy (star schema)

- schemat platka sniegu (snowflake schema)

- schemat konstelacji faktow (fact constellation schema, starflake schema)