Remedium na problemy we wdrażaniu hurtowni danych

Robert Wojtachnik
(Gazeta IT nr 8(38), 12 września 2005 http://www.gazeta-it.pl/trendy/git38/ remedium_problemy_hd.html, 6 str.)

 

Na świecie działa wiele firm zajmujących się produkcją oprogramowania do budowy i obsługi hurtowni danych. Wdrożeniami hurtowni danych zajmują się producenci jak i wyspecjalizowane przedsiębiorstwa. Większość światowych liderów działa również w Polsce. Gro z nich ma wypracowaną metodykę wdrożenia hurtowni danych. Projekty tego typu należą zazwyczaj do dużych przedsięwzięć.

Jak wskazują badania przeprowadzone przez firmę Infovide odsetek nieudanych przedsięwzięć informatycznych sięga kilkadziesiąt procent ( w zależności od wielkości projektu). Pomimo, iż technologia budowy hurtowni danych jest istotna, nie można jednoznacznie stwierdzić, że odsetek pozytywnie zakończonych projektów realizowanych w technologii Oracle jest wyższy, niż np. w technologii MS SQL. Specjaliści oceniają, że znaczący wpływ na powodzenie ma stosowana metodyka prowadzenia projektu budowy hurtowni danych oraz planowanie organizacyjne i biznesowe.

Poniższa tabela przedstawia, jaki wpływ na efekt końcowy ma wielkość projektu oraz wybrana metoda wdrożenia. Porównano dedykowane metody oraz uniwersalne. Na podstawie wspomnianych badań można jednoznacznie stwierdzić, że metoda opracowana do implementacji wybranego rozwiązania jest bardziej skuteczna od uniwersalnych metod. Dla przedsięwzięć małych procent osiągnięcia sukcesu przy użyciu dedykowanej metody jest większy o 21% w stosunku do metod uniwersalnych. W przypadku projektów dużych różnica ta wynosi 11%. Dowodzi to potrzebom projektowania dedykowanych metod budowy hurtowni danych.  

Tabela 1. Wyniki końcowe projektów w zależności od wielkości przedsięwzięcia [1]

Rozmiar projektu

Dedykowana metoda

Uniwersalna metoda

% sukcesu

% porażki

% sukcesu

% porażki

Duży

78

5

69

9

Średni

73

5

73

7

Mały

80

2

59

16

Autor zaproponowała własną metodę. Poniżej zostaną opisane jej elementy odpowiedzialne za przeciwdziałanie problemom w trakcie procesu wdrożeniowego. Zaproponowano zastosowanie czterech technik zarządczych, którymi są zarządzanie ryzykiem, zarządzanie jakością, zarządzanie zasobami i zarządzanie zmianami.

Zarządzanie ryzykiem

         Identyfikacja ryzyka w projektach informatycznych polega na określaniu, jakie zdarzenia mogą mieć wpływ na projekt oraz na udokumentowaniu każdego z nich. Nie jest to działanie jednorazowe. Powinno być podejmowane w regularnych odstępach przez cały czas trwania projektu. Istnieje szereg metod oceny ryzyka. Autor proponuje użycie  metody katalogu czynników ryzyka. Katalog stworzono w oparciu o analizę zmiennych, które mogą mieć wpływ na stan danego systemu. Ryzyko przedstawione w poniższej tabeli jest mierzone w kategoriach R (prawdopodobieństwo), O (wpływ na operację), F (wpływ na finanse).

Tabela 2. Katalog czynników ryzyka

Źródło: Opracowanie własne

Kategoria ryzyka

Wskaźnik

Skala oceny

O

F

R

Czynniki zewnętrzne

Wskaźnik równolegle przebiegających projektów

Y=3, N=0

 

 

 

Planowany rozmiar niezbędnych środków zewnętrznych

Y=2, N=0

 

 

 

Czy współpracowaliśmy już z firmą która bierze udział w projekcie

Y=0, N=1

 

 

 

Zagrożenia organizacyjne

Niezbędne zmiany organizacyjne

Y=2, N=0

 

 

 

Poziom zmian do wprowadzenia w procedurach pracowników

Wysoki=3, Niski=1

 

 

 

Kluczowi użytkownicy nieuwzględnieni w projekcie

Y=5, N=0

 

 

 

W ilu lokalizacjach będzie wdrażana hurtownia danych

Wysoki=3, Niski=1, Jedna=0

 

 

 

Czy klient sam przygotowuje instrukcje stanowiskowe dla użytkowników

Y=1, N=0

 

 

 

Czy klient przygotowuje sam raporty niestandardowe

Y=1, N=0

 

 

 

Zagrożenia planistyczne

Określenie daty zakończenia projektu

Y=5, N=0

 

 

 

Brak formalnych procedur kontroli podczas planowania systemu

Y=5, N=0

 

 

 

Planowane dostępne zasoby

Y=0, N=5

 

 

 

Zaangażowanie grupy projektowej ze strony klienta

Wysoki=0, Niski=3

 

 

 

Definicje biznesowe

Hurtownia danych jest podstawą strategii systemu informatycznego

Y=5, N=0

 

 

 

Czy firma posiada aktualne definicje procesów

Y=0, N=3

 

 

 

Czy zmiany procesów zachodzą często

Y=3, N=0

 

 

 

Jak dużo procesów ma w podobny sposób zdefiniowane reguły biznesowe

Wysoki=0, Niski=3

 

 

 

W ilu obszarach działalności firmy będzie wykonana hurtowni danych

Wysoki=7, Niski=0

 

 

 

Błędne dane

 

 

 

 

     Czy aplikacje kontrolują poprawność wprowadzanych danych

Y=0, N=3

 

 

 

     Jaka jest jakość pracy operatorów aplikacji (czy dużo błędów
     popełniają)

Y=3, N=0

 

 

 

     Czy istnieją mechanizmy wykluczające błędne wartości

Y=0, N=2

 

 

 

     Czy są sprawdzane zależności czasowe

Y=0, N=2

 

 

 

     Czy isnieją zabezpieczenia przed brakującymi danymi

Y=0, N=2

 

 

 

     Czy na poziomie wprowadzania danych są sprawdzane zakresy
     wartości

Y=0, N=2

 

 

 

     Z ilu systemów źródłowych pochodzą dane

Wysoki=5, Jeden=0

 

 

 

     Czy projektanci mają doświadczenie w optymalizacji konstrukcji tabel

Y=0, N=2

 

 

 

     Czy usunięto nieuzasadnione relacje

Y=0, N=2

 

 

 

     Czy są mechanizmy sprawdzające zdublowane atrybuty

Y=0, N=3

 

 

 

Ryzyko wynikające z zastosowanych technologii

Środowisko

 

 

 

 

      Nowe/nieznane technologie

Y=5, N=0

 

 

 

      Dostępność rozwojowych metod

Y=0, N=2

 

 

 

      Szybkość i wydajność stacji roboczych

Wysoki=0, Niski=1

 

 

 

Projekt

 

 

 

 

      Złożoność funkcji

Niski=0, średni=2, wysoki=5

 

 

 

      Złożoność bazy danych

Niski=0, średni=2, wysoki=5

 

 

 

      Dostępne bazy danych i niezdefiniowane aplikacje

Y=3, N=0

 

 

 

      Ilość fizycznych interfejsów

0-2:2, >2:3

 

 

 

      Niedostępne rozwiązania

Y=0, N=3

 

 

 

      Potrzeba zastosowania zaawansowanego sprzętu

Y=2, N=0