Remo Suurkivi Hansapank 26/10/2005 Data Warehouse Remo Suurkivi Hansapank 26/10/2005
Remo ja EDW 2002 Eesti Telefoni EDW lahenduse implementatsioon Kuni 2005 Elioni EDW lahenduse arhitekt, analüütik, jne Alates 2005 august – EDW & CRM Area Manager Hansapank
Mis on andmeait? Konsolideeritud vaade ettevõtte andmetele, mis annab alati ühese tõe andmete kohta. Ühtne vaade andmetele otsuste tegemiseks
Mida ei ole andmeait Agregatsioon Rakendus Finants, riski, müügi, turunduse, logistika või muu iganes muu valdkonna, osakonna, toote vaade andmetele.
Terminid Data Warehouse konsolideerimine Data Mart spetsialiseerumine ETL andmete tarnimine(data acquisition)
Data Warehouse Peab vastama küsimustele: Mis toimus? Mis toimub praegu? Mis hakkab toimuma?
EDW füüsiline disain 3NF Customer-centric Konsolideeritus PARTY=klient, töötaja, tarnija, jne / Rakenduste arv=n, ettevõtteid=n Semantika Detailsus Kunagi ei tohi eeldada, et andmeid vaadeldakse ainult ühes kontekstis
EDW loogiline disain Vastab äriküsimustele tellijale arusaadavas vormis Objektid nagu – tooteleping, klient, tarnija, kliendi segment, jne
EDW vs DM arendus EDW DM 80 Kulujaotus: Arendus+haldus: 20 Kulujaotus: Arendus+haldus: EDW 80+20+20+20 DM 60+60+60+60 lisaks sellele 4 süsteemi EDW DM 80 20 20 80 60 60 60 60
Data Mart arendus Many2Many DM DM DM
Data Acquisition
ETL reeglid/praktika EDW andmemudel Nõuded andmete kasutamiseks Kasutatav järgmine tööpäev, iga kuu esimene kuupäev, jne Kokkulepped algsüsteemidega Millal? - ajavahemik, Kuidas? – ODBC, Native, csv, jne. Rakenduse valik MS-DTS, Synopsis, Informatica, Hummingbird, jne.
ETL põhimured Sõltuvused Klient peab enne olema kui leping Infrastruktuur Algallikate kasutatavus Võrgu läbilaskevõime Vead Tehnilised kerged, sisulised võivad märkamatuks jääda
EDW arhitektuur APP1 APP2 APP3 APP4 Presentation Layer EDW ETL
Arhitektuur praktikas Oracle MS-SQL MySQL Access CSV MS DTS Teradata RDBMS Business Objects Hummingbird SAS Miner/ SPSS Clementine WebLogic MS-Office
EDW kasutusvaldkonnad Reporting Ad Hoc Mining Scoring Segmenting Predicting ... Marketing Finance Risk Sales Logistics ...
DW arengusuunad Enterprise Data Warehouse Active Data Warehouse Real-Time Data Warehouse Right-Time Data Warehouse
Remo Suurkivi remo.suurkivi@hansa.ee Tänud Remo Suurkivi remo.suurkivi@hansa.ee