data mart tutorial types
Ovaj vodič objašnjava koncepte Data Mart, uključujući implementaciju Data Mart, vrste, strukturu, kao i razlike između skladišta podataka i Data Mart:
U ovome Kompletna serija obuke za skladište podataka , pogledali smo razne Sheme skladišta podataka detaljno.
Ovaj vodič će vam pomoći da detaljno naučite koncepte Data Mart, zajedno sa jednostavnim primjerima.
Vidjet ćemo Što je data mart? Kada trebamo data mart? Isplativo markiranje podataka, trošak marketa podataka, vrste podataka martova, koraci u primjeni data marta, struktura data marta, kada je pilot Data Data Mart koristan? Nedostaci Datamart-a i razlike između Data Warehouse-a i Data Mart-a.
Ciljana publika
- Programeri i ispitivači skladišta podataka / ETL-a.
- Stručnjaci za baze podataka s osnovnim znanjem o konceptima baza podataka.
- Administratori baze podataka / stručnjaci za velike podatke koji žele razumjeti koncepte skladišta podataka / ETL.
- Fakulteti / studenti koji traže posao u skladištu podataka.
Što ćete naučiti:
- Što je Data Mart?
- Usporedba skladišta podataka protiv podataka mart
- Vrste podataka s oznakama
- Koraci implementacije Data Mart
- Struktura podataka Mart
- Kada je korisno korištenje pilot podataka?
- Nedostaci podataka Mart
- Zaključak
Što je Data Mart?
Data mart je mali dio skladišta podataka koji se uglavnom odnosi na određenu poslovnu domenu kao što je marketing (ili) prodaja itd.
Podaci pohranjeni u DW sustavu ogromni su, stoga su podatkovne marke dizajnirane s podskupom podataka koji pripadaju pojedinim odjelima. Stoga određena skupina korisnika može lako koristiti ove podatke za svoju analizu.
Za razliku od skladišta podataka koje ima mnogo kombinacija korisnika, svaki podatkovni prostor imat će određeni skup krajnjih korisnika. Manji broj krajnjih korisnika rezultira boljim vremenom odziva.
Marke podataka također su dostupne i alatima poslovne inteligencije (BI). Oznake podataka ne sadrže duplicirane (ili) neiskorištene podatke. Oni se redovito ažuriraju. Oni su tematski orijentirane i fleksibilne baze podataka. Svaki tim ima pravo razvijati i održavati svoje podatke bez mijenjanja skladišta podataka (ili) podataka drugih podataka.
Data mart je prikladniji za mala poduzeća jer košta vrlo manje od sustava skladišta podataka. Vrijeme potrebno za izgradnju podatkovne marke je također manje od vremena potrebnog za izgradnju podatkovnog skladišta.
Slikovni prikaz višestrukih podataka:
osiguranje kvalitete softvera u softverskom inženjerstvu
Kada su nam potrebni podaci Mart?
Na temelju potrebe, planirajte i izradite podatkovnu marku za svoj odjel angažirajući zainteresirane strane jer operativni troškovi podatkovne marke mogu biti visoki u nekoliko navrata.
Razmotrite dolje navedene razloge za izradu data mart-a:
- Ako želite podatke podijeliti s nizom korisničke strategije kontrole pristupa.
- Ako određeni odjel želi puno brže vidjeti rezultate upita, umjesto da skenira ogromne DW podatke.
- Ako odjel želi da se podaci grade na drugim hardverskim (ili) softverskim platformama.
- Ako odjel želi da podaci budu dizajnirani na način koji je prikladan za njegove alate.
Isplativi podaci Mart
Isplativi podatkovni prostor može se izraditi slijedećim koracima:
koji je najbolji uklanjač virusa
- Prepoznajte funkcionalne podjele: Podijelite podatke organizacije u sve podatke specifične za pojedine podatke (odjele) kako bi se udovoljilo njezinim zahtjevima, bez daljnje organizacijske ovisnosti.
- Utvrdite zahtjeve alata za pristup korisniku: Na tržištu mogu postojati različiti alati za pristup korisnicima koji trebaju različite strukture podataka. Marke podataka koriste se za potporu svim tim unutarnjim strukturama bez ometanja DW podataka. Jedan podaci mogu se povezati s jednim alatom prema potrebama korisnika. Data marts također mogu svakodnevno pružati ažurirane podatke takvim alatima.
- Utvrdite probleme s kontrolom pristupa: Ako različitim segmentima podataka u DW sustavu treba privatnost i treba im pristupiti niz ovlaštenih korisnika, tada se svi takvi podaci mogu premjestiti u podatkovne marte.
Trošak podataka Mart
Trošak podataka mart može se procijeniti na sljedeći način:
- Cijena hardvera i softvera: Bilo koji novo dodani data mart možda će trebati dodatni hardver, softver, procesorsku snagu, mrežu i prostor za pohranu diska za rad na upitima koje su zatražili krajnji korisnici. To martiranje podataka čini skupom strategijom. Stoga proračun treba precizno planirati.
- Pristup mreži: Ako se mjesto data marta razlikuje od mjesta skladišta podataka, tada bi svi podaci trebali biti preneseni s postupkom učitavanja data mart-a. Stoga treba osigurati mrežu za prijenos ogromnih količina podataka koje mogu biti skupe.
- Ograničenja vremenskog prozora: Vrijeme potrebno za postupak učitavanja podataka ovisit će o različitim čimbenicima kao što su složenost i količine podataka, mrežni kapacitet, mehanizmi prijenosa podataka itd.
Usporedba skladišta podataka protiv podataka mart
S.Br | Skladište podataka | Data Mart |
---|---|---|
jedan | Složen i više košta za implementaciju. | Jednostavno i jeftinije za implementaciju. |
dva | Radi na razini organizacije za cjelokupno poslovanje. | Opseg je ograničen na određeni odjel. |
3 | Ispitivanje DW-a teško je za poslovne korisnike zbog velike ovisnosti o podacima. | Traženje podataka mart jednostavno je za poslovne korisnike zbog ograničenih podataka. |
4 | Vrijeme provedbe može biti duže u mjesecima ili godinama. | Vrijeme provedbe je manje, može biti u danima, tjednima ili mjesecima. |
5 | Prikuplja podatke iz različitih vanjskih izvornih sustava. | Prikuplja podatke iz nekoliko centraliziranih DW (ili) unutarnjih (ili) vanjskih sustava izvora. |
6 | Mogu se donositi strateške odluke. | Mogu se donositi poslovne odluke. |
Vrste podataka s oznakama
Podatkovne oznake klasificirane su u tri vrste, tj. Ovisno, neovisno i hibridno. Ova se klasifikacija temelji na načinu na koji su popunjeni, tj. Bilo iz skladišta podataka (ili) iz bilo kojeg drugog izvora podataka.
Ekstrakcija, transformacija i transport (ETT) postupak je koji se koristi za popunjavanje podataka iz bilo kojeg izvornog sustava.
Pogledajmo pojedinu vrstu detaljno !!
# 1) Ovisni podaci Mart
U ovisnom podatkovnom prostoru podaci se dobivaju iz samog postojećeg skladišta podataka. Ovo je pristup od vrha prema dolje jer se dio restrukturiranih podataka u podatkovnom prostoru izvlači iz centraliziranog skladišta podataka.
Data mart može koristiti DW podatke logički ili fizički kako je prikazano u nastavku:
- Logičan pogled: U ovom scenariju podaci data mart-a nisu fizički odvojeni od DW-a. Logično se odnosi na DW podatke putem virtualnih prikaza (ili) tablica.
- Fizički podskup: U ovom su scenariju podaci podataka mart fizički odvojeni od DW-a.
Jednom kada se razvije jedan ili više podatkovnih marketa, možete dopustiti korisnicima pristup samo podatkovnim martovima (ili) da bi pristupili i podatkovnim martovima i skladištima podataka.
ETT je pojednostavljeni postupak u slučaju ovisnih martova podataka jer korisni podaci već postoje u centraliziranom DW-u. Točan skup sažetih podataka trebalo bi samo premjestiti na odgovarajuće podatkovne polja.
Slika ovisnih podataka Mart prikazana je u nastavku :
# 2) Nezavisni podaci mart
Nezavisna baza podataka najprikladnija je za male odjele u organizaciji. Ovdje podaci ne dolaze iz postojećeg skladišta podataka. Nezavisni podatkovni prostor ne ovisi ni o poslovnom DW-u ni o ostalim podacima.
Neovisne oznake podataka su samostalni sustavi u kojima se podaci izvlače, transformiraju i učitavaju iz vanjskih (ili) unutarnjih izvora podataka. Jednostavno ih je dizajnirati i održavati sve dok ne podržavaju jednostavne poslovne potrebe mudrih odjela.
Morate raditi sa svakom fazom ETT procesa u slučaju neovisnih martova podataka na sličan način kao i na način na koji su podaci obrađeni u centralizirani DW. Međutim, broj izvora i podataka popunjenih na podatkovnim poljima može biti manji.
Slikovni prikaz Independent Data Mart :
# 3) Hibridni podaci Mart
U hibridnom podatkovnom prostoru podaci se integriraju i iz DW-a i iz drugih operativnih sustava. Hibridni podaci su fleksibilni s velikim strukturama za pohranu. Može se odnositi i na druge podatke marts podataka.
Slikovni prikaz Hybrid Data Mart-a:
Koraci implementacije Data Mart
Implementacija Data Mart-a koja se smatra pomalo složenom objašnjena je u sljedećim koracima:
- Projektiranje: Budući da vremenski poslovni korisnici zahtijevaju markiranje podataka, faza projektiranja uključuje prikupljanje zahtjeva, stvaranje odgovarajućih podataka iz odgovarajućih izvora podataka, stvaranje logičkih i fizičkih struktura podataka i ER dijagrama.
- Izrada: Tim će dizajnirati sve tablice, poglede, indekse itd. U data mart sustavu.
- Stanovništvo: Podaci će se izdvojiti, transformirati i učitati u podatkovnu zbirku zajedno s metapodacima.
- Pristup: Podaci Data Mart dostupni su krajnjim korisnicima. Oni mogu tražiti podatke za njihovu analizu i izvještaje.
- Upravljanje: To uključuje razne upravljačke zadatke kao što su korisničke kontrole pristupa, precizno podešavanje performansi podataka, održavanje postojećih podataka i stvaranje scenarija oporavka podataka u slučaju da sustav zakaže.
Struktura podataka Mart
Struktura svakog podataka kreira se prema zahtjevu. Data Mart strukture nazivaju se zvjezdani spojevi. Ova će se struktura razlikovati od jednog do drugog podatkovnog marka.
Zvjezdani spojevi su višedimenzionalne strukture koje su oblikovane tablicama činjenica i dimenzija za potporu velikim količinama podataka. Zvjezdano spajanje imat će tablicu činjenica u sredini okruženu tablicama dimenzija.
Podaci odgovarajuće tablice činjenica povezani su s podacima tablica dimenzija s referencom stranog ključa. Tablica činjenica može biti okružena tablicama 20-30 dimenzija.
Slično sistemu DW, i u zvjezdastim pridruživanjima tablice činjenica sadrže samo numeričke podatke, a odgovarajući tekstualni podaci mogu se opisati u tablicama dimenzija. Ova struktura sliči shemi zvijezda u DW.
Slikovni prikaz zvjezdane strukture.
No, zrnati podaci iz centraliziranog DW-a osnova su za bilo koje podatke. Mnogi će se izračuni izvršiti na normaliziranim DW podacima kako bi se transformirali u višedimenzionalne podatkovne podatke koji se pohranjuju u obliku kockica.
To djeluje slično kao i način na koji se podaci iz naslijeđenih izvornih sustava transformiraju u normalizirane DW podatke.
besplatni sustav za optimizaciju sustava Windows 7
Kada je korisno korištenje pilot podataka?
Pilot se može rasporediti u malom okruženju s ograničenim brojem korisnika kako bi se osiguralo je li implementacija uspješna prije punopravne implementacije. Međutim, to nije bitno cijelo vrijeme. Pilot implementacije više neće biti korisne kad se ispuni svrha.
Morate uzeti u obzir sljedeće scenarije koji preporučuju pilot implementaciju:
- Ako su krajnji korisnici novi u sustavu skladišta podataka.
- Ako se krajnji korisnici žele osjećati ugodno sami dohvatiti podatke / izvještaje prije odlaska u proizvodnju.
- Ako krajnji korisnici žele praktično korištenje najnovijih alata (ili) tehnologija.
- Ako uprava želi vidjeti koristi kao dokaz koncepta prije nego što to učini velikim izdanjem.
- Ako tim želi osigurati da sve ETL komponente (ili) komponente infrastrukture rade dobro prije izdanja.
Nedostaci podataka Mart
Iako podaci imaju neke prednosti u odnosu na DW, oni imaju i neke nedostatke kako je objašnjeno u nastavku:
- Stvoreni neželjeni podaci teško se održavaju.
- Data marts namijenjeni su potrebama malog poduzeća. Povećanje veličine podatkovnih martova smanjit će njegove performanse.
- Ako stvarate veći broj podatkovnih martova, tada bi se uprava trebala pravilno pobrinuti za njihovo izradu verzija, sigurnost i izvedbu.
- Podatkovne oznake mogu sadržavati povijesne (ili) sažete (ili) detaljne podatke. Međutim, ažuriranja DW podataka i data mart podataka možda se neće dogoditi istodobno zbog problema s neusklađenošću podataka.
Zaključak
Mnoge se organizacije usmjeravaju prema podatkovnim marketama iz perspektive uštede troškova. Stoga se ovaj vodič usredotočio na tehničke aspekte martova podataka u sustavu skladišta podataka.
Metapodaci u ETL-u detaljno su objašnjeni u našem nadolazećem vodiču.
=> Posjetite ovdje da biste vidjeli seriju obuke za skladištenje podataka za sve.
Preporučena literatura
- Vodič za testiranje skladišta podataka sa primjerima | Vodič za ispitivanje ETL-a
- Python tipovi podataka
- Vrste podataka C ++
- Dimenzionalni model podataka u skladištu podataka - Vodič s primjerima
- Apriori algoritam u rudarstvu podataka: provedba s primjerima
- Primjeri rudarenja podataka: Najčešća primjena rudarenja podataka 2021
- Osnove skladištenja podataka: konačni vodič s primjerima
- Vodič za ispitivanje glasnoće: primjeri i alati za ispitivanje glasnoće