top 32 best datastage interview questions
Popis najčešće postavljanih pitanja i odgovora za intervju za Datastage koji će vam pomoći da se pripremite za sljedeći intervju:
DataStage je vrlo popularan ETL alat koji je bio dostupan na trenutnom tržištu.
U ovom članku dijelim skup vrlo korisnih odgovora na pitanja namijenjenih razgovorima s IBM Datastageom. Prelazak na sljedeća pitanja za intervju za Datastage može vam olakšati razbijanje intervjua.
Pokrili smo detaljne odgovore na Datastage Intervju pitanja koja će biti od pomoći svježim i iskusnim profesionalcima.
Preporučeno čitanje => Pitanja za ETL ispitivanje
Najčešća pitanja i odgovori za intervjue s Datastageom
Počnimo!
P # 1) Što je Datastage?
Odgovori: Datastage je ETL alat Dan od IBM koji koristi GUI za dizajn rješenja za integraciju podataka. Ovo je bio prvi ETL alat koji je dao koncept paralelizma.
Dostupan je u sljedeća 3 različita izdanja
- Izdanje poslužitelja
- Enterprise Edition
- MVS izdanje
P # 2) Istaknite glavne značajke Datastagea?
Odgovori: Glavne značajke Datastagea istaknute su u nastavku:
- Komponenta je integracije podataka informacijskog poslužitelja IBM Infosphere.
- To je alat zasnovan na GUI-u. Samo treba povući i ispustiti objekte Datastage i možemo ih pretvoriti u Datastage kôd.
- Koristi se za izvođenje ETL operacija (ekstrakt, transformacija, učitavanje)
- Pruža istovremeno povezivanje s više izvora i više ciljeva
- Pruža tehnike particioniranja i paralelne obrade koje omogućavaju poslovima Datastage da obrađuju ogromnu količinu podataka prilično brže.
- Ima povezanost na razini poduzeća.
P # 3) Koje su primarne upotrebe alata Datastage?
Odgovori: Datastage je ETL alat koji se primarno koristi za izdvajanje podataka iz izvornih sustava, transformiranje tih podataka i konačno njihovo učitavanje u ciljne sustave.
P # 4) Koje su glavne razlike koje ste primijetili između verzije DataStage od 7.x i 8.x?
Odgovori: Ovdje glavne su razlike između obje verzije
7.x | 8.x |
---|---|
Verzija 7.x ovisila je o platformi | Ova je verzija neovisna o platformi |
Ima dvorazinsku arhitekturu gdje je faza podataka izgrađena na vrhu Unix poslužitelja | Ima troslojnu arhitekturu gdje na dnu imamo UNIX poslužiteljsku bazu podataka, a zatim XMETA bazu podataka koja djeluje kao spremište, a zatim na vrhu imamo podatkovnu fazu. |
Ne postoji koncept skupa parametara | Imamo skupove parametara koji se mogu koristiti bilo gdje u projektu. |
Imali smo dizajnera i menadžera kao dva odvojena klijenta | U ovoj je verziji klijent upravitelja spojen u klijenta dizajnera |
Morali smo ručno tražiti poslove u ovoj verziji | Ovdje imamo mogućnost brzog pronalaska u spremištu gdje možemo lako tražiti poslove. |
P # 5) Možete li istaknuti glavne značajke informacijskog poslužitelja IBM Infosphere?
Odgovori: Glavne značajke IBM Infosphere informacijskog poslužiteljskog paketa su:
kako otvoriti ekstenziju datoteke json
- Pruža jedinstvenu platformu za integraciju podataka. Ima sposobnost povezivanja s više izvornih sustava, kao i pisanje na više ciljnih sustava.
- Temelji se na centraliziranim slojevima. Sve komponente apartmana mogu dijeliti osnovnu arhitekturu apartmana.
- Ima slojeve za objedinjeno spremište, za integrirane usluge metapodataka i zajednički paralelni mehanizam.
- Pruža alate za analizu, čišćenje, praćenje, transformiranje i isporuku podataka.
- Ima masovne paralelne mogućnosti obrade. Ispada da je obrada vrlo brza.
P # 6) Koji su različiti slojevi u arhitekturi informacijskog poslužitelja?
Odgovori: Ispod su različiti slojevi arhitekture informacijskog poslužitelja
- Objedinjeno korisničko sučelje
- Zajedničke usluge
- Objedinjena paralelna obrada
- Objedinjeni metapodaci
- Uobičajena povezanost
P # 7) Što bi mogao biti sustav izvora podataka?
Odgovori: To može biti tablica baze podataka, ravna datoteka ili čak vanjska aplikacija poput soft softvera.
P # 8) Na kojem ćete sučelju raditi kao programer?
Odgovori: Kao programer Datastage, radimo na klijentskom sučelju Datastage koje je poznato kao dizajner Datastage koji treba instalirati na lokalni sustav. U pozadini je povezan s poslužiteljem Datastage.
P # 9) Koje su različite uobičajene usluge u Datastageu?
Odgovori: Ispod je popis uobičajenih usluga u Datastageu:
- Usluge metapodataka
- Jedinstvena implementacija usluge
- Sigurnosne usluge
- Usluge petlje i izvještavanja.
P # 10) Kako započeti razvoj projekta Datastage?
Odgovori: Prvi korak je stvaranje posla Datastage na poslužitelju Datastage. Svi objekti Datastage koje kreiramo pohranjeni su u projektu Datastage. Projekt Datastage zasebno je okruženje na poslužitelju za poslove, tablice, definicije i rutine.
Projekt Datastage zasebno je okruženje na poslužitelju za poslove, tablice, definicije i rutine.
P # 11) Što je DataStage posao?
Odgovori: Posao Datastage jednostavno je DataStage kôd koji kreiramo kao programer. Sadrži različite faze povezane zajedno za definiranje podataka i tijek procesa.
Faze nisu ništa drugo do funkcionalnosti koje se implementiraju.
Na primjer: Pretpostavimo da želim zbrojiti iznos prodaje. To može biti operacija 'grupiraj po' koja će se izvoditi u jednoj fazi.
Sada želim rezultat zapisati u ciljnu datoteku. Dakle, ovu će operaciju izvesti druga faza. Jednom, definirao sam obje faze, trebam definirati protok podataka od svoje faze 'grupe po' do faze ciljne datoteke. Taj protok podataka definiraju veze DataStage.
Jednom, definirao sam obje faze, trebam definirati protok podataka od svoje faze 'grupe po' do faze ciljne datoteke. Taj protok podataka definiraju veze DataStage.
P # 12) Što su DataStage sekvence?
Odgovori: Slijed Datastage povezuje DataStage poslove u logičnom toku.
P # 13) Ako želite koristiti isti dio koda u različitim poslovima, kako ćete to postići?
Odgovori: To se može učiniti pomoću zajedničkih spremnika. Podijelili smo spremnike za ponovnu upotrebu. Dijeljeni spremnik element je posla koji se može ponovno upotrijebiti i sastoji se od faza i veza. Dijeljeni spremnik možemo nazvati u različitim poslovima Datastagea.
P # 14) Gdje se pohranjuju poslovi Datastagea?
Odgovori: Poslovi Datastage pohranjuju se u spremište. Imamo razne mape u koje možemo pohraniti zadatke Datastage.
P # 15) Gdje vidite različite faze u dizajneru?
Odgovori: Sve su faze dostupne u prozoru tzv ' Paleta ' . Ima razne kategorije, ovisno o vrsti funkcije koju pozornica pruža.
Razne kategorije faza u paleti su - Općenito, Kvaliteta podataka, Baza podataka, Razvoj, Datoteka, Obrada itd.
P # 16) Koje su faze obrade?
Odgovori: Faze obrade omogućuju nam primjenu stvarne transformacije podataka.
Na primjer , The ' faza agregatora u kategoriji Obrada omogućuje nam primjenu svih operacija 'grupiraj po'. Slično tome, imamo i druge faze u obradi poput faze ‘Pridruživanje’ koja nam omogućuje spajanje podataka koji dolaze iz dva različita ulazna toka.
P # 17) Koji su koraci potrebni za stvaranje jednostavnog osnovnog posla Datastage?
Odgovori: Kliknite datoteku -> kliknite Novo -> Odaberite paralelni posao i pritisnite U redu. Otvorit će se paralelni prozor posla. U ovom paralelnom poslu možemo sastaviti različite faze i definirati protok podataka između njih. Najjednostavniji posao DataStage je ETL posao.
U tome prvo moramo izvući podatke iz izvornog sustava za koji možemo koristiti ili fazu datoteke ili fazu baze podataka jer moj izvorni sustav može biti tablica baze podataka ili datoteka.
Pretpostavimo da čitamo podatke iz tekstualne datoteke. U tom ćemo slučaju povući i ispustiti fazu ‘Sekvencijalna datoteka’ u paralelni prozor posla. Sada, moramo izvršiti neku transformaciju povrh tih podataka. Upotrijebit ćemo fazu 'Transformer' koja je dostupna u kategoriji Obrada. U fazi Transformera možemo napisati bilo koju logiku.
Konačno, trebamo učitati obrađene podatke u neku ciljnu tablicu. Recimo da je moja ciljana baza podataka DB2. Dakle, za ovo ćemo odabrati fazu DB2 konektora. Tada ćemo ta stanja podataka povezati sekvencijalnim vezama.
Nakon ovoga , moramo konfigurirati faze tako da upućuju na ispravan datotečni sustav ili bazu podataka.
Na primjer, Za fazu Sekvencijalna datoteka moramo definirati obvezne parametre kao što su naziv datoteke, mjesto datoteke, metapodaci stupca.
Zatim moramo sastaviti posao Datastage. Kompiliranje posla provjerava sintaksu posla i stvara izvršnu datoteku za posao Datastage koja se može izvršiti u vrijeme izvođenja.
besplatni softver za baze podataka za Windows 10
P # 18) Navedite različite metode sortiranja u Datastageu.
Odgovori: Dostupne su dvije metode:
- Razvrstavanje veza
- Ugrađena sorta podataka
P # 19) U seriji ako posao između toga ne uspije i želite ponovno pokrenuti seriju s tog određenog posla, a ne ispočetka, što ćete učiniti?
Odgovori: U Datastageu postoji opcija u slijedu posla - 'Dodaj kontrolne točke kako bi se slijed mogao ponovno pokrenuti u slučaju kvara' . Ako je ova opcija potvrđena, tada možemo ponoviti slijed posla od točke na kojoj nije uspio.
P # 20) Kako uvozite i izvozite poslove Datastage?
Odgovori: F ili ovo, ispod funkcija naredbenog retka za ovo
- Uvoz: dsimport.exe
- Izvoz: dsexport.exe
P # 21) Što su rutine u Datastageu? Navedite razne vrste rutina.
Odgovori: Rutinsko je skup funkcija koje definira upravitelj DS-a. Izvodi se preko stupnja transformatora.
Postoje 3 vrste rutina:
- Paralelne rutine
- Rutine glavnog računala
- Poslužiteljske rutine
P # 22) Kako uklanjate dvostruke vrijednosti u DataStageu?
Odgovori: Postoje dva načina za rukovanje dvostrukim vrijednostima
- Fazu uklanjanja duplikata možemo koristiti za uklanjanje duplikata.
- Fazu sortiranja možemo koristiti za uklanjanje duplikata. Faza sortiranja ima svojstvo pod nazivom 'dopustiti duplikate'. Nećemo dobiti dvostruke vrijednosti u izlazu sortiranja kada postavimo ovo svojstvo na false.
P # 23) Koje su različite vrste pogleda dostupne u upravitelju Datastagea?
Odgovori: U programu Datastage dostupne su 3 vrste pogleda. Oni su:
- Prikaz dnevnika
- Prikaz statusa
- Pogled na posao
P # 24) Razlikovati između Informatice i Datastagea. Koju biste odabrali i zašto?
Odgovori: I Informatica i DataStage snažni su ETL alati.
Uvrštene točke razlikuju oba alata:
Računarstvo | Faza podataka | |
---|---|---|
Paralelna obrada | Informatica ne podržava paralelnu obradu. | Suprotno tome, datastage pruža mehanizam za paralelnu obradu. |
Provedba SCD-a | Prilično je jednostavno implementirati SCD (polako mijenja dimenzije) u Informatici. | Međutim, složeno je implementirati SCD u podatkovnu fazu. Datastage podržava SCD samo putem prilagođenih skripti. |
Kontrola verzija | Informatica podržava kontrolu verzija putem prijave i odjave objekata. | Međutim, ova funkcija nije dostupna u fazi podataka. |
Dostupne transformacije | Dostupne su manje transformacije. | Datastage nudi više različitih transformacija od Informatice. |
Snaga pretraživanja | Informatica pruža vrlo moćno dinamičko pretraživanje predmemorije | U podatkovnoj fazi nemamo ništa slično. |
Po mom osobnom mišljenju, išao bih s Informaticom preko Datastagea. Razlog tome je što sam smatrao Informaticu sustavnijom i jednostavnijom za upotrebu od DataStagea.
Sljedeći je snažan razlog taj što je otklanjanje pogrešaka i postupanje s pogreškama u Informatici puno bolje u odnosu na Datastage. Dakle, rješavanje problema postaje lakše u Informatici. Datastage ne pruža potpunu podršku za rukovanje pogreškama.
=> Želite li saznati više o Informatici? Imamo detaljno objašnjenje ovdje.
P # 25) Dajte ideju o sistemskim varijablama.
assert () c ++
Odgovori: Sistemske varijable su varijable samo za čitanje koje počinju s ‘@’ koje se mogu očitati ili stupnjem transformatora ili rutinom. Koriste se za dobivanje informacija o sustavu.
P # 26) Koja je razlika između pasivne i aktivne faze?
Odgovori: Pasivni stupnjevi koriste se za ekstrakciju i utovar, dok se aktivni stupnjevi koriste za transformaciju.
P # 27) Koje su različite vrste spremnika dostupne u Datastageu?
Odgovori: U Datastageu imamo ispod 2 spremnika:
- Lokalni kontejner
- Zajednički spremnik
P # 28) Je li vrijednost promjenjive postavke pohranjena privremeno ili trajno?
Odgovori: Privremeno. To je privremena varijabla.
P # 29) Koje su različite vrste poslova u Datastageu?
Odgovori: U Datastageu imamo dvije vrste poslova:
- Poslovi poslužitelja (izvode se u slijedu)
- Paralelni poslovi (izvršavaju se paralelno)
P # 30) Čemu služi Datastage director?
Odgovori: Putem direktora Datastage možemo zakazati posao, potvrditi posao, izvršiti posao i nadgledati posao.
P # 31) Koje su razne vrste hash datoteke?
Odgovori: Imamo 2 vrste hash datoteka:
- Statička hash datoteka
- Dinamička hash datoteka
P # 32) Što je faza kvalitete?
Odgovori: Stupanj kvalitete (koji se naziva i stupnjem integriteta) je stupanj koji pomaže u kombiniranju podataka koji dolaze iz različitih izvora.
Zaključak
Trebali biste imati praktično znanje o arhitekturi Datastage, njezinim glavnim značajkama i trebali biste moći objasniti kako se razlikuje od nekih drugih popularnih ETL alata.
Dodatno , trebali biste imati dobru ideju o različitim fazama i njihovoj upotrebi, način stvaranja posla Datastage i njegovo pokretanje.
Preporučena literatura => Što je ETL testiranje?
Sve najbolje!
Preporučena literatura
- Pitanja i odgovori za ispitivanje ETL-a
- 10 najboljih alata za mapiranje podataka korisnih u ETL procesu (POPIS 2021)
- 15 najboljih ETL alata u 2021. godini (potpuni ažurirani popis)
- Vodič za ispitivanje skladišta podataka sa primjerima | Vodič za ispitivanje ETL-a
- Vodič za ispitivanje skladišta podataka ETL-a (cjelovit vodič)
- ETL naspram DB testiranja - detaljniji pogled na potrebe ETL testiranja, planiranje i ETL alate
- Kako izvesti ETL testiranje pomoću alata Informatica PowerCenter
- Metapodaci u skladištu podataka (ETL) objašnjeni primjerima
- Priopćenje za javnost - iCEDQ Soft Nova verzija izdanja ETL platforme za testiranje i testiranje migracije podataka
- Top 10 ETL alata za testiranje 2021. godine
- Što je ETL (ekstrakt, transformacija, učitavanje) postupak u skladištu podataka?