top 29 data engineer interview questions
Popis najčešće postavljanih pitanja i odgovora s inženjera podataka koji će vam pomoći da se pripremite za sljedeći intervju:
Danas je inženjerstvo podataka najtraženije područje nakon razvoja softvera i postalo je jedna od najbrže rastućih mogućnosti posla na svijetu. Anketari žele najbolje inženjere podataka za svoj tim i zato imaju tendenciju temeljito intervjuirati kandidate. Oni traže određene vještine i znanja. Dakle, na to morate biti spremni kako biste ispunili njihova očekivanja.
Što ćete naučiti:
- Odgovornosti inženjera podataka
- Vještine inženjera podataka
- Često postavljana pitanja za intervjua inženjera podataka
- Zaključak
Odgovornosti inženjera podataka
Odgovornosti uključuju:
- Za rukovanje i nadzor podataka unutar tvrtke.
- Održavanje i rukovanje izvornim sustavom podataka i područjima postavljanja.
- Pojednostavite čišćenje podataka zajedno s naknadnom izgradnjom i poboljšanjem redukcije podataka.
- Omogućite i izvršite i transformaciju podataka i ETL postupak.
- Izdvajanje i izrada ad-hoc izrade upita za podatke.
Vještine inženjera podataka
S kvalifikacijama su vam potrebne i određene vještine. Oboje su presudni kada se pripremate za mjesto inženjera podataka. Ovdje navodimo 5 najboljih vještina, ne određenim redoslijedom, koje će vam trebati da biste postali uspješni inženjer podataka.
- Vještine vizualizacije podataka.
- Python i SQL.
- Znanje o modeliranju podataka i za velike podatke i za skladištenje podataka
- Matematika
- Znanje u ETL-u
- Iskustvo prostora s velikim podacima
Dakle, morate poraditi na poboljšanju ovih skupova vještina prije nego što se počnete pripremati za intervju. A kad usavršite svoje vještine, evo nekoliko pitanja za intervju koje možete pripremiti kako bi anketari primijetili vas i zaposlili vas.
Često postavljana pitanja za intervjua inženjera podataka
Opća pitanja za intervju
P # 1) Zašto ste studirali inženjering podataka?
Odgovor: Ovo pitanje želi naučiti o vašem obrazovanju, radnom iskustvu i pozadini. To bi mogao biti prirodan izbor u nastavku vašeg studija informacijskih sustava ili informatike. Ili ste možda radili na sličnom polju ili možda prelazite iz sasvim drugog radnog područja.
Kakva god bila vaša priča, nemojte se suzdržavati ili zazirati. I dok dijelite, nastavite isticati vještine koje ste usvojili tijekom puta i izvrstan posao koji ste učinili.
Međutim, nemojte započeti pripovijedanje. Započnite malo sa svojim obrazovanjem, a zatim prijeđite na dio za koji ste znali da želite biti inženjer podataka. A onda nastavite kako stižete ovdje.
P # 2) Koja je najteža stvar u vezi s vama biti inženjer podataka?
Odgovor: Na ovo pitanje morate iskreno odgovoriti. Nisu svi aspekti svih poslova laki i vaš anketar to zna. Cilj ovog pitanja nije utvrditi svoju slabost, već znati kako radite kroz stvari s kojima se teško nosite.
Možete reći nešto poput: „Kao inženjeru podataka, teško mi je ispuniti zahtjev svih odjela u tvrtki u kojoj većina njih često ima proturječne zahtjeve. Dakle, često mi je izazov uravnotežiti ih u skladu s tim.
Ali ponudio mi je dragocjen uvid u rad odjela i ulogu koju oni igraju u ukupnoj strukturi tvrtke. ' I ovo je samo jedan primjer. Možete i trebate staviti svoje stajalište.
P # 3) Recite nam incident u kojem ste trebali prikupiti podatke iz različitih izvora, ali suočili ste se s neočekivanim problemima i kako ste ih riješili?
Odgovor: Ovo je pitanje prilika za vas da pokažete svoje vještine rješavanja problema i kako se prilagođavate naglim promjenama plana. Pitanju se može odgovoriti općenito ili posebno s kontekstom inženjeringa podataka. Ako niste prošli takvo iskustvo, možete dati hipotetički odgovor.
Evo primjera odgovora: „U mojoj prethodnoj franšiznoj tvrtki ja i moj tim trebali smo prikupljati podatke s različitih lokacija i sustava. No, jedna od franšiza promijenila je svoj sustav bez da nas je prethodno obavijestila. To je rezultiralo pregrštom problema za prikupljanje i obradu podataka.
Da bismo to riješili, prvo smo morali smisliti kratkotrajno rješenje za unos bitnih podataka u sustav tvrtke. I nakon toga, razvili smo dugoročno rješenje kako bismo spriječili da se takvi problemi ponove. '
P # 4) Po čemu se posao inženjera podataka razlikuje od posla arhitekta podataka?
Odgovor: Ovo pitanje želi provjeriti razumijete li da postoje razlike u timu skladišta podataka. S odgovorom ne možete pogriješiti. Odgovornosti obojice preklapaju se ili se razlikuju ovisno o tome što treba odjel za održavanje baze podataka ili tvrtka.
Možete reći da „prema mom iskustvu, razlika između uloga inženjera podataka i podatkovnog arhitekta razlikuje se od tvrtke do tvrtke. Iako vrlo usko surađuju, postoje razlike u njihovim općim odgovornostima.
Upravljanje poslužiteljima i izgradnja arhitekture podatkovnog sustava poduzeća odgovornost je arhitekte podataka. A posao inženjera podataka je testirati i održavati tu arhitekturu. Uz to, mi, inženjeri podataka, osiguravamo da podaci koji su dostupni analitičarima budu kvalitetni i pouzdani. '
Pitanja za tehnički intervju
P # 5) Što su četiri V-a Big Data-a?
(slika izvor )
Odgovor:
Četiri V-a od velikih podataka su:
- Prvo V je Brzina koja se odnosi na brzinu generiranja velikih podataka tijekom vremena. Dakle, to se može smatrati analizom podataka.
- Drugo V je Raznolikost različitih oblika velikih podataka, bilo da se radi o slikama, datotekama dnevnika, medijskim datotekama i glasovnim snimkama.
- Treće V je Volumen podataka. To može biti broj korisnika, broj tablica, veličina podataka ili broj zapisa.
- Četvrti V je Istinitost povezane s neizvjesnošću ili sigurnošću podataka. Drugim riječima, odlučuje koliko možete biti sigurni u točnost podataka.
P # 6) Kako se strukturirani podaci razlikuju od nestrukturiranih podataka?
Odgovor: Donja tablica objašnjava razlike:
Strukturirani podaci | Nestrukturirani podaci | |
---|---|---|
7) | Skupni podaci sadržani su u jednoj dimenziji. | Podaci su podijeljeni u tablice različitih dimenzija. |
1) | Može se pohraniti u MS Access, Oracle, SQL Server i druge slične tradicionalne sustave baza podataka. | Ne može se pohraniti u tradicionalni sustav baza podataka. |
2) | Može se pohraniti u različite stupce i retke. | Ne može se pohraniti u retke i stupce. |
3) | Primjer strukturiranih podataka su transakcije internetskih aplikacija. | Primjeri nestrukturiranih podataka su tweetovi, Google pretraživanja, Facebook sviđanja itd. |
4) | To se lako može definirati unutar podatkovnog modela. | Ne može se definirati prema podatkovnom modelu. |
5) | Dolazi s fiksnom veličinom i sadržajem. | Dolazi u raznim veličinama i sadržajima. |
P # 7) Koji su vam ETL alati poznati?
Odgovor: Navedite sve ETL alate s kojima ste radili. Možete reći: „Radio sam sa SAS upravljanjem podacima, IBM Infosphere i SAP Data Services. Ali moj najdraži je PowerCenter iz Informatice. Učinkovit je, ima izuzetno visoke performanse i fleksibilan je. Ukratko, ima sva važna svojstva dobrog ETL alata.
Oni neometano vode operacije s poslovnim podacima i jamče pristup podacima čak i kada se događaju promjene u poslovanju ili njegovoj strukturi. ' Obavezno razgovarajte samo o onima s kojima ste surađivali i onima s kojima volite raditi. Ili bi vam kasnije mogao pasti intervju.
P # 8) Recite nam nešto o shemama dizajna modeliranja podataka.
Odgovor: Modeliranje podataka dolazi s dvije vrste shema dizajna.
Objašnjeni su na sljedeći način:
- Prvi je Raspored zvijezda , koji je podijeljen u dva dijela - tablica činjenica i tablica dimenzija. Ovdje su obje tablice povezane. Zvjezdana shema je najjednostavniji stil sheme podataka mart i njoj se također najviše pristupa. Nazvan je tako jer po svojoj strukturi podsjeća na zvijezdu.
- Drugi je Shema pahuljica što je produžetak sheme zvijezda. Dodaje dodatne dimenzije i naziva se pahuljica jer po svojoj strukturi nalikuje strukturi pahulje.
P # 9) Koja je razlika između sheme zvijezda i sheme pahuljica?
(slika izvor )
Odgovor: Donja tablica objašnjava razlike:
Zvjezdani raspored | Shema pahuljica | |
---|---|---|
1) | Tablica dimenzija sadrži hijerarhije dimenzija. | Postoje zasebne tablice za hijerarhije. |
2) | Ovdje tablice dimenzija okružuju tablicu činjenica. | Tablice dimenzija okružuju tablicu činjenica, a zatim su dalje okružene tablicama dimenzija. |
3) | Tabela činjenica i bilo koja tablica dimenzija povezane su samo jednim spajanjem. | Za dohvaćanje podataka potrebna su mnoga spajanja. |
4) | Dolazi s jednostavnim DB dizajnom. | Ima složen DB dizajn. |
5) | Dobro funkcionira čak i s denormaliziranim upitima i strukturama podataka. | Radi samo s normaliziranom strukturom podataka. |
6) | Višak podataka - visok. | Prekomjernost podataka - vrlo niska. |
8) | Brža obrada kocke. | Složeno spajanje usporava obradu kocke. |
P # 10) Koja je razlika između Skladišta podataka i Operativne baze podataka?
Odgovor: Donja tablica objašnjava razlike:
Skladište podataka | Operativna baza podataka | |
---|---|---|
7) | Podržava nekoliko OLTP-a poput istodobnih klijenata. | Podržava mnoge istodobne klijente. |
1) | Oni su dizajnirani da podrže analitičku obradu velikog volumena. | Oni podržavaju obradu transakcija velikog volumena. |
2) | Povijesni podaci utječu na skladište podataka. | Trenutni podaci utječu na operativnu bazu podataka. |
3) | Novi, hlapljivi podaci dodaju se redovito, ali se i dalje rijetko mijenjaju. | Podaci se redovito ažuriraju prema potrebi. |
4) | Dizajniran je za analizu poslovnih mjera prema atributima, predmetnim područjima i kategorijama. | Dizajniran je za obradu u realnom vremenu i poslovanje. |
5) | Optimizirano za velika opterećenja i složene upite koji pristupaju mnogim redovima za svakim stolom. | Optimizirano za jednostavan skup transakcija poput dohvaćanja i dodavanja jednog po jednog retka za svaku tablicu. |
6) | Pun je valjanih i dosljednih informacija i ne treba provjeru u stvarnom vremenu. | Poboljšano za provjeru valjanosti dolaznih podataka i koristi tablice podataka provjere valjanosti. |
8) | Njegovi su sustavi uglavnom orijentirani na predmet. | Njegovi su sustavi uglavnom orijentirani na procese. |
9) | Podaci van. | Podaci u. |
10) | Može se pristupiti ogromnom broju podataka. | Može se pristupiti ograničenom broju podataka. |
jedanaest) | Stvoreno za OLAP, on-line analitičku obradu. | Stvoreno za OLTP, on-line obradu transakcija. |
P # 11) Istaknite razliku između OLTP-a i OLAP-a.
Odgovor: Tablica u nastavku objašnjava razlike:
OLTP | OLAP | |
---|---|---|
7) | Količina podataka nije jako velika. | Ima veliku količinu podataka. |
1) | Koristi se za upravljanje operativnim podacima. | Koristi se za upravljanje informacijskim podacima. |
2) | Klijenti, službenici i IT stručnjaci ga koriste. | Koriste ga menadžeri, analitičari, rukovoditelji i drugi radnici u znanju. |
3) | Orijentiran je na kupca. | Orijentiran je na tržište. |
4) | Upravlja trenutnim podacima, onima koji su izuzetno detaljni i koriste se za donošenje odluka. | Upravlja ogromnom količinom povijesnih podataka. Također pruža mogućnosti za agregiranje i sažimanje, zajedno s upravljanjem i pohranjivanjem podataka na različitim razinama detaljnosti. Stoga podaci postaju ugodniji za upotrebu u donošenju odluka. |
5) | Ima veličinu baze podataka od 100 MB-GB. | Ima veličinu baze podataka od 100 GB-TB. |
6) | Koristi model podataka ER (odnos entiteta) zajedno s dizajnom baze podataka koji je orijentiran na primjenu. | OLAP koristi model pahuljice ili zvjezdice zajedno s dizajnom baze podataka koji je orijentiran na temu. |
8) | Način pristupa - čitanje / pisanje. | Način pristupa je uglavnom pisanje. |
9) | Potpuno normalizirano. | Djelomično normalizirano. |
10) | Njegova brzina obrade je vrlo brza. | Njegova brzina obrade ovisi o broju datoteka koje sadrži, složenim upitima i paketnom osvježavanju podataka |
P # 12) Objasnite glavni koncept koji stoji iza okvira Apache Hadoop-a.
Odgovor: Temelji se na algoritmu MapReduce. U ovom algoritmu za obradu ogromnog skupa podataka koriste se operacije Mapiranje i Smanjenje. Mapira, filtrira i sortira podatke, dok Smanji, sažima podatke. Skalabilnost i tolerancija kvarova ključne su točke ovog koncepta. Te značajke možemo postići u Apache Hadoopu učinkovitom primjenom MapReduce i Multi-threadinga.
P # 13) Jeste li ikad radili s Hadoop Frameworkom?
(slika izvor )
Odgovor: Mnogi menadžeri za zapošljavanje u intervjuu pitaju za alat Hadoop kako bi znali jeste li upoznati s alatima i jezicima koje tvrtka koristi. Ako ste surađivali s Hadoop Frameworkom, recite im detalje svog projekta kako bi osvijetlili vaše znanje i vještine s alatom i njegovim mogućnostima. A ako nikada niste surađivali s njim, također će uspjeti neka istraživanja koja pokazuju neko poznavanje njegovih atributa.
Možeš reći, na primjer, “Tijekom rada na timskom projektu imao sam priliku surađivati s Hadoopom. Bili smo fokusirani na povećanje učinkovitosti obrade podataka, pa smo se, zbog njegove sposobnosti da poveća brzinu obrade podataka, bez narušavanja kvalitete tijekom distribuirane obrade, odlučili koristiti Hadoop.
A kako je moja prethodna tvrtka tijekom sljedećih nekoliko mjeseci očekivala značajan porast obrade podataka, dobro je došla i njezina skalabilnost. Hadoop je također mreža otvorenog koda koja se temelji na Javi, što je čini najboljom opcijom za projekte s ograničenim resursima i jednostavnom za upotrebu bez ikakvog dodatnog osposobljavanja. '
koji je najbolji program za uklanjanje zlonamjernog softvera
P # 14) Spomenite neke važne značajke Hadoopa.
Odgovor: Značajke su sljedeće:
- Hadoop je besplatni okvir otvorenog koda u kojem možemo izmijeniti izvorni kod prema našim zahtjevima.
- Podržava brže distribuiranu obradu podataka. HDFS Hadoop podatke pohranjuje distribuirano i koristi MapReduce za paralelnu obradu podataka.
- Hadoop je vrlo tolerantan i prema zadanim postavkama, na različitim čvorovima, omogućava korisniku da stvori tri replike svakog bloka. Dakle, ako je jedan od čvorova neuspješan, možemo oporaviti podatke s drugog čvora.
- Također je prilagodljiv i kompatibilan je s mnogim hardverima.
- Budući da je Hadoop podatke pohranjivao u klastere, neovisno o svim ostalim operacijama. Stoga je pouzdan. Na pohranjene podatke ne utječe neispravan rad strojeva. I tako je vrlo dostupan.
P # 15) Kako možete povećati poslovni prihod analizom velikih podataka?
Odgovor: Analiza velikih podataka vitalni je dio poduzeća jer im pomaže da se međusobno razlikuju, uz povećanje prihoda. Analitika velikih podataka nudi prilagođene prijedloge i preporuke tvrtkama putem prediktivne analize.
Također pomaže tvrtkama u lansiranju novih proizvoda na temelju preferencija i potreba kupaca. To pomaže tvrtkama da zarade znatno više, otprilike 5-20% više. Tvrtke poput Bank of America, LinkedIn, Twitter, Walmart, Facebook itd. Koriste Big Data Analysis za povećanje prihoda.
P # 16) Koje korake morate slijediti tijekom postavljanja rješenja za velike podatke?
Odgovor: Tijekom postavljanja rješenja za velike podatke treba slijediti tri koraka:
- Unos podataka - To je prvi korak u implementaciji rješenja za velike podatke. To je izdvajanje podataka iz različitih izvora kao što su SAP, MYSQL, Salesforce, datoteke dnevnika, interna baza podataka itd. Unos podataka može se dogoditi putem strujanja u realnom vremenu ili batch poslova.
- Pohrana podataka- Nakon što se podaci unesu, izvađeni podaci trebaju se negdje pohraniti. Pohranjuje se u HDFS ili NoSQL bazama podataka. HDFS dobro radi za sekvencijalni pristup putem HBase za slučajni pristup čitanju ili pisanju.
- Obrada podataka- Ovo je treći i završni korak za implementaciju rješenja za velike podatke. Nakon pohrane, podaci se obrađuju kroz jedan od glavnih okvira poput MapReduce ili Pig.
P # 17) Što je skener blokova i blokova u HDFS-u?
Odgovor: Blok je minimalna količina podataka koja se može zapisati ili pročitati u HDFS-u. 64 MB je zadana veličina bloka.
Skener blokova program je koji povremeno prati broj blokova na DataNodeu, zajedno s provjerom mogućih pogrešaka kontrolne sume i oštećenja podataka.
P # 18) Koji su izazovi s kojima ste se suočili prilikom uvođenja novih aplikacija za analitiku podataka ako ste ih ikad uveli?
Odgovor: Ako nikada niste uveli novu analitiku podataka, možete to jednostavno reći. Budući da su prilično skupe i stoga tvrtke često to ne čine. Ali ako se tvrtka odluči u nju uložiti, to može biti izuzetno ambiciozan projekt. Za instaliranje, povezivanje, upotrebu i održavanje ovih alata trebali bi visoko obučeni zaposlenici.
Dakle, ako ste ikad prošli postupak, recite im s kojim ste se preprekama suočili i kako ste ih prevladali. Ako niste, detaljno im recite što znate o postupku. Ovo pitanje određuje imate li osnovni know-how za rješavanje problema koji bi se mogli pojaviti tijekom uvođenja novih aplikacija za analitiku podataka.
Uzorak odgovora; “Bio sam dio uvođenja nove analitike podataka u svojoj prethodnoj tvrtki. Čitav je postupak razrađen i treba mu dobro isplanirani postupak za što glatkiji prijelaz.
Međutim, čak i uz besprijekorno planiranje, ne možemo uvijek izbjeći nepredviđene okolnosti i probleme. Jedno od takvih problema bila je nevjerojatno velika potražnja za korisničkim licencama. Išlo je i dalje od onoga što smo očekivali. Za dobivanje dodatnih licenci tvrtka je morala preraspodijeliti financijska sredstva.
Također, trening je trebao biti planiran na način da ne ometa tijek rada. Također, morali smo optimizirati infrastrukturu kako bismo podržali velik broj korisnika. '
P # 19) Što ako se NameNode sruši na HDFS klasteru?
Odgovor: Klaster HDFS ima samo jedan NameNode i održava metapodatke DataNode-a. Imati samo jedan NameNode daje HDFS klasterima jednu točku kvara.
Dakle, ako se NameNode sruši, sustavi mogu postati nedostupni. Da bismo to spriječili, možemo odrediti sekundarni NameNode koji uzima periodične kontrolne točke u HDFS datotečnim sustavima, ali nije sigurnosna kopija NameNode. Ali možemo ga koristiti za ponovno stvaranje NameNode i ponovno pokretanje.
P # 20) Razlika između NAS i DAS u klasteru Hadoop.
Odgovor: U NAS-u su slojevi za pohranu i računi odvojeni, a zatim se pohrana distribuira između različitih poslužitelja na mreži. Dok je u DAS-u, pohrana je obično priključena na računski čvor. Apache Hadoop temelji se na principu obrade u blizini određenog mjesta s podacima.
Stoga bi disk za pohranu trebao biti lokalni za računanje. DAS vam pomaže postići performanse na Hadoop klasteru i može se koristiti na robnom hardveru. Jednostavnim riječima, isplativije je. Poželjna je NAS pohrana s velikom širinom pojasa od oko 10 GbE.
P # 21) Je li izgradnja NoSQL baze podataka bolja od izrade relacijske baze podataka?
(slika izvor )
Odgovor: Kao odgovor na ovo pitanje, morate pokazati svoje znanje o obje baze podataka. Također, morate to potkrijepiti primjerom situacije koja pokazuje kako ćete ili ste primijenili know-how u stvarnom projektu.
Vaš bi odgovor mogao biti otprilike ovako: „U nekim bi situacijama moglo biti korisno izgraditi NoSQL bazu podataka. U mojoj posljednjoj tvrtki kada se franšizni sustav eksponencijalno povećavao, morali smo se brzo povećavati kako bismo maksimalno iskoristili sve operativne i prodajne podatke koje smo imali.
Skaliranje je bolje od skaliranja s većim poslužiteljima kada se radi s povećanim opterećenjem obrade podataka. Isplativo je i lakše ga je postići s NoSQL bazama podataka jer se lako može nositi s ogromnim količinama podataka. To vam dobro dođe kada u budućnosti trebate brzo reagirati na značajne pomake opterećenja podataka.
Iako relacijske baze podataka imaju bolju povezanost s bilo kojim analitičkim alatima. No, NoSQL baze podataka mogu puno ponuditi. '
P # 22) Što učiniti kada naiđete na neočekivani problem s održavanjem podataka? Jeste li isprobali neko pravo rješenje za to?
Odgovor: Neizbježno se svako malo pojavljuju neočekivani problemi u svakom rutinskom zadatku, čak i tijekom održavanja podataka. Ovo pitanje želi znati možete li se nositi sa situacijama pod visokim pritiskom i kako.
Možete reći nešto poput „Održavanje podataka može biti rutinski zadatak, ali od vitalne je važnosti pažljivo praćenje određenih zadataka, uključujući osiguravanje uspješnog izvršavanja skripti.
Jednom sam tijekom provođenja provjere integriteta naišao na korumpirani indeks koji je mogao izazvati ozbiljne probleme u budućnosti. Zbog toga sam smislio novi zadatak održavanja kako bih spriječio dodavanje oštećenih indeksa u bazu podataka tvrtke. '
P # 23) Jeste li ikada obučili nekoga u svom području? Ako da, što vam se učinilo najizazovnije u vezi s tim?
Odgovor: Obično su podatkovni inženjeri potrebni za osposobljavanje svojih suradnika na novim sustavima ili procesima koje ste stvorili ili obuku novih zaposlenika na već postojećim sustavima i arhitekturi. Dakle, ovim pitanjem vaš ispitivač želi znati možete li se nositi s tim. Ako niste imali priliku nekoga trenirati sami, razgovarajte o izazovima nekoga tko je trenirao ili znate da ste se suočavali.
Uzorak idealnog odgovora bit će otprilike ovakav. “Da, imao sam priliku obučiti male i velike obje skupine suradnika. Obuka novih zaposlenika sa značajnim iskustvom u drugoj tvrtki najizazovniji je zadatak s kojim sam se susreo. Često su toliko naviknuti pristupiti podacima iz jedne različite perspektive da se bore prihvatiti način na koji radimo stvari.
Često su izrazito samopromišljeni i misle da sve dobro znaju i zato im treba puno vremena da shvate da problem može imati više rješenja. Pokušavam ih potaknuti da otvore svoj um i prihvate alternativne mogućnosti naglašavajući koliko su naša arhitektura i procesi bili uspješni. '
P # 24) Koje su prednosti i nedostaci rada u računalstvu u oblaku?
(slika izvor )
Odgovor:
Pros:
- Bez troškova infrastrukture.
- Minimalno upravljanje.
- Nema gnjavaže oko upravljanja i administracije.
- Jednostavan pristup.
- Platite za ono što koristite.
- Pouzdan je.
- Nudi kontrolu podataka, izradu sigurnosnih kopija i oporavak.
- Ogromna pohrana.
Protiv:
- Za dobro funkcioniranje potrebna mu je dobra internetska veza s jednako dobrom propusnošću.
- Ima zastoja.
- Vaša će kontrola infrastrukture biti ograničena.
- Malo je fleksibilnosti.
- Ima određene trajne troškove.
- Možda postoje sigurnosni i tehnički problemi.
P # 25) Rad inženjera podataka obično je 'iza kulisa'. Je li vam ugodno raditi dalje od 'reflektora'?
Odgovor: Vaš menadžer za zapošljavanje želi znati volite li svjetlo reflektora ili možete dobro raditi u obje situacije. Vaš bi im odgovor trebao reći da, iako volite svjetlost reflektora, ugodno vam je raditi i u pozadini.
“Ono što mi je važno jest da bih trebao biti stručnjak u svom području i doprinijeti rastu svoje tvrtke. Ako moram raditi u središtu pozornosti, ugodno mi je i to raditi. Ako postoji problem s kojim se rukovoditelji trebaju pozabaviti, neću se ustručavati podići svoj glas i skrenuti im pažnju. '
P # 26) Što se događa kada skener blokova otkrije oštećeni podatkovni blok?
Odgovor: Prije svega DataNode izvještava NameNode. Tada NameNode započinje stvaranje nove replike putem replike oštećenog bloka. Oštećeni blok podataka neće se izbrisati ako se broj replikacija desnih replika podudara s faktorom replikacije.
P # 27) Jeste li ikad pronašli novu inovativnu uporabu za već postojeće podatke? Je li to pozitivno utjecalo na tvrtku?
Odgovor: Ovo je pitanje namijenjeno njima da saznaju jeste li dovoljno motivirani i željni da doprinesete uspjehu projekata. Ako je moguće, odgovorite na pitanje primjerom kada ste preuzeli odgovornost za projekt ili iznijeli ideju. A ako ste ikada predstavili novo rješenje problema, nemojte ga ni propustiti.
Primjer odgovora: “Na svom posljednjem poslu sudjelovao sam u otkrivanju zašto imamo visoku stopu fluktuacije zaposlenika. Pomno sam promatrao podatke iz različitih odjela gdje sam pronašao visoko korelirane podatke u ključnim područjima poput financija, marketinga, poslovanja itd. I stope fluktuacije zaposlenika.
Surađivao s analitičarima odjela radi boljeg razumijevanja tih korelacija. S našim razumijevanjem napravili smo neke strateške promjene koje su pozitivno utjecale na stopu fluktuacije zaposlenih. '
P # 28) Koje su ti netehničke vještine najbolje korisne kao inženjer podataka?
Odgovor: Pokušajte izbjeći najočitije odgovore poput komunikacije ili međuljudskih vještina. Možete reći: „Određivanje prioriteta i multitasking često su mi dobro došli u posao. U danu dobivamo razne zadatke jer radimo s različitim odjelima. Stoga nam postaje vitalno da im damo prioritet. Olakšava nam posao i pomaže nam da ih sve učinkovito dovršimo. '
P # 29) Koji su uobičajeni problemi s kojima ste se suočili kao inženjer podataka?
Odgovor: To su:
- Kontinuirana integracija u stvarnom vremenu.
- Pohranjivanje ogromnih količina podataka i informacija iz tih podataka.
- Ograničenja resursa.
- Uzimajući u obzir koje alate koristiti i koji mogu donijeti najbolje rezultate.
Zaključak
Inženjering podataka možda zvuči kao rutinski dosadan posao, ali ima mnogo zanimljivih aspekata. To je vidljivo iz mogućih scenarija koja bi anketari mogli postaviti. Trebali biste biti spremni odgovoriti ne samo na tehnička knjiška pitanja već i na situacijska pitanja poput gore navedenih. Tek tada ćete moći dokazati da svoj posao možete dobro raditi i zaslužiti.
Sve najbolje!!
Preporučena literatura
- Intervjuirajte pitanja i odgovore
- Pitanja i odgovori za ispitivanje ETL-a
- Top 32 najbolja pitanja i odgovori za intervju za datastage
- Najčešća pitanja i odgovori za JSON intervjue
- Najpopularnija pitanja i odgovori za intervjue Teradata
- Top 24 pitanja za modeliranje podataka s intervjuima s detaljnim odgovorima
- Top 50 i više pitanja i odgovora za intervjue u bazi podataka
- Top 30 pitanja i odgovora za intervjue sa SAS-a