top 30 sas interview questions
Popis najpopularnijih Često postavljanih SAS-ovih intervjua s odgovorima:
U ovom ćemo članku pogledati neke od osnovnih, ali i naprednih koncepata SAS programiranja kroz najčešće postavljana pitanja i odgovore na SAS intervjue.
Sustav statističke analize, poznatiji kao SAS, smatra se skupom višestrukog softvera koji je integriran i koristi se za razne operacije poput upravljanja podacima, prediktivne - perspektivne i opisne analize, poboljšanja kvalitete, poslovne analize, razvoja aplikacija itd.
SAS-ov velik broj prilagodbi komponenata, kao i opsežna programska pristupna značajka, zajedno obavlja zadatke Analize podataka i Transformacije podataka. Može se izvoditi na bilo kojem operativnom sustavu (Linux, Windows, itd.) Jer je neovisan o platformi.
Najpopularnija pitanja i odgovori na intervjuu za SAS
Idemo..
P # 1) Navedite funkcije koje izvodi SAS.
Odgovor: SAS (sustav statističke analize) ima svoju važnost u svakoj poslovnoj domeni.
U nastavku su navedene neke sažete funkcije koje obavlja SAS:
- Upravljanje podacima i upravljanje projektima
- Skladištenje podataka
- Operativno istraživanje i podrška odlukama
- Dohvat podataka i upravljanje kvalitetom
- Poslovno planiranje
- Statistička analiza
P # 2) Koje su 3 komponente u SAS programiranju?
Odgovor: 3 komponente u SAS programiranju su:
- Izjave
- Varijable
- Skup podataka
P # 3) Navedite pravila sintakse koja se slijede u SAS izrazima.
Odgovor: SAS program napisan je u prozoru uređivača. Ovdje sadrži niz izjava praćenih odgovarajućom sintaksom kako bi ga SAS program mogao razumjeti.
Neka od sintaksnih pravila koja se slijede u slučaju komponente Statement SAS-a su sljedeća:
- Kraj bilo koje izjave označen je zarezom (;).
- Tačka i zarez također se koristi za odvajanje više izjava koje se pojavljuju u jednom retku.
- SAS izrazi ne razlikuju velika i mala slova i dodatni razmak prije nego što se izrazi automatski uklone.
- Komentari se mogu uključiti u program SAS za izjave na dva različita načina kao što su:
- Redak koji započinje zvjezdicom (*) i završava točkom i zarezom (;).
- Redak koji započinje kosom crtom i zvjezdicom (/ *), a završava zvjezdicom i kosom crtom (* /).
P # 4) Koje su vrste podataka koje sadrži SAS?
Odgovor: ‘Numerički’ i 'Lik' dvije su vrste podataka koje program SAS sadrži.
P # 5) Što su PDV i njihove funkcije?
Odgovor: Programski vektor podataka (PDV) logičan je koncept i definiran je kao područje memorije u kojem SAS gradi skup podataka.
Funkcije PDV-a su sljedeće:
- Stvara se baza podataka koja ima jedno opažanje odjednom.
- Ulazni me uspremnik za držanje podataka iz vanjske datoteke stvara se u vrijeme kompilacije.
- PDV sadrži dvije automatske varijable, naime, _N_ (prikazuje broj podatkovnog koraka koji se izvršava) i _ERROR_ (obavještava o pogrešci koja se javlja u trenutku izvršenja).
P # 6) Što znate o skupu podataka SAS?
Odgovor: SAS podaci se u osnovi nazivaju podacima koji su dostupni za analizu u okviru SAS programa. SAS skup podataka naziva se i tablicom podataka SAS.
Tablica podataka SAS sastoji se od dva dijela:
- Stupci varijabli
- Redovi zapažanja
Korisne informacije o skupu podataka SAS mogu se sažeti kako slijedi:
- SAS skup podataka može čitati, kao i ugrađeni izvori podataka za upotrebu poput Excel-a, Access-a itd.
- Skup podataka koji se koristi samo u trenutnom izvođenju sesije i odbacuje se nakon završetka sesije poznat je kao Privremeni skup podataka.
- Skup podataka koji je pohranjen za upotrebu u budućoj sesiji poznat je i pod nazivom Trajni skup podataka.
- Ugrađenom skupu podataka može se pristupiti putem ove staze Knjižnice -> Moje knjižnice-> POMOĆ.
P # 7) Objasnite zašto se dvostruki prateći @@ koristi u ulaznim izjavama?
Odgovor: Tijekom iteracije koraka podataka, uključujući dvostruko praćenje @@ u ulaznim izrazima podrazumijeva da SAS treba držati trenutni zapis u svrhu izvršavanja sljedećeg ulaznog izraza, umjesto da se prebacuje na novi zapis.
P # 8) Objasnite razliku između NODUP i NODUPKEY opcija?
Odgovor: Za uklanjanje dvostrukih vrijednosti iz tablice, PROC SORT je u osnovi kategoriziran između dvije mogućnosti:
- NODUP
- NODUPKEY
Razlika između ove dvije mogućnosti može se vidjeti u nastavku:
NODUPKEY | NODUP |
---|---|
Uspoređuje samo varijablu BY prisutnu u skupu podataka. | Uspoređuje sve varijable prisutne u skupu podataka. |
Uklanja dvostruke opcije za vrijednosti varijable navedene u BY izrazu. | Identificira i uklanja dvostruka zapažanja. |
Sintaksa: PODACI O SORTIRANJU PROCESA = readin NODUPKEY; BY naziv varijable; TRČANJE; | Sintaksa: PODACI O SORTIRANJU PROCESA = readin NODUP; BY naziv varijable; TRČANJE; |
P # 9) Koja se naredba koristi za sortiranje u programu SAS?
Odgovor: Naredba PROC SORT koristi se za izvršavanje sortiranja, bilo da je riječ o jednoj varijabli ili više varijabli. Ova se naredba izvodi na skupu podataka gdje je novi skup podataka stvoren kao rezultat sortiranja, ali izvorni skup podataka ostaje nepromijenjen.
Sintaksa:
PROC SORT DATA=original OUT=Sorted; BY variable;
Gdje,
'Izvorno' odnosi se na izvorni skup podataka
'Sortirano' se odnosi na rezultat kao na sortirani skup podataka
‘Varijabla’ se odnosi na stupac na kojem se vrši sortiranje.
Sortiranje se može obaviti u uzlaznom i silaznom redoslijedu.
Da bi se skup podataka prikazao u opadajućem redoslijedu, u izrazu BY koristi se ključna riječ 'Silazno' s nazivom stupca na kojem će se izvršiti sortiranje.
PROC SORT DATA=original OUT=Sorted; BY DESCENDING variable
P # 10) Na primjeru objasnite razliku između Informat i Format.
Odgovor: Razlika između Informat i Format može se objasniti kao:
Saznaj više | Format |
---|---|
Navedite SAS kako čitati podatke u SAS varijablu. | Navedite SAS kako prikazati vrijednosti u varijabli. |
Koriste se za čitanje podataka ili preuzimanje ulaznih podataka iz vanjskih datoteka. | Oni se koriste za upisivanje podataka. |
P # 11) Razlikovati INPUT i INFILE.
Odgovor: Uključivanje izraza INFILE unutar programa SAS identificira vanjsku datoteku koja se sastoji od podataka, dok uključivanje izraza INPUT u programiranje SAS opisuje korištene varijable.
Sintaksa za INFILE:
INFILE ‘filename’;
Sintaksa za INPUT:
INPUT ‘varname1’ ‘varname2’;
P # 12) Objasnite upotrebu PROC ispisa i PROC sadržaja?
Odgovor: PROC korak programa SAS koristi se za pozivanje ugrađenih postupaka za analizu podataka skupa podataka.
PROC ispis: Osigurava da se podaci prisutni u skupu podataka čitaju ispravno.
Sadržaj PROC-a: Prikazuje informacije o SAS skupu podataka.
P # 13) Objasniti DATA_NULL_?
Odgovor: Kao što naziv definira, DATA_NULL_ je podatkovni korak koji zapravo ne stvara nikakav skup podataka.
Koristi se za:
- Stvaranje makro varijabli.
- Zapisivanje rezultata bez ikakvog skupa podataka.
P # 14) Kako se znakovna varijabla pretvara u numeričku varijablu i obrnuto?
Odgovor: U okviru SAS programiranja javljaju se mnogi zadaci kod kojih se vrijednost znaka treba pretvoriti u brojčanu, a na isti način numerička vrijednost treba pretvoriti u vrijednost znaka.
STAVITI() koristi se za pretvaranje numeričkog u znak. U tom slučaju, izvorni format i vrsta varijable izvora moraju uvijek biti slični.
Primjer:
char_var= PUT( num_var, 6.);
INPUT () koristi se za pretvaranje znaka u numerički. U ovom slučaju, vrsta izvorne varijable uvijek moraju biti varijable znakova.
Primjer:
Num_var= INPUT(char_var,2.0);
P # 15) Koja je svrha _CHARACTER_ i _NUMERIC_?
Odgovor: U trenutnom skupu podataka
_LIK_ definira sve trenutno definirane varijable znakova.
Primjer : Za uključivanje svih varijabli znakova u PROC MEANS koriste se sljedeće izjave:
PROC MEANS; Var_character_; Run;
_NUMERIC_ definira sve numeričke varijable koje su trenutno definirane.
Primjer: Za uključivanje svih numeričkih varijabli u PROC MEANS koriste se sljedeće izjave:
PROC MEANS; Var_numeric_; Run;
P # 16) Koje se naredbe koriste u slučaju uključivanja ili isključivanja bilo kojih specifičnih varijabli u skupu podataka?
Odgovor: U tu svrhu koriste se DROP, KEEP i opcije skupa podataka.
Varijabla koju želimo ukloniti iz koraka podataka navedena je u izrazu DROP.
Varijabla koju želimo zadržati iz podatkovnog koraka navedena je u KEEP izrazu.
P # 17) Razlikovati PROC SREDSTVA i PROC SAŽETAK.
Odgovor: Razlika između PROC MEANS i PROC SAŽETAK može se shvatiti na sljedeći način:
PROC SREDSTVA | SAŽETAK PROC |
---|---|
Ovaj postupak prema zadanim postavkama daje ispisano izvješće u prozoru IZLAZ. | Ovaj postupak uključuje PRINT u izjavi za izradu tiskanog izvješća. |
PROC MEANS prema zadanim postavkama uzima sve numeričke varijable u analizi. | PROC SAŽETAK uzima varijable u statističku analizu opisane u VAR izjavi. |
P # 18) Objasnite svrhu SUBSTR funkcija u SAS programiranju.
Odgovor: U SAS programiranju, kad god postoji zahtjev programa da apstrahira podniz, funkcija SUBSTR koristi se u slučaju varijable znaka.
Kada su navedeni početni položaj i duljina, tada se ova funkcija koristi za apstrahiranje niza znakova.
Sintaksa: SUBSTR (char_var, početak, duljina);
P # 19) Navedite i opišite nekoliko funkcija SAS znakova koje se ukratko koriste za čišćenje podataka.
Odgovor: U nastavku je navedeno nekoliko funkcija SAS znakova koje se koriste za čišćenje podataka:
- Sažimanje (char_string) funkcija koristi se za uklanjanje praznih mjesta ili nekih zadanih znakova iz zadanog niza.
- TRIM (str) funkcija koristi se za uklanjanje praznih praznih mjesta iz zadanog niza.
- LOWCASE (char_string) funkcija koristi se za pretvaranje svih znakova u zadanom nizu u mala slova.
- UPCASE (char_string) funkcija koristi se za pretvaranje svih znakova u zadanom nizu u velika slova.
- COMPBL (str) funkcija koristi se za pretvaranje više praznih mjesta u jednu prazninu.
P # 20) Spomenite nekoliko načina na koje se 'traženje tablice' vrši u SAS programiranju.
Odgovor: U SAS programiranju, vrijednosti pretraživanja tablice mogu se pohraniti na sljedeće načine:
- Kodirati
- Niz
- Hash objekt
- Format
- Skup podataka
Sljedeće se tehnike koriste za izvođenje 'pretraživanja tablice' u SAS-u:
- SELECT / WHEN ili IF / THEN izjave
- Vrijednost indeksa niza
- Vrijednost ključa hash objekta
- Izraz FORMAT, funkcija PUT
- Spajanje, pridruživanje, KLJUČ = Opcija
Pogledajmo primjer koji pokazuje način 'Code' za izvođenje pretraživanja tablice pomoću izraza 'IF / THEN':
data location; set myinfo; if AreaCode='226' then Location='Ontario, Canada'; else if AreaCode='212' then Location='New York, NY'; else Location='Unknown'; run;
P # 21) Razlikovati funkcije CEIL i FOOOR.
Odgovor: CEIL funkcija koristi se za skraćivanje numeričkih vrijednosti gdje prikazuje izlaz kao najmanji cijeli broj. Pod najmanjim cijelim brojem ovdje znači da je cijela vrijednost veća od / jednaka argumentu.
Primjer: CEIL (12.85) prikazat će izlaz kao 13.
FLOOR funkcija koristi se za skraćivanje numeričkih vrijednosti gdje prikazuje izlaz kao najveći cijeli broj. Pod najvećim cijelim brojem ovdje znači da je cijela vrijednost manja od / jednaka argumentu.
Primjer: FLOOR (12.85) prikazat će izlaz kao 12.
P # 22) Koji su načini na koje se makro varijable mogu stvoriti u SAS programiranju?
Odgovor: Pa se niz različitih tehnika može koristiti za stvaranje makro varijabli u SAS programiranju.
U nastavku je navedeno pet najčešće korištenih metoda:
- Izjava% LET
- Makro parametri (imenovani kao i pozicijski)
- Izvještaj% DO (iterativno)
- INTO u PROC SQL
- RUTA CALL SYMPUTX
P # 23) Objasnite svrhu izjave RETAIN.
Odgovor: Kako značenje riječi ‘RETAIN’ znači zadržati vrijednost jednom dodijeljenu, svrha RETAIN izraza je ista u SAS programiranju kao što to značenje podrazumijeva.
Unutar SAS programa, kada je potrebno prijeći s trenutne iteracije na sljedeći korak podataka, tada RETAIN naredba govori SAS-u da zadrži vrijednosti, a ne da ih postavi kao nedostajuće.
Primjer: Ispisujmo program koji će prikazati izlaznu vrijednost 'z' počevši od 1 pomoću izraza RETAIN.
data abc; set xyz; RETAIN z 0; z = z + 1; run;
P # 24) Koja se naredba koristi za spremanje zapisnika u vanjsku datoteku?
Odgovor: TISKANI PROCES naredba koristi se za spremanje dnevnika u vanjsku datoteku.
osnovna sql pitanja za intervju i odgovori za svježe
Primjer:
PROC PRINTTO log='C:UsersabcDownloadsLOG11.txt' new; run;
P # 25) Spomenite neke uobičajene pogreške koje su obično počinjene u SAS programiranju.
Odgovor: U nastavku su navedene neke od uobičajenih pogrešaka koje se obično čine, posebno kada ste novi u ovom programskom jeziku.
- Osnovna sintaksa uključuje točka i zarez na kraju svake izjave, a nedostatak zareza je najčešća pogreška.
- Provjeru dnevnika preskačete nakon podnošenja programa.
- Pogreške u komentiranju, poput propuštanja korištenja komentara po potrebi ili korištenja komentara na neprikladan način.
- Neupotreba ispravnih metoda otklanjanja pogrešaka.
P # 26) Spomenite opcije SAS sustava za otklanjanje pogrešaka u SAS makronaredbama.
Odgovor: Za pomoć u praćenju koda makronaredbe, kao i SAS koda generiranog makronaredbama, mogu se koristiti neke sistemske opcije.
Oni su:
- MLOGIKA
- MPRINT
- SIMBOLI
Poruka koju će generirati ove sistemske opcije može se vidjeti u SAS zapisniku.
P # 27) Razlikovati između SAS funkcija i SAS postupaka.
Odgovor: Glavne razlike mogu se otkriti / razumjeti slučajem objašnjenim i za SAS funkcije i za postupke.
Slučaj:
Za Funkcija , vrijednost argumenta se daje ili kaže uzetog za izračun kroz opažanje spomenuto u programskoj izjavi, dok se u slučaju Postupak , očekuje se da svako promatranje ima samo jednu varijablu kroz koju se vrši proračun kako je spomenuto u donjem primjeru.
Razumijemo to na primjerima:
data average; set temp; avgtemp = mean( of T1 – T24 ); run;
Ovdje u gornjim primjerima argumenti proslijeđeni srednjoj funkciji uzimaju se za izračunavanje kao promatranje.
proc sort; by month; run; proc means; by month; var avgtemp; run;
Ovdje u gornjem primjeru, Proc znači da funkcija izračunava prosječnu temperaturu za jedan argument koji se prenosi kao promatranje, tj. Po mjesecima.
P # 28) Što znate o SYMPUT i SYMGET?
Odgovor: Glavne razlike između njih dvije navedene su u nastavku.
SYMPUT se koristi za spremanje vrijednosti skupa podataka u makro varijablu, dok se SYMGET koristi za dohvaćanje vrijednosti iz makro varijable u skup podataka.
P # 29) Objasnite posebne granične vrijednosti ulaza koje se koriste u SAS programiranju.
Odgovor: Posebni graničnici ulaza koji se koriste u SAS programiranju su:
- DLM
- DSD
Koriste se u izjavi „INFILE“, a DSD ima funkciju zanemarivanja graničnika koji se pojavljuju zatvoreni u navodnicima.
P # 30) Koja se funkcija koristi za brojanje intervala između dva SAS datuma?
Odgovor: Funkcija intervala INTCK koristi se za brojanje broja intervala između dva zadana SAS datuma.
Sintaksa:
INTCK(interval,start-of-period,end-of-period)
Zaključak
Do sada smo vidjeli više pitanja i odgovora koji bi vam dali jasno razumijevanje programskih koncepata SAS-a, kao i ideju o prirodi pitanja koja se postavljaju u intervjuima sa SAS-om.
Pa, ako ste novi u SAS programiranju, znanje nekih tehnologija računalnog programiranja i poznavanje SQL-a (strukturirani jezik upita) dodatna će vam prednost za razumijevanje i brzo učenje SAS-a.
Nadam se, spremni ste se s bilo kojim razgovorom sa SAS-om pouzdano suočiti !!