weka tutorial how download
Ovaj WEKA vodič objašnjava što je Weka alat za strojno učenje, njegove značajke i kako preuzeti, instalirati i koristiti softver za strojno učenje Weka:
U Prethodni vodič , naučili smo o Support Vector Machine u ML-u i povezanim konceptima poput Hyperplane, Support Vectors & Applications of SVM.
Strojno učenje je područje znanosti u kojem strojevi djeluju kao umjetno inteligentan sustav. Strojevi mogu sami učiti bez potrebe za eksplicitnim kodiranjem. To je iterativni postupak koji pristupa podacima, uči sam i predviđa ishod. Za izvršavanje zadataka strojnog učenja potrebni su mnogi alati i skripte.
WEKA je platforma za strojno učenje koja se sastoji od mnogih alata koji olakšavaju mnoge aktivnosti strojnog učenja.
=> Pročitajte cjelovitu seriju treninga za strojno učenje
Što ćete naučiti:
- Što je WEKA
- Zaključak
Što je WEKA
Weka je alat otvorenog koda koji su osmislili i razvili znanstvenici / istraživači sa Sveučilišta Waikato na Novom Zelandu. WEKA je kratica za Waikato okruženje za analizu znanja. Razvila ga je međunarodna znanstvena zajednica i distribuira pod besplatnom GNU GPL licencom.
nedefinirana referenca na funkciju c ++
WEKA je u potpunosti razvijen na Javi. Pruža integraciju s SQL bazom podataka koristeći povezivanje Java baze podataka. Pruža mnoge algoritme strojnog učenja za provedbu zadataka rudarenja podataka. Ti se algoritmi mogu koristiti izravno pomoću alata WEKA ili se mogu koristiti s drugim programima koji koriste programski jezik Java.
Pruža puno alata za predobradu podataka, klasifikaciju, klasterizaciju, regresijsku analizu, stvaranje pravila pridruživanja, izdvajanje značajki i vizualizaciju podataka. Moćan je alat koji podržava razvoj novih algoritama u strojnom učenju.
Zašto koristiti WEKA alat za strojno učenje
Pomoću WEKE algoritmi strojnog učenja dostupni su korisnicima. ML stručnjaci mogu koristiti ove metode za izvlačenje korisnih informacija iz velike količine podataka. Ovdje stručnjaci mogu stvoriti okruženje za razvoj novih metoda strojnog učenja i njihovu primjenu na stvarnim podacima.
WEKA koriste istraživači strojnog učenja i primijenjenih znanosti u svrhe učenja. Učinkovit je alat za izvršavanje mnogih zadataka rudarenja podataka.
WEKA Preuzimanje i instalacija
# 1) Preuzmite softver sa ovdje .
Provjerite konfiguraciju računalnog sustava i preuzmite stabilnu verziju WEKA (trenutno 3.8) s ove stranice.
#dva) Nakon uspješnog preuzimanja otvorite mjesto datoteke i dvaput kliknite na preuzetu datoteku. Pojavit će se čarobnjak Step Up. Kliknite Dalje.
# 3) Otvorit će se uvjeti ugovora o licenci. Pročitajte ga temeljito i kliknite 'Slažem se'.
# 4) Prema vašim zahtjevima odaberite komponente koje želite instalirati. Preporučuje se kompletna instalacija komponenata. Kliknite Dalje.
# 5) Odaberite odredišnu mapu i kliknite Dalje.
# 6) Tada će započeti instalacija.
# 7) Ako Java nije instalirana u sustav, prvo će instalirati Java.
# 8) Nakon završetka instalacije pojavit će se sljedeći prozor. Kliknite Dalje.
pronađi naredbu u unixu s primjerima
# 9) Označite potvrdni okvir Start Weka. Kliknite Finish.
# 10) Otvara se prozor WEKA Tool i Explorer.
#jedanaest) WEKA priručnik možete preuzeti sa ovdje.
Grafičko korisničko sučelje WEKE
GUI WEKA daje pet mogućnosti: Explorer, Experimenter, Tok znanja, Workbench i Simple CLI. Razumijemo svaku od njih pojedinačno.
# 1) Jednostavni CLI
Jednostavni CLI je Weka Shell s naredbenim retkom i izlazom. Uz 'pomoć' može se vidjeti pregled svih naredbi. Jednostavni CLI nudi pristup svim klasama kao što su klasifikatori, klasteri i filtri itd.
Neke od jednostavnih CLI naredbi su:
- Pauza: Za zaustavljanje trenutne niti
- Izlaz: Izađite iz CLI-a
- Pomozite() : Izlazi pomoć za navedenu naredbu
- -java weka.classifiers.trees.J48 -t c: /temp/iris.arff: Da biste pozvali klasu WEKA, dodajte joj prefiks s Java. Ova naredba usmjerit će WEKA da učita klasu i izvrši je s danim parametrima. U ovoj se naredbi poziva J48 klasifikator na IRIS skupu podataka.
# 2) Istraživač
Prozori WEKA Explorera prikazuju različite kartice počevši od pretprocesa. U početku je kartica pretprocesa aktivna, jer se prvo skup podataka prethodno obrađuje prije primjene algoritama na njega i istražuje skup podataka.
Kartice su kako slijedi:
- Pretproces: Odaberite i izmijenite učitane podatke.
- Klasificiraj: Primijenite algoritme obuke i testiranja na podatke koji će klasificirati i regresirati podatke.
- Klastera: Oblikujte klastere iz podataka.
- Suradnik: Izdvoji pravilo povezivanja za podatke.
- Odaberite atribute: Primjenjuju se mjere odabira atributa.
- Vizualizirajte: Vidi se 2D prikaz podataka.
- Traka stanja: Donji dio prozora prikazuje statusnu traku. Ovaj odjeljak pokazuje što se trenutno događa u obliku poruke, na primjer, datoteka se učitava. Desnom tipkom miša kliknite ovo, Memorija informacija može se vidjeti, a također Trčanje smeće kolektor kako bi se oslobodio prostor može se pokrenuti.
- Gumb za zapisnik: Pohranjuje zapisnik svih radnji u Weki s vremenskom oznakom. Zapisnici se prikazuju u zasebnom prozoru kada se klikne gumb Dnevnik.
- Ikona ptice WEKA: Prisutno u donjem desnom kutu prikazuje WEKA pticu sa predstavlja broj procesa koji se istodobno izvode (za x.). Kad proces krene, ptica će se kretati.
# 3) Eksperimentator
Gumb WEKA eksperimentator omogućuje korisnicima stvaranje, pokretanje i izmjenu različitih shema u jednom eksperimentu na skupu podataka. Eksperimentator ima 2 tipa konfiguracije: Jednostavno i napredno. Obje konfiguracije omogućuju korisnicima pokretanje eksperimenata lokalno i na udaljenim računalima.
- Gumbi 'Otvori' i 'Novo' otvorit će novi prozor eksperimenta koji korisnici mogu učiniti.
- Rezultati: Postavite odredišnu datoteku rezultata iz datoteke ARFF, JDFC i CSV.
- Vrsta eksperimenta: Korisnik može birati između unakrsne provjere valjanosti i postotka podjele vlaka / testa. Korisnik može birati između klasifikacije i regresije na temelju skupa podataka i klasifikatora.
- Skupovi podataka: Korisnik ovdje može pregledavati i odabrati skupove podataka. Potvrdni okvir relativne staze klikće se ako se radi na različitim strojevima. Podržani format skupova podataka je ARFF, C4.5, CSV, libsvm, bsi i XRFF.
- Ponavljanje: Zadani broj iteracije postavljen je na 10. Skupovi podataka i algoritmi prvo pomažu u prebacivanju između skupa podataka i algoritama tako da se algoritmi mogu pokretati na svim skupovima podataka.
- Algoritmi: Nove algoritme dodaje 'Novo dugme'. Korisnik može odabrati klasifikator.
- Spremite eksperiment pomoću gumba Spremi.
- Izvedite eksperiment pomoću gumba Pokreni.
# 4) Tok znanja
Tok znanja prikazuje grafički prikaz WEKA algoritama. Korisnik može odabrati komponente i stvoriti tijek rada za analizu skupova podataka. Podaci se mogu rukovati serijski ili postupno. Mogu se dizajnirati paralelni tijekovi rada, a svaki će se izvoditi u zasebnoj niti.
Dostupne su različite komponente Izvori podataka, spasitelji podataka, filtri, klasifikatori, klasteri, procjena i vizualizacija.
# 5) Radni stol
WEKA ima modul radnog stola koji sadrži sve GUI-je u jednom prozoru.
Značajke WEKA Explorera
# 1) Skup podataka
Skup podataka sastoji se od stavki. Predstavlja objekt na primjer: u marketinškoj bazi podataka predstavljat će kupce i proizvode. Skupovi podataka opisani su atributima. Skup podataka sadrži korpe podataka u bazi podataka. Skup podataka sadrži atribute koji mogu biti nominalni, numerički ili niz. U Weki je skup podataka predstavljen s weka.core.Udaljenosti razred.
Prikaz skupa podataka s 5 primjera:
@podaci
sunčano, NETOČNO, 85,85, br
sunčano, TAČNO, 80,90, br
naoblačenje, NETOČNO, 83,86, da
kišovito, NETOČNO, 70,96, da
kišovito, NETOČNO, 68,80, da
Što je atribut?
Atribut je podatkovno polje koje predstavlja karakteristiku podatkovnog objekta. Na primjer, u bazi podataka kupaca atributi će biti customer_id, customer_email, customer_address itd. Atributi imaju različite vrste.
Ti su mogući tipovi:
A) Nominalni atributi: Atribut koji se odnosi na ime i ima unaprijed definirane vrijednosti kao što su boja, vrijeme. Ti se atributi nazivaju kategorički atributi . Ti atributi nemaju redoslijed i njihove se vrijednosti nazivaju i nabrajanjem.
@attribute outlook {sunčano, oblačno, kišovito}: deklaracija nominalnog atributa.
B) Binarni atributi: Ti atributi predstavljaju samo vrijednosti 0 i 1. To su vrste nominalnih atributa sa samo 2 kategorije. Ti se atributi nazivaju i logičkim.
C) Redni atributi: Atributi koji čuvaju neki poredak ili poredak među njima su redni atributi. Uzastopne vrijednosti nije moguće predvidjeti, već se održava samo redoslijed. Primjer: veličina, ocjena itd.
D) Numerički atributi: Atributi koji predstavljaju mjerljive veličine numerički su atributi. Oni su predstavljeni stvarnim brojevima ili cijelim brojevima. Primjer: temperatura, vlaga.
@attribute vlažnost stvarna: deklaracija numeričkog atributa
E) Atributi niza: Ti atributi predstavljaju popis znakova predstavljenih u dvostrukim navodnicima.
kako instancirati popis u javi
# 2) ARFF format podataka
WEKA radi na ARFF datoteci za analizu podataka. ARFF je skraćenica od Atribut File Relation File Format. Ima 3 odjeljka: relacija, atributi i podaci. Svaki odjeljak započinje s '@'.
ARFF datoteke uzimaju atribute podataka Nominal, Numeric, String, Date i Relational. Neki od dobro poznatih skupova podataka o strojnom učenju prisutni su u WEKA-i kao ARFF.
Format za ARFF je:
@odnos
@atribut
@podaci
Primjer ARFF datoteke je:
@relation weather @attribute outlook {sunny, overcast, rainy}: @attribute temperature real @attribute humidity real @attribute windy {TRUE, FALSE} @attribute play {yes, no} //class attribute: The class attribute represents the output. @data sunny, FALSE,85,85,no sunny, TRUE,80,90,no overcast, FALSE,83,86,yes rainy, FALSE,70,96,yes rainy, FALSE,68,80,yes
# 3) XRFF format podataka
XRFF je kratica za XML atribut Relation File Format. Predstavlja podatke koji mogu pohraniti komentare, atribute i težine instance. Ima ekstenziju .xrff i datoteku .xrff.gz (komprimirani format). Datoteke XRFF predstavljale su podatke u XML formatu.
# 4) Povezivanje baze podataka
Pomoću WEKA lako se povezati s bazom podataka pomoću JDBC upravljačkog programa. JDBC upravljački program potreban je za povezivanje s bazom podataka, primjer:
MS SQL Server (com.microsoft.jdbc.sqlserver.SQLServerDriver)
Oracle (oracle.jdbc.driver.OracleDriver)
# 5) Klasifikatori
Da bi predvidio izlazne podatke, WEKA sadrži klasifikatore. Algoritmi klasifikacije dostupni za učenje su stabla odlučivanja, vektorski strojevi potpore, klasifikatori zasnovani na primjerima i logistička regresija te Bayesove mreže. Ovisno o zahtjevu pomoću probe i testa, korisnik može pronaći odgovarajući algoritam za analizu podataka. Klasifikatori se koriste za klasificiranje skupova podataka na temelju karakteristika atributa.
# 6) Skupljanje
WEKA koristi karticu Klaster za predviđanje sličnosti u skupu podataka. Na temelju grupiranja korisnik može saznati atribute korisne za analizu i zanemariti druge atribute. Dostupni algoritmi za klasteriranje u WEKA su k-sredina, EM, paučina, X-sredina i FarhtestFirst.
# 7) Udruženje
Jedini algoritam dostupan u WEKA za otkrivanje pravila pridruživanja je Apriori.
# 8) Mjere odjeljka s atributima
WEKA koristi dva pristupa za najbolji odabir atributa u svrhu izračuna:
- Korištenje algoritma metode pretraživanja: Najbolje-prvo, odabir unaprijed, slučajni, iscrpni, genetski algoritam i algoritam rangiranja.
- Korištenje algoritama metode procjene: Na temelju korelacije, omot, dobivanje informacija, hi-kvadrat.
# 9) Vizualizacija
WEKA podržava 2D prikaz podataka, 3D vizualizacije s rotacijom i 1D prikaz jednog atributa. Ima opciju 'Jitter' za nominalne atribute i 'skrivene' podatkovne točke.
Ostale glavne značajke WEKE su:
- Riječ je o alatu otvorenog koda s grafičkim korisničkim sučeljem u obliku 'Explorera', 'Experimenter' i 'Flow Knowledge'.
- Neovisan je o platformi.
- Sadrži 49 alata za obradu podataka.
- 76 algoritama klasifikacije i regresije, 8 algoritama klasteriranja prisutno je u WEKA-i
- Ima 15 algoritama za odabir atributa i 10 algoritama za odabir značajki.
- Ima 3 algoritma za pronalaženje pravila pridruživanja.
- Koristeći WEKA, korisnici mogu razviti prilagođeni kôd za strojno učenje.
Zaključak
U ovom WEKA vodiču pružili smo uvod u otvoreni softver WEKA za strojno učenje i objasnili postupak preuzimanja i instalacije korak po korak. Također smo vidjeli pet opcija dostupnih za grafičko korisničko sučelje Weka, a to su Explorer, Experimenter, Tok znanja, Workbench i Simple CLI.
O značajkama WEKE također smo saznali s primjerima. Značajke uključuju Skup podataka, ARFF format podataka, povezivanje s bazom podataka itd.
=> Posjetite ovdje za ekskluzivnu seriju strojnog učenja
Preporučena literatura
- WEKA skup podataka, klasifikator i algoritam J48 za stablo odlučivanja
- WEKA Explorer: Vizualizacija, klasteriranje, rudarenje pravila pridruživanja
- 11 Najpopularnijih softverskih alata za strojno učenje 2021. godine
- Cjelovit vodič za umjetnu neuronsku mrežu u strojnom učenju
- Data Mining vs Machine Learning vs Artificial Intelligence vs Deep Learning
- Vodič za strojno učenje: Uvod u ML i njegove primjene
- Top 13 NAJBOLJIH tvrtki za strojno učenje (Ažurirano 2021 popis)
- Što je podrška za vektorski stroj (SVM) u strojnom učenju