Da biste pristupili BigQuery ML-u, trebate slijediti niz koraka koji uključuju postavljanje vašeg Google Cloud projekta, omogućavanje potrebnih API-ja, kreiranje BigQuery skupa podataka i konačno, izvršavanje SQL upita za obuku i procjenu modela mašinskog učenja.
Prvo morate kreirati Google Cloud projekat ili koristiti postojeći. Ovaj projekat će služiti kao kontejner za sve vaše resurse, uključujući BigQuery skupove podataka i modele mašinskog učenja. Nakon što postavite svoj projekat, morate omogućiti potrebne API-je. Konkretno, trebali biste omogućiti BigQuery API i Cloud Machine Learning Engine API.
Nakon što omogućite potrebne API-je, možete kreirati BigQuery skup podataka. Skup podataka je kontejner za vaše BigQuery tabele i modele mašinskog učenja. Možete kreirati skup podataka putem Google Cloud Console, alata komandne linije (gcloud) ili BigQuery API-ja. Kada kreirate skup podataka, možete odrediti opcije kao što su geografska lokacija i kontrole pristupa.
Nakon što pripremite svoj skup podataka, možete početi koristiti BigQuery ML za obuku i procjenu modela mašinskog učenja. BigQuery ML vam omogućava da izvršavate zadatke mašinskog učenja koristeći standardne SQL upite, što ga čini dostupnim korisnicima koji su upoznati sa SQL-om.
Da biste kreirali model strojnog učenja u BigQuery ML-u, trebate napisati SQL upit koji uključuje naredbu CREATE MODEL. Ova izjava specificira tip modela, ulazne podatke i ciljnu varijablu. Na primjer, ako želite kreirati model linearne regresije za predviđanje cijena stanova, vaša izjava CREATE MODEL može izgledati ovako:
CREATE MODEL `mydataset.my_model` OPTIONS(model_type='linear_reg') AS SELECT price, bedrooms, bathrooms, sqft_living FROM `mydataset.my_table`;
U ovom primjeru, `mydataset.my_model` je ime modela, `mydataset.my_table` je ulazni podatak, a ciljna varijabla je kolona `cijena`. Tip modela je specificiran kao `linear_reg` za linearnu regresiju.
Nakon što kreirate model, možete procijeniti njegovu izvedbu pomoću funkcije ML.EVALUATE. Ova funkcija izračunava različite metrike kao što su srednja kvadratna greška, srednja apsolutna greška i R-kvadrat. Na primjer:
SELECT * FROM ML.EVALUATE(MODEL `mydataset.my_model`, ( SELECT price, bedrooms, bathrooms, sqft_living FROM `mydataset.my_table` ));
Ovaj upit će vratiti metriku evaluacije za model.
Uz modele za obuku i evaluaciju, BigQuery ML također podržava predviđanja pomoću funkcije ML.PREDICT. Ova funkcija vam omogućava da predvidite nove podatke koristeći obučeni model. Na primjer:
SELECT predicted_price FROM ML.PREDICT(MODEL `mydataset.my_model`, ( SELECT bedrooms, bathrooms, sqft_living FROM `mydataset.new_data` ));
Ovaj upit će vratiti predviđene cijene za nove podatke.
Da rezimiramo, pristup BigQuery ML-u uključuje postavljanje Google Cloud projekta, omogućavanje potrebnih API-ja, kreiranje BigQuery skupa podataka i korištenje SQL upita za obuku, procjenu i predviđanje pomoću modela mašinskog učenja.
Ostala nedavna pitanja i odgovori u vezi Napredak u mašinskom učenju:
- Da li je moguće koristiti Kaggle za učitavanje finansijskih podataka i obavljanje statističke analize i predviđanja koristeći ekonometrijske modele kao što su R-kvadrat, ARIMA ili GARCH?
- Kada je kernel forkiran sa podacima, a original je privatan, može li račvani biti javan i ako jeste, to nije povreda privatnosti?
- Koja su ograničenja u radu s velikim skupovima podataka u mašinskom učenju?
- Može li mašinsko učenje pomoći u dijaloškom smislu?
- Šta je TensorFlow igralište?
- Da li eager mode sprječava funkcionalnost distribuiranog računanja TensorFlow-a?
- Mogu li se Google rješenja u oblaku koristiti za razdvajanje računarstva od skladišta za efikasniju obuku ML modela sa velikim podacima?
- Nudi li Google Cloud Machine Learning Engine (CMLE) automatsku akviziciju i konfiguraciju resursa i upravlja li gašenjem resursa nakon što se obuka modela završi?
- Da li je moguće trenirati modele mašinskog učenja na proizvoljno velikim skupovima podataka bez problema?
- Kada koristite CMLE, da li kreiranje verzije zahtijeva navođenje izvora izvezenog modela?
Pogledajte više pitanja i odgovora u Napredak u mašinskom učenju