Cloud Machine Learning Engine (CMLE) je moćan alat koji pruža Google Cloud Platform (GCP) za obuku modela mašinskog učenja na distribuiran i paralelan način. Međutim, on ne nudi automatsku akviziciju i konfiguraciju resursa, niti upravlja gašenjem resursa nakon što je obuka modela završena. U ovom odgovoru razmotrićemo detalje CMLE-a, njegove mogućnosti i potrebu za ručnim upravljanjem resursima.
CMLE je dizajniran da pojednostavi proces obuke i implementacije modela mašinskog učenja na velikom nivou. Pruža upravljano okruženje koje omogućava korisnicima da se fokusiraju na razvoj modela, a ne na upravljanje infrastrukturom. CMLE koristi moć GCP-ove infrastrukture za distribuciju radnog opterećenja na više mašina, omogućavajući brže vrijeme obuke i rukovanje velikim skupovima podataka.
Kada koriste CMLE, korisnici imaju fleksibilnost da odaberu vrstu i broj resursa potrebnih za njihov posao obuke. Oni mogu izabrati tip mašine, broj radnika i druge parametre na osnovu svojih specifičnih zahteva. Međutim, CMLE ne preuzima automatski i ne konfigurira ove resurse. Odgovornost korisnika je da obezbijedi potrebne resurse prije nego započne posao obuke.
Za nabavku resursa, korisnici mogu koristiti GCP usluge kao što su Compute Engine ili Kubernetes Engine. Ove usluge obezbeđuju skalabilnu i fleksibilnu infrastrukturu za prilagođavanje opterećenja obukom. Korisnici mogu kreirati instance ili kontejnere virtuelnih mašina, konfigurisati ih sa potrebnim softverskim zavisnostima, a zatim ih koristiti kao radnike u CMLE-u.
Kada se završi posao obuke, CMLE ne isključuje automatski resurse koji se koriste za obuku. To je zato što bi obučeni model možda trebao biti raspoređen i služio za potrebe zaključivanja. Na korisniku je da odluči kada i kako će prekinuti resurse kako bi izbjegao nepotrebne troškove.
Da rezimiramo, CMLE nudi moćnu platformu za obuku modela paralelnog mašinskog učenja. Međutim, zahtijeva ručnu akviziciju i konfiguraciju resursa i ne obrađuje gašenje resursa nakon završetka obuke. Korisnici treba da obezbede neophodne resurse koristeći GCP usluge kao što su Compute Engine ili Kubernetes Engine i upravljaju svojim životnim ciklusom na osnovu svojih specifičnih zahteva.
Ostala nedavna pitanja i odgovori u vezi Napredak u mašinskom učenju:
- Da li je moguće koristiti Kaggle za učitavanje finansijskih podataka i obavljanje statističke analize i predviđanja koristeći ekonometrijske modele kao što su R-kvadrat, ARIMA ili GARCH?
- Kada je kernel forkiran sa podacima, a original je privatan, može li račvani biti javan i ako jeste, to nije povreda privatnosti?
- Koja su ograničenja u radu s velikim skupovima podataka u mašinskom učenju?
- Može li mašinsko učenje pomoći u dijaloškom smislu?
- Šta je TensorFlow igralište?
- Da li eager mode sprječava funkcionalnost distribuiranog računanja TensorFlow-a?
- Mogu li se Google rješenja u oblaku koristiti za razdvajanje računarstva od skladišta za efikasniju obuku ML modela sa velikim podacima?
- Da li je moguće trenirati modele mašinskog učenja na proizvoljno velikim skupovima podataka bez problema?
- Kada koristite CMLE, da li kreiranje verzije zahtijeva navođenje izvora izvezenog modela?
- Može li CMLE čitati iz Google Cloud podataka za pohranu i koristiti određeni obučeni model za zaključivanje?
Pogledajte više pitanja i odgovora u Napredak u mašinskom učenju