Da biste programski izdvojili oznake iz slika koristeći Python i Vision API, možete iskoristiti moćne mogućnosti Google Cloud Vision API-ja. Vision API pruža sveobuhvatan skup funkcija za analizu slika, uključujući otkrivanje etiketa, što vam omogućava da automatski identifikujete i izvučete oznake iz slika.
Da biste započeli, morat ćete postaviti Google Cloud projekat i omogućiti Vision API. Nakon što to učinite, možete instalirati potrebne Python biblioteke tako što ćete pokrenuti sljedeću naredbu:
python pip install google-cloud-vision
Zatim morate potvrditi autentičnost svoje aplikacije za pristup Vision API-ju. To možete učiniti tako što ćete kreirati ključ računa usluge i postaviti varijablu okruženja `GOOGLE_APPLICATION_CREDENTIALS` da ukazuje na putanju datoteke ključa. To se može učiniti korištenjem sljedećeg koda:
python import os from google.cloud import vision os.environ['GOOGLE_APPLICATION_CREDENTIALS'] = '/path/to/service_account_key.json'
Sada možete koristiti Vision API za programsko izdvajanje oznaka iz slika. Sljedeći isječak koda pokazuje kako se to radi:
python def extract_labels(image_path): client = vision.ImageAnnotatorClient() with open(image_path, 'rb') as image_file: content = image_file.read() image = vision.Image(content=content) response = client.label_detection(image=image) labels = response.label_annotations extracted_labels = [label.description for label in labels] return extracted_labels
U ovom kodu prvo kreiramo instancu klase `ImageAnnotatorClient` iz biblioteke `google.cloud.vision`. Zatim čitamo datoteku slike, kreiramo objekt `Slika` od sadržaja datoteke i šaljemo ga Vision API-ju za otkrivanje etikete. API odgovor sadrži listu napomena oznaka, iz kojih izdvajamo opise oznaka.
Sada možete pozvati funkciju `extract_labels` tako što ćete proslijediti putanju do datoteke slike koju želite analizirati. Vratit će listu oznaka izvađenih iz slike.
python image_path = '/path/to/image.jpg' labels = extract_labels(image_path) print(labels)
Ovo će izbaciti izvučene naljepnice sa slike.
plaintext ['cat', 'animal', 'whiskers', 'small to medium-sized cats', 'mammal']
Vision API koristi napredne modele mašinskog učenja za analizu slika i identifikaciju objekata, scena i drugih vizuelnih karakteristika. Može precizno otkriti širok raspon oznaka, što ga čini vrijednim alatom za različite aplikacije kao što su klasifikacija slika, moderiranje sadržaja i vizualna pretraga.
Da biste programski izdvojili oznake iz slika pomoću Pythona i Vision API-ja, trebate postaviti Google Cloud projekat, omogućiti Vision API, instalirati potrebne Python biblioteke, autentifikovati svoju aplikaciju, a zatim koristiti Vision API za otkrivanje oznaka na slike. Izvučene oznake mogu se koristiti za dalju analizu ili za poboljšanje razumijevanja sadržaja slike.
Ostala nedavna pitanja i odgovori u vezi EITC/AI/GVAPI Google Vision API:
- Koje su neke unaprijed definirane kategorije za prepoznavanje objekata u Google Vision API-ju?
- Omogućava li Google Vision API prepoznavanje lica?
- Kako se prikazni tekst može dodati slici kada crtate granice objekta koristeći funkciju "draw_vertices"?
- Koji su parametri metode "draw.line" u datom kodu i kako se koriste za crtanje linija između vrijednosti vrhova?
- Kako se biblioteka jastuka može koristiti za crtanje granica objekata u Pythonu?
- Koja je svrha funkcije "draw_vertices" u datom kodu?
- Kako Google Vision API može pomoći u razumijevanju oblika i objekata na slici?
- Kako korisnici mogu istražiti vizualno slične slike koje preporučuje API?
- Koji su različiti elementi navedeni u objektu odgovora funkcije za otkrivanje weba Google Vision API-ja?
- Kako funkcija Web Detection pomaže u generiranju oznaka za otpremljene slike?
Pogledajte više pitanja i odgovora u EITC/AI/GVAPI Google Vision API-ju