Google Vision API-н газрын тэмдэглэгээг илрүүлэх дэвшилтэт зургийг ойлгох функцийн хүрээнд тэмдэглэгээний хариу объектоос тэмдэглэгээний мэдээллийг гаргаж авахын тулд бид API-аас өгсөн холбогдох талбарууд болон аргуудыг ашиглах хэрэгтэй. Аннотацийн хариултын объект нь зургийн шинжилгээний үр дүнтэй холбоотой янз бүрийн шинж чанар, утгыг агуулсан JSON бүтэц юм.
Нэгдүгээрт, бид зургийг API амжилттай боловсруулж, хариулах объект нь шаардлагатай мэдээллийг агуулж байгаа эсэхийг шалгах хэрэгтэй. Үүнийг хариулах объектын "статус" талбарыг шалгах замаар хийж болно. Хэрэв статус "OK" бол энэ нь зургийн шинжилгээ амжилттай болсныг илтгэх бөгөөд бид тэмдэглэгээний мэдээллийг задлах ажлыг үргэлжлүүлж болно.
Хариулах объектын "landmarkAnnotations" талбараас тэмдэглэгээний мэдээлэлд хандах боломжтой. Энэ талбар нь тэмдэглэгээ бүр нь зураг дээр илэрсэн тэмдэглэгээг төлөөлдөг тэмдэглэгээний массив юм. Газрын тэмдэглэгээ бүр байршил, тайлбар, оноо зэрэг хэд хэдэн шинж чанарыг агуулна.
"Байршил" шинж чанар нь илрүүлсэн тэмдэглэгээний хязгаарлах хайрцагны координатыг өгдөг. Эдгээр координатууд нь зураг дээрх тэмдэглэгээний байрлал, хэмжээг зааж өгдөг. Эдгээр координатуудад дүн шинжилгээ хийснээр бид тэмдэглэгээний яг байршлыг тодорхойлж чадна.
"Тодорхойлолт" шинж чанар нь тэмдэглэгээний текстийн тайлбарыг өгдөг. Энэхүү тайлбарыг тэмдэглэгээг тодорхойлж, хэрэглэгчдэд нэмэлт контекст өгөхөд ашиглаж болно. Жишээлбэл, API нь зурагнаас Эйфелийн цамхагийг илрүүлсэн бол тайлбарын шинж чанар нь "Эйфелийн цамхаг" гэсэн текстийг агуулж болно.
"Оноо" шинж чанар нь тэмдэглэгээг илрүүлэх API-ийн итгэлийн оноог илэрхийлнэ. Энэ оноо нь 0-ээс 1-ийн хоорондох утга бөгөөд өндөр оноо нь өөртөө итгэх итгэлийн түвшинг илтгэнэ. Энэ оноонд дүн шинжилгээ хийснээр бид илрүүлсэн тэмдэглэгээний найдвартай байдлыг үнэлэх боломжтой.
Тэмдэглэгээний хариултын объектоос тэмдэглэгээний мэдээллийг гаргаж авахын тулд бид "landmarkAnnotations" массиваар давтаж, тэмдэглэгээ бүрийн холбогдох шинж чанаруудад хандах боломжтой. Дараа нь бид цаашид дүн шинжилгээ хийх эсвэл харуулахад шаардлагатай бол энэ мэдээллийг хадгалах эсвэл боловсруулах боломжтой.
Google Cloud Vision API клиент номын санг ашиглан тэмдэглэгээний хариу объектоос тэмдэглэгээний мэдээллийг хэрхэн гаргаж авахыг харуулсан Python дээрх жишээ кодын хэсэг энд байна:
python from google.cloud import vision def extract_landmark_info(response): if response.status == 'OK': for annotation in response.landmark_annotations: location = annotation.location description = annotation.description score = annotation.score # Process the landmark information as needed print(f"Landmark: {description}") print(f"Location: {location}") print(f"Score: {score}n") else: print('Image analysis failed.') # Assuming you have already authenticated and created a client client = vision.ImageAnnotatorClient() # Assuming you have an image file 'image.jpg' to analyze with open('image.jpg', 'rb') as image_file: content = image_file.read() image = vision.Image(content=content) response = client.landmark_detection(image=image) extract_landmark_info(response)
Энэ жишээн дээр "газрын_захиа_мэдээллийг задлах" функц нь тэмдэглэгээний хариу объектыг оролт болгон авч, "газрын тэмдэглэгээ" массиваар давтагдана. Дараа нь тайлбар, байршил, оноо зэрэг тэмдэглэгээ бүрийн тэмдэглэгээний мэдээллийг задлан хэвлэдэг.
Энэхүү хандлагыг дагаснаар бид Google Vision API-н газрын тэмдэглэгээг илрүүлэх дэвшилтэт дүрсийг ойлгох функцээр хангагдсан тэмдэглэгээний хариу объектоос тэмдэглэгээний мэдээллийг үр дүнтэй гаргаж авах боломжтой.
Сүүлийн үеийн бусад асуулт, хариулт Нарийвчилсан зураглалыг ойлгох:
- Google Vision API-д объект танихад зориулсан урьдчилан тодорхойлсон ангилал юу вэ?
- Аюулгүй хайлтыг илрүүлэх функцийг зохицуулах бусад аргуудтай хослуулан ашиглахад санал болгож буй арга юу вэ?
- Аюулгүй хайлтын тайлбарт категори тус бүрийн магадлалын утгыг хэрхэн харж, харуулах вэ?
- Бид Python дээрх Google Vision API ашиглан аюулгүй хайлтын тайлбарыг хэрхэн авах вэ?
- Аюулгүй хайлтыг илрүүлэх функцэд ямар таван ангилал багтдаг вэ?
- Google Vision API-ийн аюулгүй хайлтын функц нь зураг доторх тодорхой агуулгыг хэрхэн илрүүлдэг вэ?
- Бид дэрний номын санг ашиглан зураг дээрх илрүүлсэн объектуудыг хэрхэн нүдээр тодорхойлж, тодруулж болох вэ?
- Бид панда өгөгдлийн хүрээ ашиглан задалсан объектын мэдээллийг хэрхэн хүснэгт хэлбэрээр зохион байгуулах вэ?
- API-ийн хариултаас бид бүх объектын тайлбарыг хэрхэн гаргаж авах вэ?
- Google Vision API-ийн ажиллагааг харуулахын тулд ямар сангууд болон програмчлалын хэлийг ашигладаг вэ?
Дэлгэрэнгүй зургийн ойлголтоос илүү олон асуулт, хариултыг харна уу