Хиймэл оюун ухаан – Google Vision API – Зургийн дэвшилтэт ойлголт – Объект илрүүлэх талбар дахь API-ийн хариултаас бүх объектын тэмдэглэгээг гаргаж авахын тулд та API-аас өгсөн хариултын форматыг ашиглаж болно. хязгаарлах хайрцаг болон итгэлийн оноо. Энэ хариултыг задлан шинжилснээр та хүссэн объектын тэмдэглэгээг гаргаж авах боломжтой.
API хариулт нь ихэвчлэн илрүүлсэн объектуудыг агуулсан "localizedObjectAnnotations" талбар зэрэг янз бүрийн талбаруудыг агуулсан JSON объектоос бүрддэг. Объектын тэмдэглэгээ бүр нь тухайн объектын нэр, түүний хязгаарлах хайрцагны координат, API-ийн илрүүлэлтэд итгэх итгэлийг харуулсан итгэлийн оноо зэрэг мэдээллийг агуулна.
Объектын тэмдэглэгээг задлахын тулд та дараах алхмуудыг хийж болно.
1. API хариултыг задлан шинжилнэ үү: API-аас хүлээн авсан JSON хариултыг задлан шинжилж эхэл. Үүнийг JSON задлан шинжлэх номын сан эсвэл таны програмчлалын хэлээр хангагдсан суулгасан функцуудыг ашиглан хийж болно.
2. "localizedObjectAnnotations" талбарт хандах: Хариултыг задлан шинжилсний дараа илэрсэн объектуудыг агуулсан "localizedObjectAnnotations" талбарт хандана уу. Энэ талбар нь ихэвчлэн объектын тэмдэглэгээний массив юм.
3. Объектын тэмдэглэгээг давтах: Массив дахь объектын тэмдэглэгээ бүрийг давтах. Тэмдэглэгээ бүр нь зураг дээрх илэрсэн объектыг илэрхийлдэг.
4. Холбогдох мэдээллийг задлах: Объектын нэр, хязгаарлах хайрцагны координат, итгэлийн оноо зэрэг объектын тайлбар бүрээс холбогдох мэдээллийг задлах. Эдгээр дэлгэрэнгүй мэдээлэлд объектын тэмдэглэгээ бүрийн тусдаа талбар хэлбэрээр хандах боломжтой.
5. Татаж авсан мэдээллийг хадгалах эсвэл боловсруулах: Та өөрийн шаардлагаас хамааран задалсан мэдээллийг өгөгдлийн бүтцэд хадгалах эсвэл цаашид дүн шинжилгээ хийх болон бусад зорилгоор боловсруулах боломжтой. Жишээлбэл, та объектын нэр, тэдгээрийн харгалзах хайрцагны координатыг мэдээллийн санд хадгалах эсвэл зургийг ойлгохын тулд тэдгээрийг ашиглахыг хүсч болно.
Олборлох үйл явцыг харуулах хялбаршуулсан жишээ энд байна:
python import json # Assume 'response' contains the API response in JSON format response =
{
"localizedObjectAnnotations": [
{
"дунд": "/м/01g317",
"нэр": "муур",
"оноо": 0.89271355,
"boundingPoly": {
"normalized Vertices": [
{"x": 0.1234, "y": 0.5678},
{"x": 0.5678, "y": 0.1234}
] }
},
{
"mid": "/m/04rky",
"нэр": "нохой",
"оноо": 0.8132468,
"boundingPoly": {
"normalized Vertices": [
{"x": 0.4321, "y": 0.8765},
{"x": 0.8765, "y": 0.4321}
] }
}
] }
# Parse the API response response_data = json.loads(response) # Access the object annotations annotations = response_data['localizedObjectAnnotations'] # Iterate through the object annotations for annotation in annotations: # Extract relevant information object_name = annotation['name'] bounding_box = annotation['boundingPoly']['normalizedVertices'] confidence = annotation['score'] # Process or store the extracted information print(f"Object: {object_name}, Bounding Box: {bounding_box}, Confidence: {confidence}") # Output: # Object: cat, Bounding Box: [{'x': 0.1234, 'y': 0.5678}, {'x': 0.5678, 'y': 0.1234}], Confidence: 0.89271355 # Object: dog, Bounding Box: [{'x': 0.4321, 'y': 0.8765}, {'x': 0.8765, 'y': 0.4321}], Confidence: 0.8132468
Энэ жишээнд бид муур, нохой гэсэн хоёр илрүүлсэн объектыг агуулсан JSON хариултыг авч үзье. Код нь хариултыг задлан шинжилж, "localizedObjectAnnotations" талбарт нэвтэрч, объектын тэмдэглэгээ бүрийг давтаж, объектын нэр, хязгаарлах хайрцагны координат болон итгэлийн оноог гаргаж авдаг. Эцэст нь задалсан мэдээллийг хэвлэх боловч та өөрийн хэрэгцээнд тохируулан кодыг өөрчилж болно.
Эдгээр алхмуудыг дагаснаар та хиймэл оюун ухаан – Google Vision API – Зургийн дэвшилтэт ойлголт – Объект илрүүлэх талбар дахь API-ийн хариултаас бүх объектын тэмдэглэгээг үр дүнтэй гаргаж авах боломжтой.
Сүүлийн үеийн бусад асуулт, хариулт Нарийвчилсан зураглалыг ойлгох:
- Google Vision API-д объект танихад зориулсан урьдчилан тодорхойлсон ангилал юу вэ?
- Аюулгүй хайлтыг илрүүлэх функцийг зохицуулах бусад аргуудтай хослуулан ашиглахад санал болгож буй арга юу вэ?
- Аюулгүй хайлтын тайлбарт категори тус бүрийн магадлалын утгыг хэрхэн харж, харуулах вэ?
- Бид Python дээрх Google Vision API ашиглан аюулгүй хайлтын тайлбарыг хэрхэн авах вэ?
- Аюулгүй хайлтыг илрүүлэх функцэд ямар таван ангилал багтдаг вэ?
- Google Vision API-ийн аюулгүй хайлтын функц нь зураг доторх тодорхой агуулгыг хэрхэн илрүүлдэг вэ?
- Бид дэрний номын санг ашиглан зураг дээрх илрүүлсэн объектуудыг хэрхэн нүдээр тодорхойлж, тодруулж болох вэ?
- Бид панда өгөгдлийн хүрээ ашиглан задалсан объектын мэдээллийг хэрхэн хүснэгт хэлбэрээр зохион байгуулах вэ?
- Google Vision API-ийн ажиллагааг харуулахын тулд ямар сангууд болон програмчлалын хэлийг ашигладаг вэ?
- Google Vision API нь зураг дээрх объект илрүүлэх, нутагшуулах ажлыг хэрхэн гүйцэтгэдэг вэ?
Дэлгэрэнгүй зургийн ойлголтоос илүү олон асуулт, хариултыг харна уу