Бид дэрний номын санг ашиглан зураг дээрх илрүүлсэн объектуудыг хэрхэн нүдээр тодорхойлж, тодруулж болох вэ?

by EITCA академи / 30 оны 2023-р сарын XNUMX-ны Бямба гараг / онд хэвлэгдсэн Хиймэл оюун, EITC/AI/GVAPI Google Vision API, Нарийвчилсан зураглалыг ойлгох, Объект илрүүлэх, Шалгалтын тойм

Pillow номын санг ашиглан зураг дээрх илрүүлсэн объектуудыг нүдээр тодорхойлж, тодруулахын тулд бид алхам алхмаар үйл явцыг дагаж болно. Pillow номын сан нь зураг боловсруулах өргөн боломжийг олгодог хүчирхэг Python дүрслэлийн номын сан юм. Pillow номын сангийн чадавхийг Google Vision API-ийн объект илрүүлэх функцтэй хослуулснаар бид энэ ажлыг үр дүнтэй гүйцэтгэж чадна.

Pillow номын санг ашиглан зураг дээрх илрүүлсэн объектуудыг нүдээр тодорхойлж, тодруулах алхмуудыг энд үзүүлэв.

1. Шаардлагатай номын сангуудыг суулгах: Шаардлагатай сангуудыг суулгаж эхэлнэ. `pip install pillow` командыг ашиглан Pillow-г суулгана уу. Нэмж хэлэхэд, та Google Vision API-г тохируулж, Python-д зориулсан Google Cloud клиент номын санг суулгах шаардлагатай болно.

2. Google Vision API ашиглан баталгаажуулах: Google Vision API ашиглахын тулд та өөрийн програмыг баталгаажуулах шаардлагатай. Шаардлагатай итгэмжлэлүүдийг авахын тулд Google-ээс өгсөн баримт бичгийг дагана уу.

3. Зургийг ачаалж, дүн шинжилгээ хийх: Pillow номын санг ашиглан дүн шинжилгээ хийхийг хүссэн зургаа ачаална уу. Та зургийн файлыг нээхийн тулд `Image.open()` аргыг ашиглаж болно. Зургийг ачаалсны дараа JPEG эсвэл PNG гэх мэт Google Vision API-тай нийцтэй формат руу хөрвүүлнэ үү.

4. Зургийг Google Vision API руу илгээх: Объект илрүүлэхийн тулд Google Vision API руу зургийг илгээхийн тулд Python-д зориулсан Google Cloud клиент номын санг ашиглана уу. Үүнийг зургийн өгөгдөл бүхий хүсэлтийн объект үүсгэж, `image_annotator_client.object_localization().annotate_image()` гэх мэт тохирох аргыг дуудах замаар хийж болно.

5. Объект илрүүлэх үр дүнг авах: Google Vision API-аас хүлээн авсан хариултаас объект илрүүлэх үр дүнг задлах. Хариулт нь илрүүлсэн объектуудын тухай мэдээлэл, тухайлбал тэдгээрийн хязгаарлах хайрцаг, шошго, итгэлийн оноо зэргийг агуулна.

6. Зурган дээр хязгаарлах хайрцаг зурах: Pillow номын санг ашиглан зураг дээр илэрсэн объектын эргэн тойронд хязгаарлах хайрцаг зур. Та зургийн объект үүсгэхийн тулд `ImageDraw.Draw()` аргыг хэрэглэж, дараа нь `draw.rectangle()` аргыг ашиглан хязгаарлах хайрцагуудыг зурж болно.

7. Зураг дээр шошго, оноо нэмэх: Дүрслэлийг сайжруулахын тулд та зураг дээр шошго болон итгэлийн оноо нэмж болно. Зурган дээрх шошго болон оноог давхарлахын тулд Pillow номын сангийн `draw.text()` аргыг ашиглана уу.

8. Тайлбартай зургийг хадгалах, харуулах: Pillow номын сангийн `Image.save()` аргыг ашиглан тайлбартай зургийг хадгална. Та JPEG эсвэл PNG гэх мэт хүссэн форматыг сонгож болно. Сонголтоор `Image.show()` аргыг ашиглан тайлбартай зургийг харуулна.

Эдгээр алхмуудыг хийснээр та Pillow номын санг ашиглан зураг дээрх илрүүлсэн объектуудыг нүдээр тодорхойлж, тодруулж болно. Pillow-ийн хүчирхэг дүрс боловсруулах чадвар болон Google Vision API-ийн объект илрүүлэх функцийн хослол нь зургийг үр дүнтэй, үнэн зөв шинжлэх боломжийг олгодог.

Жишээ нь:

python
from PIL import Image, ImageDraw
from google.cloud import vision

# Load and analyze the image
image_path = 'path/to/your/image.jpg'
image = Image.open(image_path)
image_data = image.tobytes()

# Authenticate with the Google Vision API
client = vision.ImageAnnotatorClient.from_service_account_json('path/to/your/credentials.json')

# Send the image to the Google Vision API for object detection
response = client.object_localization(image=vision.Image(content=image_data))
objects = response.localized_object_annotations

# Draw bounding boxes on the image
draw = ImageDraw.Draw(image)
for obj in objects:
    bbox = obj.bounding_poly.normalized_vertices
    draw.rectangle([(bbox[0].x * image.width, bbox[0].y * image.height),
                    (bbox[2].x * image.width, bbox[2].y * image.height)],
                   outline='red', width=3)

    # Add labels and scores to the image
    label = obj.name
    score = obj.score
    draw.text((bbox[0].x * image.width, bbox[0].y * image.height - 15),
              f'{label} ({score:.2f})', fill='red')

# Save and display the annotated image
annotated_image_path = 'path/to/save/annotated_image.jpg'
image.save(annotated_image_path)
image.show()

Энэ жишээн дээр бид эхлээд Pillow library ашиглан зургийг ачаалж, дүн шинжилгээ хийдэг. Дараа нь бид Google Vision API-ээр баталгаажуулж, объект илрүүлэх зургийг илгээнэ. Бид объект илрүүлэх үр дүнг авч, Pillow номын санг ашиглан зураг дээрх илэрсэн объектын эргэн тойронд хязгаарлах хайрцаг зурдаг. Нэмж дурдахад бид зурган дээр шошго болон итгэлийн оноог нэмдэг. Эцэст нь бид тайлбартай зургийг хадгалж, харуулна.

Сүүлийн үеийн бусад асуулт, хариулт Нарийвчилсан зураглалыг ойлгох:

Дэлгэрэнгүй зургийн ойлголтоос илүү олон асуулт, хариултыг харна уу

Илүү олон асуулт, хариулт:

Талбар: Хиймэл оюун
хөтөлбөр: EITC/AI/GVAPI Google Vision API (гэрчилгээжүүлэх хөтөлбөрт очно уу)
Хичээл: Нарийвчилсан зураглалыг ойлгох (холбогдох хичээл рүүгээ яв)
сэдэв: Объект илрүүлэх (холбогдох сэдэв рүү оч)
Шалгалтын тойм

Доор тэмдэглэгдсэн: Хиймэл оюун, Google Vision API, Зураг боловсруулах, Объект илрүүлэлт, Дэр номын сан, Python

EITCA академи

Бид дэрний номын санг ашиглан зураг дээрх илрүүлсэн объектуудыг хэрхэн нүдээр тодорхойлж, тодруулж болох вэ?

Сүүлийн үеийн бусад асуулт, хариулт Нарийвчилсан зураглалыг ойлгох:

Илүү олон асуулт, хариулт:

EITCA академи нь Европын мэдээллийн технологийн гэрчилгээжүүлэх тогтолцооны нэг хэсэг юм

EITCA Академийн EITCI DSJC татаасыг 80% дэмжих эрхтэй

EITCA академи

НЭГДСЭН НЭГДСЭН МЭДЭЭЛЛИЙН НЭГДСЭН НЭГДСЭН ХЭРЭГЛЭЭГЭЭРЭЙ

Таны мэдээлэл үгээ мартсан уу?

Акаунт үүсгэх

Бид дэрний номын санг ашиглан зураг дээрх илрүүлсэн объектуудыг хэрхэн нүдээр тодорхойлж, тодруулж болох вэ?

Сүүлийн үеийн бусад асуулт, хариулт Нарийвчилсан зураглалыг ойлгох:

Илүү олон асуулт, хариулт:

EITCA Академийн EITCI DSJC татаасыг 80% дэмжих эрхтэй