Pillow номын санг ашиглан зураг дээрх илрүүлсэн объектуудыг нүдээр тодорхойлж, тодруулахын тулд бид алхам алхмаар үйл явцыг дагаж болно. Pillow номын сан нь зураг боловсруулах өргөн боломжийг олгодог хүчирхэг Python дүрслэлийн номын сан юм. Pillow номын сангийн чадавхийг Google Vision API-ийн объект илрүүлэх функцтэй хослуулснаар бид энэ ажлыг үр дүнтэй гүйцэтгэж чадна.
Pillow номын санг ашиглан зураг дээрх илрүүлсэн объектуудыг нүдээр тодорхойлж, тодруулах алхмуудыг энд үзүүлэв.
1. Шаардлагатай номын сангуудыг суулгах: Шаардлагатай сангуудыг суулгаж эхэлнэ. `pip install pillow` командыг ашиглан Pillow-г суулгана уу. Нэмж хэлэхэд, та Google Vision API-г тохируулж, Python-д зориулсан Google Cloud клиент номын санг суулгах шаардлагатай болно.
2. Google Vision API ашиглан баталгаажуулах: Google Vision API ашиглахын тулд та өөрийн програмыг баталгаажуулах шаардлагатай. Шаардлагатай итгэмжлэлүүдийг авахын тулд Google-ээс өгсөн баримт бичгийг дагана уу.
3. Зургийг ачаалж, дүн шинжилгээ хийх: Pillow номын санг ашиглан дүн шинжилгээ хийхийг хүссэн зургаа ачаална уу. Та зургийн файлыг нээхийн тулд `Image.open()` аргыг ашиглаж болно. Зургийг ачаалсны дараа JPEG эсвэл PNG гэх мэт Google Vision API-тай нийцтэй формат руу хөрвүүлнэ үү.
4. Зургийг Google Vision API руу илгээх: Объект илрүүлэхийн тулд Google Vision API руу зургийг илгээхийн тулд Python-д зориулсан Google Cloud клиент номын санг ашиглана уу. Үүнийг зургийн өгөгдөл бүхий хүсэлтийн объект үүсгэж, `image_annotator_client.object_localization().annotate_image()` гэх мэт тохирох аргыг дуудах замаар хийж болно.
5. Объект илрүүлэх үр дүнг авах: Google Vision API-аас хүлээн авсан хариултаас объект илрүүлэх үр дүнг задлах. Хариулт нь илрүүлсэн объектуудын тухай мэдээлэл, тухайлбал тэдгээрийн хязгаарлах хайрцаг, шошго, итгэлийн оноо зэргийг агуулна.
6. Зурган дээр хязгаарлах хайрцаг зурах: Pillow номын санг ашиглан зураг дээр илэрсэн объектын эргэн тойронд хязгаарлах хайрцаг зур. Та зургийн объект үүсгэхийн тулд `ImageDraw.Draw()` аргыг хэрэглэж, дараа нь `draw.rectangle()` аргыг ашиглан хязгаарлах хайрцагуудыг зурж болно.
7. Зураг дээр шошго, оноо нэмэх: Дүрслэлийг сайжруулахын тулд та зураг дээр шошго болон итгэлийн оноо нэмж болно. Зурган дээрх шошго болон оноог давхарлахын тулд Pillow номын сангийн `draw.text()` аргыг ашиглана уу.
8. Тайлбартай зургийг хадгалах, харуулах: Pillow номын сангийн `Image.save()` аргыг ашиглан тайлбартай зургийг хадгална. Та JPEG эсвэл PNG гэх мэт хүссэн форматыг сонгож болно. Сонголтоор `Image.show()` аргыг ашиглан тайлбартай зургийг харуулна.
Эдгээр алхмуудыг хийснээр та Pillow номын санг ашиглан зураг дээрх илрүүлсэн объектуудыг нүдээр тодорхойлж, тодруулж болно. Pillow-ийн хүчирхэг дүрс боловсруулах чадвар болон Google Vision API-ийн объект илрүүлэх функцийн хослол нь зургийг үр дүнтэй, үнэн зөв шинжлэх боломжийг олгодог.
Жишээ нь:
python from PIL import Image, ImageDraw from google.cloud import vision # Load and analyze the image image_path = 'path/to/your/image.jpg' image = Image.open(image_path) image_data = image.tobytes() # Authenticate with the Google Vision API client = vision.ImageAnnotatorClient.from_service_account_json('path/to/your/credentials.json') # Send the image to the Google Vision API for object detection response = client.object_localization(image=vision.Image(content=image_data)) objects = response.localized_object_annotations # Draw bounding boxes on the image draw = ImageDraw.Draw(image) for obj in objects: bbox = obj.bounding_poly.normalized_vertices draw.rectangle([(bbox[0].x * image.width, bbox[0].y * image.height), (bbox[2].x * image.width, bbox[2].y * image.height)], outline='red', width=3) # Add labels and scores to the image label = obj.name score = obj.score draw.text((bbox[0].x * image.width, bbox[0].y * image.height - 15), f'{label} ({score:.2f})', fill='red') # Save and display the annotated image annotated_image_path = 'path/to/save/annotated_image.jpg' image.save(annotated_image_path) image.show()
Энэ жишээн дээр бид эхлээд Pillow library ашиглан зургийг ачаалж, дүн шинжилгээ хийдэг. Дараа нь бид Google Vision API-ээр баталгаажуулж, объект илрүүлэх зургийг илгээнэ. Бид объект илрүүлэх үр дүнг авч, Pillow номын санг ашиглан зураг дээрх илэрсэн объектын эргэн тойронд хязгаарлах хайрцаг зурдаг. Нэмж дурдахад бид зурган дээр шошго болон итгэлийн оноог нэмдэг. Эцэст нь бид тайлбартай зургийг хадгалж, харуулна.
Сүүлийн үеийн бусад асуулт, хариулт Нарийвчилсан зураглалыг ойлгох:
- Google Vision API-д объект танихад зориулсан урьдчилан тодорхойлсон ангилал юу вэ?
- Аюулгүй хайлтыг илрүүлэх функцийг зохицуулах бусад аргуудтай хослуулан ашиглахад санал болгож буй арга юу вэ?
- Аюулгүй хайлтын тайлбарт категори тус бүрийн магадлалын утгыг хэрхэн харж, харуулах вэ?
- Бид Python дээрх Google Vision API ашиглан аюулгүй хайлтын тайлбарыг хэрхэн авах вэ?
- Аюулгүй хайлтыг илрүүлэх функцэд ямар таван ангилал багтдаг вэ?
- Google Vision API-ийн аюулгүй хайлтын функц нь зураг доторх тодорхой агуулгыг хэрхэн илрүүлдэг вэ?
- Бид панда өгөгдлийн хүрээ ашиглан задалсан объектын мэдээллийг хэрхэн хүснэгт хэлбэрээр зохион байгуулах вэ?
- API-ийн хариултаас бид бүх объектын тайлбарыг хэрхэн гаргаж авах вэ?
- Google Vision API-ийн ажиллагааг харуулахын тулд ямар сангууд болон програмчлалын хэлийг ашигладаг вэ?
- Google Vision API нь зураг дээрх объект илрүүлэх, нутагшуулах ажлыг хэрхэн гүйцэтгэдэг вэ?
Дэлгэрэнгүй зургийн ойлголтоос илүү олон асуулт, хариултыг харна уу