Машин сурах үйл явцын эхний алхам бол асуудлыг тодорхойлж, шаардлагатай өгөгдлийг цуглуулах явдал юм. Энэхүү эхний алхам нь бүхэл бүтэн машин сургалтын шугам хоолойн үндэс суурийг тавьдаг тул чухал юм. Асуудлыг тодорхой тодорхойлсноор бид ашиглах машин сургалтын алгоритмын төрөл болон хүрэхийг хүсч буй тодорхой зорилгыг тодорхойлж чадна.
Эхлэхийн тулд бидний шийдэх гэж буй асуудлын талаар тодорхой ойлголттой байх нь чухал юм. Энэ нь зорилго, хязгаарлалт, хүссэн үр дүнг тодорхойлох явдал юм. Жишээлбэл, хэрэв бид ангиллын асуудал дээр ажиллаж байгаа бол бид урьдчилан таамаглахыг хүсч буй тодорхой ангиуд болон тохиолдлуудыг тэдгээр ангиудад ангилах шалгуурыг тодорхойлох хэрэгтэй.
Асуудлыг тодорхойлсны дараа дараагийн алхам нь холбогдох өгөгдлийг цуглуулах явдал юм. Өгөгдөл нь машин сургалтын алгоритмуудыг тэжээдэг түлш бөгөөд өндөр чанартай, олон төрлийн өгөгдлийн багцтай байх нь үнэн зөв загвар бүтээхэд зайлшгүй шаардлагатай. Өгөгдөл нь мэдээллийн сан, API эсвэл гараар цуглуулах гэх мэт янз бүрийн эх сурвалжаас ирж болно.
Мэдээлэл цуглуулах үе шатанд дараахь зүйлийг анхаарч үзэх нь чухал юм.
1. Мэдээллийн хүртээмж: Шаардлагатай өгөгдөл нь хүртээмжтэй, цаг хугацаа, нөөц, хууль эрх зүйн хязгаарлалтын хүрээнд цуглуулж болно гэдгийг баталгаажуулах.
2. Өгөгдлийн чанар: Өгөгдлийн чанарыг дутуу утга, хэт давчуу байдал, зөрчилтэй эсэхийг шалгах замаар үнэлнэ. Мэдээллийн бүрэн бүтэн байдал, найдвартай байдлыг хангахын тулд өгөгдлийг цэвэрлэж, урьдчилан боловсруулах нь чухал юм.
3. Өгөгдлийн хамаарал: Цуглуулсан өгөгдөл нь тодорхойлсон асуудалд хамааралтай эсэхийг шалгаарай. Үл хамаарах эсвэл чимээ шуугиантай өгөгдөл нь машин сургалтын загварын гүйцэтгэлд сөргөөр нөлөөлж болзошгүй.
4. Өгөгдлийн төлөөлөл: Машин сургалтын алгоритмд өгөгдөл хэрхэн дүрслэгдэх ёстойг тодорхойлох. Үүнд тохирох шинж чанаруудыг сонгох, шаардлагатай бол категорийн хувьсагчдыг кодлох зэрэг орно.
Энэ үйл явцыг харуулахын тулд жишээг авч үзье. Харилцаа холбооны компанид үйлчлүүлэгч эргэлзэх эсэхийг урьдчилан таамаглахын тулд бид машин сургалтын загвар бүтээхийг хүсч байна гэж бодъё. Эхний алхам нь асуудлыг тодорхойлох явдал бөгөөд энэ тохиолдолд гацсан эсвэл гацаагүй хэрэглэгчдийн хоёртын ангилал юм. Дараа нь бид хэрэглэгчийн хүн ам зүй, хэрэглээний загвар, төлбөрийн мэдээлэл зэрэг холбогдох өгөгдлийг цуглуулна.
Машин сурах үйл явцын эхний алхам бол асуудлыг тодорхойлж, шаардлагатай өгөгдлийг цуглуулах явдал юм. Энэ алхам нь машин сургалтын шугам хоолойн дараагийн алхмуудын үндэс суурь болж, төслийн ерөнхий амжилтад чухал үүрэг гүйцэтгэдэг.
Сүүлийн үеийн бусад асуулт, хариулт EITC/AI/GCML Google Cloud Machine Learning:
- Зохицуулалт гэж юу вэ?
- Хяналттай болон хяналтгүй сургалтын арга барилыг нэгэн зэрэг хэрэгжүүлдэг хиймэл оюун ухааны загвартай сургалтын төрөл байдаг уу?
- Хяналтгүй машин сургалтын системд суралцах үйл явц хэрхэн явагддаг вэ?
- Google Cloud Machine Learning/AI платформ дээр Fashion-MNIST датасетийг хэрхэн ашиглах вэ?
- Машины сургалтын ямар төрлийн алгоритмууд байдаг бөгөөд тэдгээрийг хэрхэн сонгох вэ?
- Цөм нь өгөгдөлтэй, эх хувь нь хувийнх байх үед сэрээтэй нь олон нийтэд нээлттэй байж болох уу, хэрэв тийм бол нууцлалын зөрчил биш үү?
- NLG загварын логикийг арилжааны таамаглал гэх мэт NLG-ээс өөр зорилгоор ашиглаж болох уу?
- Машин сургалтын илүү нарийвчилсан үе шатууд юу вэ?
- TensorBoard бол загварыг дүрслэн харуулахад хамгийн их санал болгож буй хэрэгсэл мөн үү?
- Өгөгдлийг цэвэрлэхдээ өгөгдөл нь өрөөсгөл биш гэдгийг хэрхэн баталгаажуулах вэ?
EITC/AI/GCML Google Cloud Machine Learning-ээс бусад асуулт, хариултуудыг харна уу