Машины сургалтын (ML) асуудлыг тодорхойлох нь ML техникийг ашиглан шийдвэрлэх боломжтой даалгаврыг боловсруулах системчилсэн хандлагыг агуулдаг. Энэ үйл явц нь өгөгдөл цуглуулахаас эхлээд загварчлалын сургалт, үнэлгээ хүртэл ML-ийн бүх шугамын үндэс суурийг тавьдаг тул маш чухал юм. Энэ хариултанд бид ML-д асуудлыг тодорхойлох алгоритмын алхмуудыг тоймлон, дэлгэрэнгүй, иж бүрэн тайлбар өгөх болно.
1. Зорилгоо тодорхойлох:
Эхний алхам бол ML асуудлын зорилгыг тодорхой тодорхойлох явдал юм. Энэ нь ML загвар өгөх ёстой хүссэн үр дүн эсвэл таамаглалыг ойлгох явдал юм. Жишээлбэл, спам имэйлийг ангилах ажлын зорилго нь имэйлийг спам эсвэл спам биш гэж үнэн зөв ангилах явдал байж болно.
2. Асуудлыг томъёол:
Зорилгоо тодорхойлсны дараа асуудлыг томъёолох шаардлагатай. Үүнд дараах ангиллын аль нэгэнд хамаарах ML асуудлын төрлийг тодорхойлох орно.
а. Хяналттай суралцах: Хэрэв шошготой өгөгдөл байгаа бол асуудлыг хяналттай сургалтын даалгавар болгон тодорхойлж болно. Үүнд сургалтын өгөгдлийн багц дээр суурилсан оролтын хувьсагчдын багцаас гаралтын хувьсагчийг таамаглахыг хэлнэ. Жишээлбэл, байршил, хэмжээ, өрөөний тоо зэрэг шинж чанарууд дээр үндэслэн орон сууцны үнийг урьдчилан таамаглах.
б. Хяналтгүй суралцах: Зөвхөн шошгогүй өгөгдөл байгаа бол асуудлыг хараа хяналтгүй сургалтын даалгавар гэж тодорхойлж болно. Энд байгаа зорилго нь урьдчилан тодорхойлсон гаралтын хувьсагчгүйгээр өгөгдөл доторх хэв маяг, бүтцийг илрүүлэх явдал юм. Ижил төрлийн өгөгдлийн цэгүүдийг бүлэглэхийн тулд K-means гэх мэт кластерийн алгоритмуудыг ашиглаж болно.
в. Бататгах сургалт: Бататгах сургалтанд агент нь шагналын дохиог нэмэгдүүлэхийн тулд орчинтой харьцаж сурдаг. Асуудлыг Марковын шийдвэр гаргах үйл явц (MDP) гэж тодорхойлсон бөгөөд агент нь одоогийн төлөв байдалд үндэслэн арга хэмжээ авч, шагналын хэлбэрээр санал хүсэлтийг хүлээн авдаг. Жишээлбэл, агентыг тоглоом тоглох эсвэл робот удирдахад сургах.
3. Оролт, гаралтыг тодорхойлно уу:
Дараа нь ML асуудлын оролт, гаралтын хувьсагчдыг тодорхойлох нь чухал юм. Үүнд ML загварт орц болгон ашиглах онцлог, шинж чанарууд болон загвар нь урьдчилан таамаглах ёстой зорилтот хувьсагчийг зааж өгөх шаардлагатай. Жишээлбэл, сэтгэл хөдлөлийн шинжилгээний даалгаварт оролт нь текст баримт бичиг байж болох ба гаралт нь мэдрэмжийн шошго (эерэг, сөрөг эсвэл төвийг сахисан) байж болно.
4. Мэдээлэл цуглуулж, урьдчилан боловсруулах:
Өгөгдөл нь ML-д чухал үүрэг гүйцэтгэдэг бөгөөд асуудалд тохирох мэдээллийн багцыг цуглуулах нь чухал юм. Энэ нь тухайн загварыг ашиглах бодит хувилбарыг харуулсан холбогдох өгөгдлийг цуглуулах явдал юм. Өгөгдөл нь олон янз, төлөөлөлтэй байх ёстой бөгөөд боломжит оролт, гаралтын өргөн хүрээг хамарсан байх ёстой.
Өгөгдлийг цуглуулсны дараа өгөгдлийг ML алгоритмд тохирох формат болгон цэвэрлэж, хувиргахын тулд урьдчилан боловсруулах алхмуудыг хийх шаардлагатай. Үүнд давхардлыг арилгах, дутуу утгыг зохицуулах, функцуудыг хэвийн болгох, категорийн хувьсагчдыг кодлох зэрэг орно.
5. Өгөгдлийн багцыг хуваах:
ML загварын гүйцэтгэлийг үнэлэхийн тулд өгөгдлийн багцыг сургалт, баталгаажуулалт, туршилтын багц болгон хуваах шаардлагатай. Сургалтын иж бүрдэл нь загварыг сургахад, баталгаажуулалтын багц нь гиперпараметрүүдийг тааруулж, өөр загваруудыг үнэлэхэд, туршилтын багц нь сонгосон загварын эцсийн гүйцэтгэлийг үнэлэхэд ашиглагддаг. Өгөгдлийн хуваалтыг багц бүрт төлөөлөх дээж авахын тулд болгоомжтой хийх хэрэгтэй.
6. ML алгоритмыг сонгоно уу:
Асуудлын томъёолол болон өгөгдлийн төрөлд үндэслэн тохирох ML алгоритмыг сонгох шаардлагатай. Шийдвэрийн мод, дэмжлэгийн вектор машин, мэдрэлийн сүлжээ, ансамблийн аргууд гэх мэт янз бүрийн алгоритмууд байдаг. Алгоритмыг сонгох нь асуудлын нарийн төвөгтэй байдал, боломжит тооцооллын нөөц, тайлбарлах шаардлага зэрэг хүчин зүйлээс хамаарна.
7. Загварыг сургах, үнэлэх:
Алгоритмыг сонгосны дараа сургалтын өгөгдлийн багцыг ашиглан загварыг сургах шаардлагатай. Сургалтын явцад загвар нь өгөгдлийн үндсэн хэв маяг, харилцааг сурдаг. Сургалтын дараа загварыг баталгаажуулах багц ашиглан гүйцэтгэлийг нь үнэлдэг. Загварын гүйцэтгэлийг хэмжихийн тулд нарийвчлал, нарийвчлал, санах ой, F1 оноо зэрэг үзүүлэлтүүдийг ашиглаж болно.
8. Нарийн тааруулж, оновчтой болгох:
Гүйцэтгэлийн үнэлгээнд үндэслэн загварыг нарийн тааруулж, оновчтой болгох шаардлагатай байж магадгүй юм. Энэ нь загварын гүйцэтгэлийг сайжруулахын тулд суралцах хурд, тогтмолжуулалт эсвэл сүлжээний архитектур зэрэг гиперпараметрүүдийг тохируулах явдал юм. Оновчтой гиперпараметрийг олохын тулд хөндлөн баталгаажуулалт, сүлжээ хайх гэх мэт аргуудыг ашиглаж болно.
9. Турших ба байршуулах:
Загварыг нарийн тохируулж, оновчтой болгосны дараа гүйцэтгэлийн эцсийн үнэлгээг авахын тулд туршилтын өгөгдлийн багцыг ашиглан турших шаардлагатай. Хэрэв загвар нь хүссэн гүйцэтгэлийн шалгуурыг хангасан бол түүнийг үйлдвэрлэлийн орчинд байрлуулж, шинэ, үл үзэгдэх өгөгдөл дээр таамаглал дэвшүүлж болно. Загварын тасралтгүй ажиллагааг хангахын тулд загварыг үе үе хянаж, шинэчлэх шаардлагатай байж болно.
ML-д асуудлыг тодорхойлох нь зорилтыг тодорхойлох, асуудлыг томъёолох, оролт, гаралтыг тодорхойлох, өгөгдөл цуглуулах, урьдчилан боловсруулах, өгөгдлийн багцыг хуваах, ML алгоритмыг сонгох, загварчлалыг сургах, үнэлэх, нарийн тааруулах, тохируулах зэрэг системчилсэн алгоритмын хандлагыг агуулдаг. оновчтой болгох, эцэст нь загварыг турших, ашиглах.
Сүүлийн үеийн бусад асуулт, хариулт EITC/AI/GCML Google Cloud Machine Learning:
- Текстээс яриа (TTS) гэж юу вэ, энэ нь хиймэл оюун ухаантай хэрхэн ажилладаг вэ?
- Машин сургалтын явцад том өгөгдлийн багцтай ажиллахад ямар хязгаарлалт байдаг вэ?
- Машины сургалт нь харилцан ярианы тусламж үзүүлж чадах уу?
- TensorFlow тоглоомын талбай гэж юу вэ?
- Том өгөгдлийн багц нь үнэндээ юу гэсэн үг вэ?
- Алгоритмын гиперпараметрийн зарим жишээ юу вэ?
- Ансамблийн сургалт гэж юу вэ?
- Сонгосон машин сургалтын алгоритм тохиромжгүй бол яах вэ, зөвийг нь хэрхэн сонгох вэ?
- Машин сургалтын загвар нь сургалтын явцад хяналт тавих шаардлагатай юу?
- Мэдрэлийн сүлжээнд суурилсан алгоритмд ашигладаг гол параметрүүд юу вэ?
EITC/AI/GCML Google Cloud Machine Learning-ээс бусад асуулт, хариултуудыг харна уу
Илүү олон асуулт, хариулт:
- Талбар: Хиймэл оюун
- хөтөлбөр: EITC/AI/GCML Google Cloud Machine Learning (гэрчилгээжүүлэх хөтөлбөрт очно уу)
- Хичээл: Оршил (холбогдох хичээл рүүгээ яв)
- сэдэв: Машины сургалт гэж юу вэ (холбогдох сэдэв рүү оч)