Машины сургалтын явцад шошгогүй өгөгдлийн урьдчилан таамаглах загвар зохион бүтээх нь хэд хэдэн үндсэн алхам, анхаарах зүйлсийг багтаадаг. Шошгогүй өгөгдөл нь урьдчилан тодорхойлсон зорилтот шошго эсвэл категоригүй өгөгдлийг хэлнэ. Зорилго нь одоо байгаа шошгогүй өгөгдлөөс олж авсан загвар, харилцаанд тулгуурлан шинэ, үл үзэгдэх өгөгдлийг үнэн зөв таамаглах эсвэл ангилах боломжтой загваруудыг хөгжүүлэх явдал юм. Энэ хариултанд бид машин сургалтын явцад тэмдэглэгдээгүй өгөгдлийн урьдчилан таамаглах загвар зохион бүтээх үйл явцыг судалж, холбогдох гол алхам, арга техникийг онцлон харуулах болно.
1. Өгөгдлийн урьдчилсан боловсруулалт:
Урьдчилан таамаглах загварыг бий болгохын өмнө шошгогүй өгөгдлийг урьдчилан боловсруулах нь маш чухал юм. Энэ алхам нь дутуу утгууд, хэт их хэмжигдэхүүн, дуу чимээтэй ажиллах замаар өгөгдлийг цэвэрлэх явдал юм. Нэмж дурдахад, шинж чанарууд нь тогтвортой масштаб, тархалттай байхын тулд өгөгдлийг хэвийн болгох эсвэл стандартчилах аргыг хэрэглэж болно. Өгөгдлийн чанарыг сайжруулах, урьдчилан таамаглах загваруудын гүйцэтгэлийг сайжруулахын тулд өгөгдлийг урьдчилан боловсруулах нь чухал юм.
2. Онцлогыг задлах:
Онцлогыг задлах нь түүхий өгөгдлийг урьдчилан таамаглах загваруудад ашиглаж болох ач холбогдолтой шинж чанаруудын багц болгон хувиргах үйл явц юм. Энэ алхам нь холбогдох шинж чанаруудыг сонгож, тэдгээрийг тохирох дүрс болгон хувиргах явдал юм. Хэмжээг багасгах (жишээ нь, үндсэн бүрэлдэхүүн хэсгүүдийн шинжилгээ) эсвэл функцын инженерчлэл (жишээлбэл, домэйны мэдлэг дээр суурилсан шинэ боломжуудыг бий болгох) зэрэг техникийг шошгогүй өгөгдлөөс хамгийн их мэдээлэлтэй шинж чанаруудыг гаргаж авахын тулд ашиглаж болно. Онцлогыг задлах нь өгөгдлийн нарийн төвөгтэй байдлыг багасгах, урьдчилан таамаглах загваруудын үр ашиг, үр нөлөөг сайжруулахад тусалдаг.
3. Загвар сонгох:
Тохиромжтой загварыг сонгох нь шошгогүй өгөгдлийг урьдчилан таамаглах загвар зохион бүтээхэд чухал алхам юм. Машин сургалтын янз бүрийн алгоритмууд байдаг бөгөөд тус бүр өөрийн гэсэн таамаглал, давуу болон сул талуудтай. Загварын сонголт нь тодорхой асуудал, өгөгдлийн шинж чанар, хүссэн гүйцэтгэлийн шалгуур үзүүлэлтээс хамаарна. Урьдчилан таамаглах загварчлалд түгээмэл хэрэглэгддэг загваруудад шийдвэрийн мод, дэмжлэгийн вектор машин, санамсаргүй ой, мэдрэлийн сүлжээ орно. Загвар сонгохдоо тайлбарлах чадвар, өргөтгөх чадвар, тооцоолох шаардлага зэрэг хүчин зүйлсийг харгалзан үзэх нь чухал юм.
4. Загвар сургалт:
Загварыг сонгосны дараа түүнийг шошгогүй өгөгдлийг ашиглан сургах шаардлагатай. Сургалтын явцад загвар нь өгөгдлийн үндсэн хэв маяг, харилцааг сурдаг. Энэ нь урьдчилан таамаглах алдааг багасгах эсвэл магадлалыг нэмэгдүүлэх гэх мэт тодорхой зорилгын функцийг оновчтой болгох замаар хийгддэг. Сургалтын үйл явц нь урьдчилан таамагласан үр дүн болон бодит үр дүнгийн хоорондох зөрүүг багасгахын тулд загварын параметрүүдийг давталттайгаар тохируулах явдал юм. Оновчлолын алгоритм ба гиперпараметрийн сонголт нь урьдчилан таамаглах загварын гүйцэтгэлд ихээхэн нөлөөлдөг.
5. Загварын үнэлгээ:
Загварыг сургасны дараа шинэ, үл үзэгдэх өгөгдлийг урьдчилан таамаглах, ангилах үр дүнтэй байдлыг баталгаажуулахын тулд түүний гүйцэтгэлийг үнэлэх нь чухал юм. Загварын гүйцэтгэлийг үнэлэхийн тулд нарийвчлал, нарийвчлал, санах ой, F1 оноо зэрэг үнэлгээний хэмжүүрүүдийг ихэвчлэн ашигладаг. K-fold cross-validation гэх мэт хөндлөн баталгаажуулалтын аргууд нь өгөгдлийн олон дэд бүлэгт үнэлгээ хийснээр загварын гүйцэтгэлийн талаар илүү найдвартай тооцооллыг гаргаж чадна. Загварын үнэлгээ нь хэт тохирох эсвэл дутуу тохирох гэх мэт болзошгүй асуудлуудыг тодорхойлоход тусалдаг ба урьдчилан таамаглах загварыг сайжруулахад чиглүүлдэг.
6. Загвар байршуулалт:
Урьдчилан таамаглах загварыг боловсруулж, үнэлсний дараа түүнийг шинэ, үл үзэгдэх өгөгдлүүд дээр таамаглал эсвэл ангилал гаргахад ашиглаж болно. Энэ нь загварыг оролтын өгөгдлийг авч, хүссэн үр дүнг гаргах боломжтой програм эсвэл системд нэгтгэх явдал юм. Байрлуулалт нь өргөтгөх чадвар, бодит цагийн гүйцэтгэл, одоо байгаа дэд бүтэцтэй нэгтгэх зэрэг асуудлуудыг агуулж болно. Байршуулсан орчин дахь загварын гүйцэтгэлийг хянах, шинэ өгөгдөл гарах үед загварыг үе үе давтан сургах эсвэл шинэчлэх нь чухал юм.
Машины сургалтын явцад шошгогүй өгөгдлийн урьдчилан таамаглах загвар зохион бүтээхэд өгөгдлийг урьдчилан боловсруулах, шинж чанарыг задлах, загвар сонгох, загвар сургалт, загварын үнэлгээ, загвар байршуулалт орно. Алхам бүр нь үнэн зөв, үр дүнтэй урьдчилан таамаглах загварыг боловсруулахад чухал үүрэг гүйцэтгэдэг. Эдгээр алхмуудыг дагаж, шошгогүй өгөгдлийн онцлог шинж чанарыг харгалзан үзэх замаар машин сургалтын алгоритмууд шинэ, үл үзэгдэх өгөгдлийг урьдчилан таамаглах эсвэл ангилж сурах боломжтой.
Сүүлийн үеийн бусад асуулт, хариулт EITC/AI/GCML Google Cloud Machine Learning:
- Ярианы текст
- Машин сургалтын явцад том өгөгдлийн багцтай ажиллахад ямар хязгаарлалт байдаг вэ?
- Машины сургалт нь харилцан ярианы тусламж үзүүлж чадах уу?
- TensorFlow тоглоомын талбай гэж юу вэ?
- Том өгөгдлийн багц нь үнэндээ юу гэсэн үг вэ?
- Алгоритмын гиперпараметрийн зарим жишээ юу вэ?
- Ансамблийн сургалт гэж юу вэ?
- Сонгосон машин сургалтын алгоритм тохиромжгүй бол яах вэ, зөвийг нь хэрхэн сонгох вэ?
- Машин сургалтын загвар нь сургалтын явцад хяналт тавих шаардлагатай юу?
- Мэдрэлийн сүлжээнд суурилсан алгоритмд ашигладаг гол параметрүүд юу вэ?
EITC/AI/GCML Google Cloud Machine Learning-ээс бусад асуулт, хариултуудыг харна уу
Илүү олон асуулт, хариулт:
- Талбар: Хиймэл оюун
- хөтөлбөр: EITC/AI/GCML Google Cloud Machine Learning (гэрчилгээжүүлэх хөтөлбөрт очно уу)
- Хичээл: Оршил (холбогдох хичээл рүүгээ яв)
- сэдэв: Машины сургалт гэж юу вэ (холбогдох сэдэв рүү оч)