Үл үзэгдэх өгөгдөл дээр суурилсан сургалтын алгоритмыг бий болгох үйл явц нь хэд хэдэн алхам, анхаарал хандуулдаг. Энэ зорилгын алгоритмыг боловсруулахын тулд үл үзэгдэх өгөгдлийн мөн чанар, түүнийг машин сургалтын ажилд хэрхэн ашиглаж болохыг ойлгох шаардлагатай. Ангиллын даалгаварт анхаарлаа хандуулж, үл үзэгдэх өгөгдөлд тулгуурлан сурах алгоритмыг бий болгох алгоритмын аргыг тайлбарлая.
Юуны өмнө "үл үзэгдэх өгөгдөл" гэж юу болохыг ойлгох нь чухал юм. Машины сургалтын хүрээнд үл үзэгдэх өгөгдөл гэдэг нь шууд ажиглагддаггүй эсвэл дүн шинжилгээ хийх боломжгүй өгөгдлийг хэлнэ. Үүнд дутуу, дутуу эсвэл ямар нэгэн байдлаар далдлагдсан өгөгдөл багтаж болно. Асуудал нь энэ төрлийн өгөгдлөөс үр дүнтэй суралцаж, үнэн зөв таамаглал эсвэл ангилал хийх алгоритмуудыг боловсруулах явдал юм.
Үл үзэгдэгч өгөгдөлтэй харьцах нийтлэг арга барилуудын нэг бол тооллого эсвэл өгөгдлийг нэмэгдүүлэх зэрэг арга техникийг ашиглах явдал юм. Тооцоолол нь байгаа өгөгдөлд ажиглагдсан загвар эсвэл харилцаанд үндэслэн өгөгдлийн багц дахь дутуу утгыг нөхөх явдал юм. Үүнийг дундаж тооцоолол эсвэл регрессийн тооцоолол зэрэг статистикийн янз бүрийн аргуудыг ашиглан хийж болно. Нөгөө талаас өгөгдлийг нэмэгдүүлэх нь одоо байгаа өгөгдөл дээр үндэслэн нэмэлт синтетик мэдээллийн цэгүүдийг бий болгох явдал юм. Үүнийг боломжит өгөгдөлд хувиргах эсвэл түгшүүртэй болгох, сургалтын багцыг үр дүнтэй өргөжүүлэх, сургалтын алгоритмд илүү их мэдээлэл өгөх замаар хийж болно.
Үл үзэгдэгч өгөгдөлтэй ажиллахад анхаарах бас нэг чухал зүйл бол функцын инженерчлэл юм. Онцлогын инженерчлэл нь сургалтын алгоритмд үнэн зөв таамаглал гаргахад туслах боломжтой өгөгдлөөс хамгийн хамааралтай шинж чанаруудыг сонгох буюу үүсгэх явдал юм. Үл үзэгдэх өгөгдлийн хувьд энэ нь шууд ажиглагдахгүй далд эсвэл далд шинж чанарыг тодорхойлох, задлах явдал байж болно. Жишээлбэл, текстийг ангилах даалгаварт тодорхой үг, хэллэг байгаа нь текстэд тодорхой дурдаагүй байсан ч ангийн шошгыг илэрхийлж болно. Онцлогуудыг сайтар боловсруулж, сонгосноор сургалтын алгоритм нь үнэн зөв таамаглал гаргахад шаардлагатай мэдээллээр хангагдана.
Өгөгдлийг урьдчилан боловсруулж, шинж чанаруудыг нь боловсруулж дууссаны дараа тохирох сургалтын алгоритмыг сонгох цаг болжээ. Шийдвэрийн мод, дэмжлэгийн вектор машин, мэдрэлийн сүлжээ зэрэг ангиллын даалгаварт ашиглаж болох янз бүрийн алгоритмууд байдаг. Алгоритмыг сонгох нь өгөгдлийн онцлог шинж чанар болон тулгарч буй асуудлаас хамаарна. Даалгаврын хамгийн тохиромжтой алгоритмыг тодорхойлохын тулд нарийвчлал эсвэл F1 оноо гэх мэт тохирох хэмжигдэхүүнүүдийг ашиглан өөр өөр алгоритмуудыг туршиж, гүйцэтгэлийг нь үнэлэх нь чухал юм.
Сургалтын алгоритмыг сонгохоос гадна сургалтын үйл явцыг анхаарч үзэх нь чухал юм. Энэ нь өгөгдлийг сургалт, баталгаажуулалтын багц болгон хуваах, алгоритмыг сургахад сургалтын багц болон түүний гүйцэтгэлийг үнэлэх баталгаажуулалтын багцыг ашиглах явдал юм. Сургалтын явцад алгоритмын гүйцэтгэлийг хянаж, шаардлагатай бол гиперпараметрийг өөрчлөх, зохицуулалт хийх арга техникийг ашиглах зэрэг тохируулга хийх нь маш чухал юм.
Сургалтын алгоритмыг сургаж, баталгаажуулсны дараа түүнийг шинэ, үл үзэгдэх өгөгдөл дээр таамаглахад ашиглаж болно. Үүнийг ихэвчлэн туршилт эсвэл дүгнэлтийн үе шат гэж нэрлэдэг. Алгоритм нь үл үзэгдэх өгөгдлийн онцлогийг оролт болгон авч, таамаглал эсвэл ангиллыг гаралт болгон гаргадаг. Алгоритмын үнэн зөвийг түүний таамаглалыг үл үзэгдэх өгөгдлийн жинхэнэ шошготой харьцуулах замаар үнэлж болно.
Үл үзэгдэгч өгөгдөлд тулгуурлан сургалтын алгоритмыг бий болгох нь өгөгдлийн урьдчилсан боловсруулалт, функцын инженерчлэл, алгоритмын сонголт, сургалт, баталгаажуулалт зэрэг хэд хэдэн үе шат, анхаарал хандуулдаг. Эдгээр алхмуудыг сайтар боловсруулж, хэрэгжүүлснээр үл үзэгдэх өгөгдлөөс үр дүнтэй суралцаж, үнэн зөв таамаглал эсвэл ангилал хийх алгоритмуудыг боловсруулах боломжтой.
Сүүлийн үеийн бусад асуулт, хариулт EITC/AI/GCML Google Cloud Machine Learning:
- Текстээс яриа (TTS) гэж юу вэ, энэ нь хиймэл оюун ухаантай хэрхэн ажилладаг вэ?
- Машин сургалтын явцад том өгөгдлийн багцтай ажиллахад ямар хязгаарлалт байдаг вэ?
- Машины сургалт нь харилцан ярианы тусламж үзүүлж чадах уу?
- TensorFlow тоглоомын талбай гэж юу вэ?
- Том өгөгдлийн багц нь үнэндээ юу гэсэн үг вэ?
- Алгоритмын гиперпараметрийн зарим жишээ юу вэ?
- Ансамблийн сургалт гэж юу вэ?
- Сонгосон машин сургалтын алгоритм тохиромжгүй бол яах вэ, зөвийг нь хэрхэн сонгох вэ?
- Машин сургалтын загвар нь сургалтын явцад хяналт тавих шаардлагатай юу?
- Мэдрэлийн сүлжээнд суурилсан алгоритмд ашигладаг гол параметрүүд юу вэ?
EITC/AI/GCML Google Cloud Machine Learning-ээс бусад асуулт, хариултуудыг харна уу