Жингийн 80%-ийг сургалтад, 20%-ийг машин сургалтын хүрээнд үнэлэхэд хуваарилах нь хэд хэдэн хүчин зүйл дээр үндэслэсэн стратегийн шийдвэр юм. Энэхүү хуваарилалт нь сургалтын үйл явцыг оновчтой болгох, загварын гүйцэтгэлийн үнэн зөв үнэлгээг хангах хооронд тэнцвэрийг бий болгох зорилготой юм. Энэ хариултанд бид энэ сонголтын цаад шалтгааныг судалж, түүний санал болгож буй дидактик үнэ цэнийг судлах болно.
Сургалтын 80%, үнэлгээний 20% гэсэн үндэслэлийг ойлгохын тулд машин сургалтын долоон алхмыг ойлгох нь маш чухал юм. Мэдээлэл цуглуулах, өгөгдөл бэлтгэх, загварт сургалт явуулах, загварын үнэлгээ, загвар тааруулах, загвар байршуулах, загварын хяналтыг багтаасан эдгээр алхмууд нь машин сургалтын загвар бүтээх цогц тогтолцоог бүрдүүлдэг.
Эхний алхам болох өгөгдөл цуглуулах нь загварыг сургах холбогдох өгөгдлийг цуглуулах явдал юм. Дараа нь энэ өгөгдлийг урьдчилан боловсруулж, өгөгдөл бэлтгэх үе шатанд бэлтгэдэг. Өгөгдөл бэлэн болмогц загвар сургалтын үе шат эхэлдэг бөгөөд загвар нь хэв маяг, харилцаа холбоог сурахын тулд сургалтын мэдээллийн багцад өртдөг. Дараа нь загварын үнэлгээний үе шатанд тусдаа өгөгдлийн багц ашиглан загварын гүйцэтгэлийг үнэлдэг.
Жингийн 80%-ийг сургалтанд, 20%-ийг үнэлгээнд тусгах шийдвэр гаргасан нь загвар нь өгөгдлөөс суралцдаг үндсэн үе шат бол сургалтаас үүдэлтэй. Сургалтын явцад загвар нь урьдчилан таамагласан үр дүн болон сургалтын өгөгдлийн багц дахь бодит үр дүнгийн хоорондох ялгааг багасгахын тулд дотоод параметрүүдээ тохируулдаг. Энэ процесс нь градиент уналт гэх мэт оновчлолын алгоритмуудыг ашиглан загварын параметрүүдийг давталттайгаар шинэчлэх явдал юм.
Сургалтын жинг өндөрсгөснөөр бид тухайн загварт өгөгдлөөс суралцах, нарийн төвөгтэй хэв маягийг олж авах чадварыг чухалчилдаг. Сургалтын үе шат нь загвар нь мэдлэгээ олж авч, сургалтын өгөгдлийн багцыг нэгтгэн үл үзэгдэх өгөгдлийн талаар таамаглал дэвшүүлдэг. Загвар сургалтын өгөгдөлд хэдий чинээ их өртөх тусам илүү сайн суралцаж, ерөнхийлөн дүгнэх боломжтой. Тиймээс үнэлгээний үйл явцын нэлээд хэсгийг сургалтад зориулах нь тухайн загвар нь үр дүнтэй суралцахын тулд сургалтын өгөгдөлд хангалттай өртөх боломжийг олгодог.
Нөгөөтэйгүүр, үнэлгээний үе шат нь үл үзэгдэх өгөгдөл дээрх загварын гүйцэтгэлийг үнэлэхэд чухал үүрэг гүйцэтгэдэг. Сургалтын өгөгдлийн багцаас тусдаа үнэлгээний өгөгдлийн багц нь бодит нөхцөл байдлын прокси болж өгдөг. Энэ нь загвар нь шинэ болон үл үзэгдэх тохиолдлуудад сурсан мэдсэнээ хэр сайн нэгтгэж чадахыг хэмжих боломжийг бидэнд олгодог. Загварын гүйцэтгэлийг үнэлэх нь асуудлын тодорхой чиглэлээс хамааран түүний нарийвчлал, нарийвчлал, эргэн санах эсвэл бусад холбогдох хэмжигдэхүүнийг хэмжихэд зайлшгүй шаардлагатай.
Үнэлгээнд өгсөн 20%-ийн жин нь загварыг үл үзэгдэх өгөгдөл дээр хатуу шалгаж, түүний чадавхийг бодитой үнэлэх боломжийг олгодог. Үнэлгээний энэ үе шат нь загварын таамаглалд хэт тохирох, дутуу тохирох, хэвийх зэрэг болзошгүй асуудлуудыг илрүүлэхэд тусалдаг. Энэ нь гүйцэтгэлийг сайжруулахын тулд гиперпараметр болон загварын архитектурыг нарийн тохируулах боломжийг олгодог.
Энэ ойлголтыг харуулахын тулд практик жишээг авч үзье. Бид муур, нохойн зургийг ангилах машин сургалтын загварыг сургаж байна гэж бодъё. Сургалтын үе шатанд загвар өмсөгч нь шошготой зургийн томоохон мэдээллийн багцад дүн шинжилгээ хийх замаар муур, нохойн онцлогийг ялгаж сурдаг. Загвар өмсөгч хэдий чинээ олон зураг дээр сургаж чадна, төдий чинээ хоёр ангиллыг ялгах чадвар сайжирна.
Сургалт дууссаны дараа загварыг өмнө нь хэзээ ч харж байгаагүй зургуудыг агуулсан тусдаа мэдээллийн багц ашиглан үнэлдэг. Үнэлгээний энэ үе шат нь тухайн загвар сурсан мэдсэнээ ерөнхийд нь дүгнэж, шинэ, үл үзэгдэх зургийг үнэн зөв ангилах чадварыг шалгадаг. Үнэлгээнд жингийн 20%-ийг хуваарилснаар бид загварын гүйцэтгэлийг үл үзэгдэх өгөгдлүүд дээр сайтар үнэлж, түүний үр нөлөөг найдвартай хэмждэг.
Машины сургалтын явцад жингийн 80%-ийг сургалтанд, 20%-ийг үнэлгээнд хуваарилах нь сургалтын үйл явцыг оновчтой болгохын зэрэгцээ загварын гүйцэтгэлийн үнэн зөв үнэлгээг хангахад чиглэсэн стратегийн сонголт юм. Үнэлгээний үйл явцын нэлээд хэсгийг сургалтад зориулснаар бид загвар нь өгөгдлөөс суралцаж, нарийн төвөгтэй хэв маягийг олж авах чадварыг чухалчилдаг. Үүний зэрэгцээ үнэлгээний үе шат нь загварыг үл үзэгдэх өгөгдөл дээр хатуу шалгаж, түүний чадавхийг бодитоор үнэлдэг.
Сүүлийн үеийн бусад асуулт, хариулт EITC/AI/GCML Google Cloud Machine Learning:
- Текстээс яриа (TTS) гэж юу вэ, энэ нь хиймэл оюун ухаантай хэрхэн ажилладаг вэ?
- Машин сургалтын явцад том өгөгдлийн багцтай ажиллахад ямар хязгаарлалт байдаг вэ?
- Машины сургалт нь харилцан ярианы тусламж үзүүлж чадах уу?
- TensorFlow тоглоомын талбай гэж юу вэ?
- Том өгөгдлийн багц нь үнэндээ юу гэсэн үг вэ?
- Алгоритмын гиперпараметрийн зарим жишээ юу вэ?
- Ансамблийн сургалт гэж юу вэ?
- Сонгосон машин сургалтын алгоритм тохиромжгүй бол яах вэ, зөвийг нь хэрхэн сонгох вэ?
- Машин сургалтын загвар нь сургалтын явцад хяналт тавих шаардлагатай юу?
- Мэдрэлийн сүлжээнд суурилсан алгоритмд ашигладаг гол параметрүүд юу вэ?
EITC/AI/GCML Google Cloud Machine Learning-ээс бусад асуулт, хариултуудыг харна уу