Загвар хэт тохируулагдсан эсэхийг танихын тулд хэт тохируулга гэдэг ойлголт болон түүний машин сурахад үзүүлэх нөлөөг ойлгох хэрэгтэй. Загвар нь сургалтын өгөгдөл дээр онцгой сайн гүйцэтгэлтэй боловч шинэ, үл үзэгдэх өгөгдөлд ерөнхийлөн өгч чадаагүй тохиолдолд хэт тохируулга үүсдэг. Энэ үзэгдэл нь загварын урьдчилан таамаглах чадварт сөргөөр нөлөөлж, бодит нөхцөл байдалд муу гүйцэтгэлд хүргэж болзошгүй юм. Google Cloud Machine Learning доторх гүн мэдрэлийн сүлжээ, тооцоологчдын хүрээнд хэт тохирохыг тодорхойлоход туслах хэд хэдэн үзүүлэлт байдаг.
Хэт тохируулж байгаагийн нэг нийтлэг шинж тэмдэг бол сургалтын өгөгдөл дээрх загварын гүйцэтгэл болон баталгаажуулалт эсвэл туршилтын өгөгдөл дээрх гүйцэтгэлийн хоорондох мэдэгдэхүйц ялгаа юм. Загвар өмсөгчийг хэт их суулгасан тохиолдолд үндсэн хэв маягийг сурахын оронд сургалтын жишээг "цээжлүүлдэг". Үүний үр дүнд сургалтын багц дээр өндөр нарийвчлалтай байж болох ч шинэ өгөгдөл дээр үнэн зөв таамаглал гаргахад бэрхшээлтэй байдаг. Загварын гүйцэтгэлийг тусдаа баталгаажуулалт эсвэл туршилтын багц дээр үнэлснээр хэт тохируулагдсан эсэхийг үнэлэх боломжтой.
Хэт тохируулж байгаагийн бас нэг шинж тэмдэг бол загварын сургалтын болон баталгаажуулалтын алдааны хувь хоорондын ихээхэн ялгаа юм. Сургалтын явцад загвар нь параметрүүдийг тохируулах замаар алдаагаа багасгахыг хичээдэг. Гэсэн хэдий ч, хэрэв загвар нь хэтэрхий төвөгтэй болсон эсвэл хэт удаан сургагдсан бол энэ нь үндсэн хэв маягаас илүүтэйгээр сургалтын өгөгдөлд шуугиантай нийцэж эхэлдэг. Энэ нь сургалтын алдааны түвшин бага боловч баталгаажуулалтын алдааны хувь хэмжээ мэдэгдэхүйц өндөр байх болно. Эдгээр алдааны түвшингийн чиг хандлагыг хянах нь хэт тохирох байдлыг тодорхойлоход тусална.
Нэмж дурдахад, загварын алдагдлын функцийн зан төлөвийг ажиглах нь хэт тохируулгын талаархи ойлголтыг өгөх боломжтой. Алдагдлын функц нь загварын таамагласан үр дүн болон бодит зорилтуудын хоорондын зөрүүг хэмждэг. Хэт тохируулсан загварт сургалтын өгөгдлийн алдагдлын функц буурч, баталгаажуулалтын өгөгдлийн алдагдал нэмэгдэж эхэлдэг. Энэ нь загвар нь сургалтын жишээн дээр улам бүр мэргэшиж, ерөнхийлөн дүгнэх чадвараа алдаж байгааг харуулж байна.
Хэт тохируулга хийхээс урьдчилан сэргийлэхийн тулд зохицуулалт хийх аргыг ашиглаж болно. Зохицуулалт нь алдагдлын функцэд торгуулийн нэр томъёог нэвтрүүлж, загварыг хэт төвөгтэй болгохоос сэргийлдэг. L1 эсвэл L2-ийг тогтмолжуулах, сургууль завсардах эсвэл эрт зогсоох гэх мэт арга техникүүд нь загварын суралцах үйл явцад хязгаарлалт нэмснээр хэт их ачааллыг бууруулахад тусална.
Хэт тохируулга нь сургалтын өгөгдлийн хэмжээ, чанар, загварын архитектурын нарийн төвөгтэй байдал, сонгосон гиперпараметр зэрэг янз бүрийн хүчин зүйлээс шалтгаалж болохыг анхаарах нь чухал юм. Тиймээс, загвар өмсөгчдийг сургах, үнэлэх явцад эдгээр хүчин зүйлсийг сайтар үнэлэх нь хэт зохицохоос зайлсхийх нь чухал юм.
Мэдрэлийн гүний сүлжээ болон тооцоологчдын хэт тохируулгыг таних нь баталгаажуулалт эсвэл туршилтын өгөгдлийн гүйцэтгэлд дүн шинжилгээ хийх, сургалтын болон баталгаажуулалтын алдааны хувь хэмжээ хоорондын ялгааг хянах, алдагдлын функцийн зан төлөвийг ажиглах, зохицуулах арга техникийг ашиглах явдал юм. Эдгээр үзүүлэлтүүдийг ойлгож, зохих арга хэмжээ авснаар та хэт тохируулгын сөрөг үр дагаврыг бууруулж, илүү бат бөх, ерөнхийлөн дүгнэх боломжтой загваруудыг бий болгож чадна.
Сүүлийн үеийн бусад асуулт, хариулт Гүн мэдрэлийн сүлжээ ба тооцоологчид:
- Гүнзгий суралцах нь гүнзгий мэдрэлийн сүлжээ (DNN) дээр суурилсан загварыг тодорхойлж, сургах гэж ойлгож болох уу?
- Google-ийн TensorFlow хүрээ нь машин сургалтын загвар (жишээ нь кодчилолыг тохиргоогоор солих гэх мэт) боловсруулахад хийсвэрлэлийн түвшинг нэмэгдүүлэх боломжтой юу?
- Хэрэв өгөгдлийн багц том бол үнэлгээ бага шаардагдах бөгөөд энэ нь өгөгдлийн багцын хэмжээг нэмэгдүүлэх замаар үнэлгээнд ашигласан өгөгдлийн багцын хэсгийг багасгаж болно гэсэн үг үү?
- Гүн мэдрэлийн сүлжээний (DNN) далд аргумент болгон нийлүүлсэн массивыг өөрчилснөөр давхаргын тоо болон давхаргын зангилааны тоог хялбархан хянаж (нэмэх, хасах) боломжтой юу?
- Мэдрэлийн сүлжээ ба гүн мэдрэлийн сүлжээ гэж юу вэ?
- Гүн мэдрэлийн сүлжээг яагаад гүн гэж нэрлэдэг вэ?
- DNN-д илүү олон зангилаа нэмэхийн давуу болон сул талууд юу вэ?
- Алга болсон градиентийн асуудал юу вэ?
- Шугаман загвартай харьцуулахад гүн мэдрэлийн сүлжээг ашиглах ямар сул тал байдаг вэ?
- DNN ангилагч дээр ямар нэмэлт параметрүүдийг тохируулах боломжтой бөгөөд тэдгээр нь мэдрэлийн сүлжээг нарийн тохируулахад хэрхэн хувь нэмэр оруулдаг вэ?
Гүн мэдрэлийн сүлжээ болон тооцоологчоос илүү олон асуулт, хариултыг харна уу