Машины сургалтын хүрээнд зохицуулалт хийх нь загваруудын ерөнхий гүйцэтгэлийг сайжруулахад, ялангуяа өндөр хэмжээст өгөгдөл эсвэл хэт тохируулгад өртөмтгий төвөгтэй загваруудтай ажиллахад ашигладаг чухал арга юм. Загвар нь сургалтын өгөгдлийн үндсэн хэв маягийг төдийгүй чимээ шуугианыг сурч мэдсэн тохиолдолд хэт тохируулга үүсдэг бөгөөд үүний үр дүнд үл үзэгдэх өгөгдлийн гүйцэтгэл муу болно. Зохицуулалт нь загварт нэмэлт мэдээлэл эсвэл хязгаарлалтыг нэвтрүүлж, хэт нарийн төвөгтэй загваруудыг шийтгэх замаар хэт тохирохоос сэргийлдэг.
Тогтворжуулах үндсэн санаа нь загвар нь багасгахыг оролдож буй алдагдлын функцэд торгуулийн нэр томъёог оруулах явдал юм. Энэхүү торгуулийн нэр томъёо нь загварын параметрийн хэмжээгээр хэмжигддэг нарийн төвөгтэй байдалд өртөг тооцож, сургалтын өгөгдөлд дуу чимээг тохируулахаас сэргийлдэг. Үүнийг хийснээр тогтмолжуулалт нь сургалтын өгөгдлийг сайн тохируулах, шинэ өгөгдөлд нэгтгэх загвар чадварыг хадгалах хоорондын тэнцвэрт байдалд хүрэхэд тусалдаг.
Машины сургалтанд хэд хэдэн төрлийн зохицуулалт хийх аргууд байдаг бөгөөд хамгийн түгээмэл нь L1 зохицуулалт, L2 зохицуулалт, сургууль завсардалт юм. Эдгээр техник бүр өөрийн гэсэн онцлог, хэрэглээтэй байдаг.
1. L1 зохицуулалт (Лассо регресс): L1 зохицуулалт нь алдагдлын функцэд коэффициентийн хэмжээнүүдийн үнэмлэхүй утгатай тэнцэх торгуулийг нэмдэг. Математикийн хувьд үүнийг дараах байдлаар илэрхийлж болно.
хаана анхны алдагдлын функц,
нь зохицуулалтын параметр бөгөөд
загварын параметрүүд юм. L1-ийн зохицуулалтын үр нөлөө нь сийрэг загвар гаргах хандлагатай байдаг бөгөөд энэ нь зарим коэффициентийг тэг болгож, функцийн сонголтыг үр дүнтэй гүйцэтгэдэг гэсэн үг юм. Энэ нь олон шинж чанар нь хамааралгүй байж болох өндөр хэмжээст өгөгдөлтэй ажиллахад ялангуяа ашигтай байж болно.
2. L2 Зохицуулалт (Рижийн регресс): L2 зохицуулалт нь алдагдлын функцэд коэффициентүүдийн квадраттай тэнцэх торгуулийг нэмдэг. Үүнийг математикийн хувьд дараах байдлаар илэрхийлнэ.
L2-ийн зохицуулалт нь том коэффициентүүдийн квадрат утгыг шийтгэхээс татгалзаж, жинг илүү жигд хуваарилахад хүргэдэг. L1-ээс ялгаатай нь L2-ийн зохицуулалт нь сийрэг загвар гаргахгүй, учир нь энэ нь коэффициентийг яг тэг болгохыг албаддаггүй, харин тэдгээрийг бага байлгадаг. Энэ нь ялангуяа бүх онцлог шинж чанар нь хамааралтай байх үед хэт тохирохоос зайлсхийхэд тустай.
3. Уян хатан тор зохицуулалт: Elastic Net нь L1 болон L2 зохицуулалтыг хослуулсан. Энэ нь олон хамааралтай шинж чанаруудтай тохиолдолд ялангуяа ашигтай байдаг. Уян хатан торгууль нь L1 ба L2 торгуулийн шугаман хослол юм.
Параметрүүдийг тохируулах замаар болон
, Elastic Net нь L1 болон L2 зохицуулалтын ашиг тусыг тэнцвэржүүлж чадна.
4. Сургууль завсардсан: Dropout бол мэдрэлийн сүлжээнд тусгайлан зориулсан зохицуулалтын техник юм. Сургалтын явцад завсарлага нь давталт бүрт давхарга дахь зангилааны (нейрон) хэсгийг санамсаргүй байдлаар тэг болгож тохируулдаг. Энэ нь сүлжээг аль нэг зангилаанд хэт их найдахаас сэргийлж, сүлжээг илүү бат бөх шинж чанаруудыг сурахад түлхэц өгдөг. Сургуулийн завсарлага нь олон тооны параметрийн улмаас хэт тохирох нь нийтлэг асуудал болох гүнзгий сургалтын загварт үр дүнтэй байдаг.
5. Эрт зогсоох: Хэдийгээр уламжлалт утгаараа тогтворжуулах арга биш ч эрт зогсоох нь баталгаажуулалтын багцын гүйцэтгэл муудаж эхэлмэгц сургалтын үйл явцыг зогсоох замаар хэт ачаалал өгөхөөс урьдчилан сэргийлэх стратеги юм. Энэ нь загвар байнга шинэчлэгдэж байдаг градиент уналт зэрэг давтагдах аргуудад ялангуяа ашигтай байдаг.
Загваруудыг нарийн төвөгтэй байдлыг хянах замаар үл үзэгдэх өгөгдлүүд дээр сайн ажиллах боломжийг олгодог тул машин сургалтанд зохицуулалт хийх нь чухал юм. Тогтворжуулах техникийг сонгох, түүний параметрүүдийг тохируулах ( L1 ба L2-ийн хувьд сургууль завсардалт) нь чухал бөгөөд оновчтой үр дүнд хүрэхийн тулд ихэвчлэн туршилт, хөндлөнгийн баталгаажуулалтыг шаарддаг.
Жишээлбэл, олон функц бүхий өгөгдлийн багц дээр сургагдсан шугаман регрессийн загварыг авч үзье. Зохицуулалтгүйгээр загвар нь зарим онцлогт том жин өгч, сургалтын өгөгдөлд маш нягт нийцэж болох боловч хэт тохируулсны улмаас туршилтын өгөгдөл дээр муу ажиллаж магадгүй юм. L2 зохицуулалтыг хэрэглэснээр загвар нь жинг илүү жигд хуваарилж, шинэ өгөгдлийг илүү сайн нэгтгэхэд хүргэж болзошгүй юм.
Өөр нэг хувилбарт, зургийн өгөгдөл дээр сургагдсан мэдрэлийн сүлжээ нь сургалтын зураг дээрх тодорхой хэв маягийг цээжлэх замаар давж болно. Сургуулийн завсарлага хэрэглэснээр сүлжээ нь өөр өөр зураг дээр хэрэг болох ерөнхий шинж чанаруудыг сурч, үл үзэгдэх өгөгдөл дээр гүйцэтгэлээ сайжруулах шаардлагатай болдог.
Зохицуулалт нь машины сургалтын үндсэн ойлголт бөгөөд загвар алдагдсан функцэд нарийн төвөгтэй байдлын торгууль нэмж, хэт тохирохоос урьдчилан сэргийлэхэд тусалдаг. Загварын нарийн төвөгтэй байдлыг хянаснаар L1, L2, Elastic Net, сургууль завсардалт, эрт зогсоох зэрэг зохицуулалтын аргууд нь шинэ өгөгдлийг илүү сайн нэгтгэх боломжийг олгодог бөгөөд энэ нь машин сургалтын дадлагажигч нарын зайлшгүй хэрэглүүр болдог.
Сүүлийн үеийн бусад асуулт, хариулт EITC/AI/GCML Google Cloud Machine Learning:
- Тоглогчдын зурсан doodles-ийг тайлбарлах нь юу вэ?
- Унших материалд "зөв алгоритм сонгох" тухай ярих нь үндсэндээ бүх боломжит алгоритмууд аль хэдийн байгаа гэсэн үг үү? Алгоритм нь тодорхой асуудалд "зөв" гэдгийг бид яаж мэдэх вэ?
- Машины сургалтанд ашигладаг гиперпараметрүүд юу вэ?
- Whawt бол машин сургалтын програмчлалын хэл бөгөөд зүгээр л Python хэл юм
- Шинжлэх ухааны ертөнцөд машин сургалтыг хэрхэн ашигладаг вэ?
- Та ямар машин сургалтын алгоритмыг ашиглахаа хэрхэн шийдэж, түүнийг хэрхэн олох вэ?
- Холбооны сургалт, захын тооцоолол, төхөөрөмж дээрх машин сургалтын хооронд ямар ялгаа байдаг вэ?
- Сургалтын өмнө өгөгдлийг хэрхэн бэлтгэх, цэвэрлэх вэ?
- Машин сургалтын төслийн тодорхой эхний даалгавар, үйл ажиллагаанууд юу вэ?
- Тодорхой машин сургалтын стратеги, загварыг хэрэгжүүлэхэд ямар дүрэм журам байдаг вэ?
EITC/AI/GCML Google Cloud Machine Learning-ээс бусад асуулт, хариултуудыг харна уу