Машин сургалтын хүрээнд гиперпараметрүүд нь алгоритмын гүйцэтгэл, үйл ажиллагааг тодорхойлоход чухал үүрэг гүйцэтгэдэг. Гиперпараметрүүд нь сургалтын үйл явц эхлэхээс өмнө тохируулагдсан параметрүүд юм. Тэд сургалтын явцад суралцдаггүй; үүний оронд тэд сургалтын үйл явцыг өөрөө хянадаг. Үүний эсрэгээр, мэдрэлийн сүлжээн дэх жин гэх мэт загварын параметрүүдийг сургалтын явцад сурдаг.
Машин сургалтын алгоритмуудад түгээмэл байдаг гиперпараметрүүдийн зарим жишээг авч үзье:
1. Сурах түвшин (α): Суралцах хурд нь алдагдал градиенттай холбоотойгоор сүлжээнийхээ жинг хэр их тохируулж байгааг хянадаг гиперпараметр юм. Суралцах түвшин өндөр байх нь загварын параметрүүд огцом хэлбэлзэх, харин суралцах хурд нь удаан нийлэхэд хүргэдэг.
2. Нууцлагдсан нэгж/давхаргын тоо: Мэдрэлийн сүлжээнд далд нэгж, давхаргын тоо нь загварын нарийн төвөгтэй байдлыг тодорхойлдог гиперпараметрүүд юм. Илүү далд нэгжүүд эсвэл давхаргууд нь илүү төвөгтэй хэв маягийг барьж чаддаг ч хэт тохируулгад хүргэдэг.
3. Идэвхжүүлэх функц: ReLU (Rectified Linear Unit) эсвэл Sigmoid зэрэг идэвхжүүлэх функцийн сонголт нь загварын шугаман бус байдалд нөлөөлдөг гиперпараметр юм. Янз бүрийн идэвхжүүлэх функцууд нь өөр өөр шинж чанартай бөгөөд сургалтын хурд болон загварын гүйцэтгэлд нөлөөлж болно.
4. Багцын хэмжээ: Багцын хэмжээ нь нэг давталтад ашигласан сургалтын жишээнүүдийн тоо юм. Энэ нь сургалтын хурд, тогтвортой байдалд нөлөөлдөг гиперпараметр юм. Багцын хэмжээ их байх нь сургалтыг хурдасгах боловч нарийвчлал багатай шинэчлэлтийг бий болгодог бол жижиг багц хэмжээ нь илүү нарийвчлалтай шинэчлэлтүүдийг өгөх боловч сургалтыг удаашруулдаг.
5. Тогтворжуулах хүч: Тогтворжуулах гэдэг нь алдагдлын функц дээр торгуулийн нэр томъёог нэмж, хэт тааруулахаас урьдчилан сэргийлэх арга юм. L2 зохицуулалт дахь λ гэх мэт зохицуулалтын хүч нь зохицуулалтын нэр томъёоны нийт алдагдалд үзүүлэх нөлөөллийг хянадаг гиперпараметр юм.
6. Сургуулиа завсардах хувь: Сургуулийн завсарлага нь сургалтын явцад санамсаргүй байдлаар сонгосон мэдрэлийн эсүүдийг үл тоомсорлодог зохицуулалтын арга юм. Сургуулийн завсарлага нь мэдрэлийн эсийг орхих магадлалыг тодорхойлдог гиперпараметр юм. Энэ нь бэлтгэлийн үеэр дуу чимээ гаргах замаар хэт ачаалал өгөхөөс сэргийлдэг.
7. Цөмийн хэмжээ: Convolutional Neural Network (CNN)-д цөмийн хэмжээ нь оролтын өгөгдөлд хэрэглэгдэх шүүлтүүрийн хэмжээг тодорхойлдог гиперпараметр юм. Өөр өөр цөмийн хэмжээ нь оролтын өгөгдлийн янз бүрийн түвшний нарийвчилсан мэдээллийг агуулдаг.
8. Модны тоо (санамсаргүй ойд): Санамсаргүй ой гэх мэт ансамблийн аргуудад модны тоо нь ой дахь шийдвэрийн модны тоог тодорхойлдог гиперпараметр юм. Модны тоог нэмэгдүүлэх нь гүйцэтгэлийг сайжруулахаас гадна тооцооллын зардлыг нэмэгдүүлдэг.
9. Дэмжих вектор машинуудын C (SVM): SVM-д C нь шийдвэрийн хил хязгаар болон сургалтын цэгүүдийг зөв ангилах хоорондын зөрүүг хянадаг гиперпараметр юм. Өндөр С утга нь илүү төвөгтэй шийдвэрийн хил хязгаарт хүргэдэг.
10. Кластерын тоо (K-дунжаар): K-Means гэх мэт кластерын алгоритмуудад кластерын тоо нь алгоритмын өгөгдөлд тодорхойлох ёстой кластеруудын тоог тодорхойлдог гиперпараметр юм. Кластерын зөв тоог сонгох нь утга учиртай кластерын үр дүнд чухал үүрэгтэй.
Эдгээр жишээнүүд нь машин сургалтын алгоритм дахь гиперпараметрийн олон янз байдлыг харуулж байна. Гиперпараметрийг тохируулах нь загварын гүйцэтгэл, ерөнхий ойлголтыг оновчтой болгохын тулд машин сургалтын ажлын урсгалын чухал алхам юм. Торон хайлт, санамсаргүй хайлт, Bayesian оновчлол нь тухайн асуудлын хамгийн сайн гиперпараметрийн багцыг олоход хэрэглэгддэг нийтлэг арга юм.
Гиперпараметрүүд нь загварын зан төлөв, гүйцэтгэлд нөлөөлдөг машин сургалтын алгоритмын чухал бүрэлдэхүүн хэсэг юм. Гиперпараметрийн үүрэг, тэдгээрийг хэрхэн үр дүнтэй тохируулахыг ойлгох нь машин сургалтын амжилттай загваруудыг хөгжүүлэхэд маш чухал юм.
Сүүлийн үеийн бусад асуулт, хариулт EITC/AI/GCML Google Cloud Machine Learning:
- Ярианы текст
- Машин сургалтын явцад том өгөгдлийн багцтай ажиллахад ямар хязгаарлалт байдаг вэ?
- Машины сургалт нь харилцан ярианы тусламж үзүүлж чадах уу?
- TensorFlow тоглоомын талбай гэж юу вэ?
- Том өгөгдлийн багц нь үнэндээ юу гэсэн үг вэ?
- Ансамблийн сургалт гэж юу вэ?
- Сонгосон машин сургалтын алгоритм тохиромжгүй бол яах вэ, зөвийг нь хэрхэн сонгох вэ?
- Машин сургалтын загвар нь сургалтын явцад хяналт тавих шаардлагатай юу?
- Мэдрэлийн сүлжээнд суурилсан алгоритмд ашигладаг гол параметрүүд юу вэ?
- TensorBoard гэж юу вэ?
EITC/AI/GCML Google Cloud Machine Learning-ээс бусад асуулт, хариултуудыг харна уу
Илүү олон асуулт, хариулт:
- Талбар: Хиймэл оюун
- хөтөлбөр: EITC/AI/GCML Google Cloud Machine Learning (гэрчилгээжүүлэх хөтөлбөрт очно уу)
- Хичээл: Оршил (холбогдох хичээл рүүгээ яв)
- сэдэв: Машины сургалт гэж юу вэ (холбогдох сэдэв рүү оч)