Багцын хэмжээ, эрин үе, өгөгдлийн багцын хэмжээ нь машин сурахад үнэхээр чухал талууд бөгөөд үүнийг ихэвчлэн гиперпараметр гэж нэрлэдэг. Энэ ойлголтыг ойлгохын тулд нэр томъёо бүрийг тус тусад нь авч үзье.
Багцын хэмжээ:
Багцын хэмжээ нь сургалтын явцад загварын жинг шинэчлэхээс өмнө боловсруулсан дээжийн тоог тодорхойлдог гиперпараметр юм. Энэ нь сургалтын үйл явцын хурд, тогтвортой байдлыг тодорхойлоход чухал үүрэг гүйцэтгэдэг. Бага багцын хэмжээ нь загварын жинг илүү их шинэчлэх боломжийг олгодог бөгөөд энэ нь илүү хурдан нийлэхэд хүргэдэг. Гэсэн хэдий ч энэ нь сургалтын үйл явцад чимээ шуугиан үүсгэж болзошгүй юм. Нөгөөтэйгүүр, илүү том багцын хэмжээ нь градиентийг илүү тогтвортой тооцоолох боломжийг олгодог боловч сургалтын явцыг удаашруулдаг.
Жишээлбэл, стохастик градиент уналт (SGD)-д багцын хэмжээ 1-ийг цэвэр SGD гэж нэрлэдэг бөгөөд загвар нь дээж бүрийг боловсруулсны дараа жингээ шинэчилдэг. Үүний эсрэгээр, сургалтын өгөгдлийн багцын хэмжээтэй тэнцэх багцын хэмжээг багцын градиент уналт гэж нэрлэдэг бөгөөд загвар нь тухайн үеийн жинг нэг удаа шинэчилдэг.
Эрин үе:
Эрин үе гэдэг нь сургалтын явцад мэдрэлийн сүлжээгээр нийт өгөгдлийн багцыг урагш болон хойш дамжуулах тоог тодорхойлдог өөр нэг гиперпараметр юм. Загварыг олон эрин үед сургах нь түүний жинг давтах замаар тохируулах замаар өгөгдлийн нарийн төвөгтэй хэв маягийг сурах боломжийг олгодог. Гэсэн хэдий ч хэт олон эрин үеийг сургах нь загвар нь сургалтын өгөгдөл дээр сайн ажилладаг боловч үл үзэгдэх өгөгдлийг нэгтгэж чаддаггүй тул хэт тохируулгад хүргэдэг.
Жишээлбэл, хэрэв өгөгдлийн багц нь 1,000 дээжээс бүрдэх бөгөөд загвар нь 10 үе шаттайгаар бэлтгэгдсэн бол сургалтын явцад загвар нь өгөгдлийн багцыг бүхэлд нь 10 удаа үзсэн гэсэн үг юм.
Өгөгдлийн багцын хэмжээ:
Өгөгдлийн багцын хэмжээ нь машин сургалтын загварыг сургах боломжтой дээжийн тоог хэлнэ. Энэ нь тухайн загварын гүйцэтгэл, ерөнхийлөн дүгнэх чадварт шууд нөлөөлдөг чухал хүчин зүйл юм. Илүү том өгөгдлийн багцын хэмжээ нь загварт суралцахад илүү олон янзын жишээ өгдөг тул илүү сайн загвар гүйцэтгэлд хүргэдэг. Гэсэн хэдий ч том өгөгдлийн багцтай ажиллах нь тооцооллын нөөц, сургалтанд шаардагдах хугацааг нэмэгдүүлэх боломжтой.
Практикт хэт тохируулга эсвэл дутуу тохирохоос сэргийлэхийн тулд өгөгдлийн багцын хэмжээ болон загварын нарийн төвөгтэй байдлын хооронд тэнцвэрийг бий болгох нь чухал юм. Хязгаарлагдмал өгөгдлийн багцаас хамгийн их ашиг хүртэхийн тулд өгөгдлийг нэмэгдүүлэх, тогтмолжуулах зэрэг арга техникийг ашиглаж болно.
Багцын хэмжээ, эрин үе, өгөгдлийн багцын хэмжээ нь сургалтын үйл явц болон загварын эцсийн гүйцэтгэлд ихээхэн нөлөөлдөг машин сургалтын гиперпараметрүүд юм. Эдгээр гиперпараметрүүдийг хэрхэн үр дүнтэй тохируулахыг ойлгох нь бат бөх, үнэн зөв машин сургалтын загварыг бий болгоход маш чухал юм.
Сүүлийн үеийн бусад асуулт, хариулт EITC/AI/GCML Google Cloud Machine Learning:
- Текстээс яриа (TTS) гэж юу вэ, энэ нь хиймэл оюун ухаантай хэрхэн ажилладаг вэ?
- Машин сургалтын явцад том өгөгдлийн багцтай ажиллахад ямар хязгаарлалт байдаг вэ?
- Машины сургалт нь харилцан ярианы тусламж үзүүлж чадах уу?
- TensorFlow тоглоомын талбай гэж юу вэ?
- Том өгөгдлийн багц нь үнэндээ юу гэсэн үг вэ?
- Алгоритмын гиперпараметрийн зарим жишээ юу вэ?
- Ансамблийн сургалт гэж юу вэ?
- Сонгосон машин сургалтын алгоритм тохиромжгүй бол яах вэ, зөвийг нь хэрхэн сонгох вэ?
- Машин сургалтын загвар нь сургалтын явцад хяналт тавих шаардлагатай юу?
- Мэдрэлийн сүлжээнд суурилсан алгоритмд ашигладаг гол параметрүүд юу вэ?
EITC/AI/GCML Google Cloud Machine Learning-ээс бусад асуулт, хариултуудыг харна уу