Хиймэл оюун ухааны салбарт Keras загварын өгөгдсөн жишээнд давхаргад хэд хэдэн идэвхжүүлэх функцийг ашигласан болно. Идэвхжүүлэх функцууд нь шугаман бус байдлыг нэвтрүүлж, сүлжээг нарийн төвөгтэй хэв маягийг сурч, үнэн зөв таамаглал гаргах боломжийг олгодог мэдрэлийн сүлжээнд чухал үүрэг гүйцэтгэдэг. Керас-д идэвхжүүлэх функцийг загварын давхарга бүрт зааж өгч, сүлжээний архитектурыг уян хатан болгох боломжийг олгодог.
Жишээн дээрх Keras загварын давхаргад ашигласан идэвхжүүлэх функцууд нь дараах байдалтай байна.
1. ReLU (Rectified Linear Unit): ReLU нь гүнзгий суралцахад хамгийн түгээмэл хэрэглэгддэг идэвхжүүлэх функцүүдийн нэг юм. Энэ нь f(x) = max(0, x) гэж тодорхойлогддог бөгөөд x нь функцийн оролт юм. ReLU нь бүх сөрөг утгыг тэг болгож, эерэг утгыг өөрчлөхгүй байлгадаг. Энэхүү идэвхжүүлэх функц нь тооцооллын хувьд үр дүнтэй бөгөөд алга болох градиентийн асуудлыг багасгахад тусалдаг.
2. Softmax: Softmax нь олон ангиллын ангиллын бодлогын сүүлийн давхаргад ихэвчлэн ашиглагддаг. Энэ нь өмнөх давхаргын гаралтыг ангиудын магадлалын тархалт болгон хувиргадаг. Softmax нь f(x) = exp(x[i])/sum(exp(x[j])) гэж тодорхойлогддог бөгөөд энд x[i] нь i ангиллын функцийн оролт бөгөөд нийлбэрийг бүгдийг нь авна. ангиуд. Softmax функцийн гаралтын утгууд нийлбэр 1 болж, магадлалын тайлбарт тохиромжтой.
3. Sigmoid: Sigmoid нь хоёртын ангиллын бодлогод ашиглагддаг түгээмэл идэвхжүүлэх функц юм. Энэ нь оролтыг эерэг ангилалд хамаарах магадлалыг илэрхийлдэг 0-ээс 1-ийн хоорондох утгад буулгана. Сигмоид нь f(x) = 1/(1 + exp(-x)) гэж тодорхойлогддог. Энэ нь жигд бөгөөд ялгах боломжтой тул градиент дээр суурилсан оновчлолын алгоритмд тохиромжтой.
4. Танх (Гипербол тангенс): Tanh нь сигмоид функцтэй төстэй боловч оролтыг -1-ээс 1-ийн хоорондох утгад буулгадаг. Энэ нь f(x) = (exp(x) – exp(-x))/гэж тодорхойлогддог. (exp(x) + exp(-x)). Tanh нь шугаман бус байдлыг нэвтрүүлж, нарийн төвөгтэй хэв маягийг олж авахад тусалдаг тул мэдрэлийн сүлжээний далд давхаргад ихэвчлэн ашиглагддаг.
Эдгээр идэвхжүүлэх функцууд нь янз бүрийн мэдрэлийн сүлжээний архитектурт өргөн хэрэглэгддэг бөгөөд машин сургалтын янз бүрийн даалгаварт үр дүнтэй болох нь батлагдсан. Асуудал болон өгөгдлийн шинж чанарт үндэслэн тохирох идэвхжүүлэх функцийг сонгох нь чухал юм.
Эдгээр идэвхжүүлэх функцүүдийн хэрэглээг харуулахын тулд дүрс ангилах мэдрэлийн сүлжээний энгийн жишээг авч үзье. Оролтын давхарга нь зургийн пикселийн утгыг хүлээн авдаг бөгөөд дараагийн давхаргууд нь эвдрэлийн үйлдлүүдийг хийж, дараа нь ReLU идэвхжүүлснээр функцуудыг задалдаг. Эцсийн давхарга нь янз бүрийн ангилалд хамаарах зургийн магадлалыг бий болгохын тулд softmax идэвхжүүлэлтийг ашигладаг.
Өгөгдсөн жишээн дээрх Keras загварын давхаргад ашигласан идэвхжүүлэх функцууд нь ReLU, softmax, sigmoid, tanh юм. Эдгээр функц бүр нь тодорхой зорилготой бөгөөд асуудлын шаардлагад үндэслэн сонгогддог. Идэвхжүүлэх функцүүдийн үүргийг ойлгох нь үр дүнтэй мэдрэлийн сүлжээний архитектурыг зохион бүтээхэд чухал ач холбогдолтой.
Сүүлийн үеийн бусад асуулт, хариулт Машин сургалтанд ахиц дэвшил гаргах:
- Цөм нь өгөгдөлтэй, эх хувь нь хувийнх байх үед сэрээтэй нь олон нийтэд нээлттэй байж болох уу, хэрэв тийм бол нууцлалын зөрчил биш үү?
- Машин сургалтын явцад том өгөгдлийн багцтай ажиллахад ямар хязгаарлалт байдаг вэ?
- Машины сургалт нь харилцан ярианы тусламж үзүүлж чадах уу?
- TensorFlow тоглоомын талбай гэж юу вэ?
- Хүсэл эрмэлзэлтэй горим нь TensorFlow-ийн тархсан тооцооллын функцийг саатуулдаг уу?
- Google үүлэн шийдлүүдийг том өгөгдөлтэй ML загварыг илүү үр дүнтэй сургах үүднээс тооцоололыг хадгалах сангаас салгахад ашиглаж болох уу?
- Google Cloud Machine Learning Engine (CMLE) нь загварын сургалт дууссаны дараа нөөцийг автоматаар олж авах, тохируулах, мөн нөөцийг зогсоохыг санал болгодог уу?
- Машин сургалтын загваруудыг дур зоргоороо том өгөгдлийн багц дээр ямар ч саадгүй сургах боломжтой юу?
- CMLE-г ашиглах үед хувилбар үүсгэхэд экспортлогдсон загварын эх сурвалжийг зааж өгөх шаардлагатай юу?
- CMLE нь Google Cloud хадгалах сангийн датаг уншиж, дүгнэлт гаргахдаа тусгайлан бэлтгэгдсэн загварыг ашиглаж чадах уу?
Бусад асуулт, хариултыг "Machine Learning-д ахиц дэвшил" хэсгээс үзнэ үү