Мэдрэлийн сүлжээний загварт идэвхжүүлэх функцууд ямар үүрэг гүйцэтгэдэг вэ?

by EITCA академи / Мягмар гариг, 08 August 2023 / онд хэвлэгдсэн Хиймэл оюун, TensorFlow ашиглан EITC/AI/DLTF гүнзгийрүүлэн судлах, TensorFlow, Мэдрэлийн сүлжээний загвар, Шалгалтын тойм

Идэвхжүүлэх функцууд нь сүлжээнд шугаман бус байдлыг нэвтрүүлж, өгөгдөл дэх нарийн төвөгтэй харилцааг сурч, загварчлах боломжийг олгодог мэдрэлийн сүлжээний загварт чухал үүрэг гүйцэтгэдэг. Энэ хариултанд бид гүнзгий сургалтын загварт идэвхжүүлэх функцүүдийн ач холбогдол, тэдгээрийн шинж чанарыг судалж, сүлжээний гүйцэтгэлд үзүүлэх нөлөөллийг харуулах жишээнүүдийг өгөх болно.

Идэвхжүүлэх функц нь нейроны оролтын жигнэсэн нийлбэрийг авч, гаралтын дохио үүсгэдэг математик функц юм. Энэ гаралтын дохио нь мэдрэлийн эсийг идэвхжүүлэх эсэх, ямар хэмжээгээр болохыг тодорхойлдог. Идэвхжүүлэх функцгүй бол мэдрэлийн сүлжээ нь өгөгдлийн нарийн төвөгтэй хэв маяг, шугаман бус харилцааг сурах чадваргүй шугаман регрессийн загвар байх болно.

Идэвхжүүлэх функцүүдийн үндсэн зорилгын нэг нь шугаман бус байдлыг сүлжээнд нэвтрүүлэх явдал юм. Нэмэх, үржүүлэх зэрэг шугаман үйлдлүүд нь зөвхөн шугаман харилцааг загварчилж чаддаг. Гэсэн хэдий ч бодит ертөнцийн олон асуудлууд шугаман бус хэв маягийг харуулдаг бөгөөд идэвхжүүлэх функцууд нь сүлжээнд эдгээр шугаман бус харилцааг барьж, төлөөлөх боломжийг олгодог. Идэвхжүүлэх функцууд нь оролтын өгөгдөлд шугаман бус хувиргалтыг хэрэглэснээр сүлжээнд оролт ба гаралтын хоорондох нарийн төвөгтэй зураглалыг сурах боломжийг олгодог.

Идэвхжүүлэх функцүүдийн өөр нэг чухал шинж чанар нь нейрон бүрийн гаралтыг хэвийн болгох чадвар юм. Нормчилол нь мэдрэлийн эсийн гаралт нь тодорхой хязгаарт, ихэвчлэн 0-1 эсвэл -1 ба 1-ийн хооронд байхыг баталгаажуулдаг. Энэхүү хэвийн байдал нь сургалтын үйл явцыг тогтворжуулахад тусалдаг ба сүлжээ гүнзгийрэх тусам мэдрэлийн эсийн гаралт дэлбэрч, алга болохоос сэргийлдэг. Энэ зорилгоор sigmoid, tanh, softmax зэрэг идэвхжүүлэх функцуудыг ихэвчлэн ашигладаг.

Идэвхжүүлэлтийн янз бүрийн функцууд нь ялгаатай шинж чанартай байдаг тул өөр өөр хувилбаруудад тохиромжтой болгодог. Зарим түгээмэл хэрэглэгддэг идэвхжүүлэх функцууд нь:

1. Сигмоид: Сигмоид функц нь оролтыг 0-ээс 1-ийн хоорондох утгад буулгадаг. Энэ нь оролтыг хоёр ангиллын аль нэгэнд ангилах зорилготой хоёртын ангиллын бодлогод өргөн хэрэглэгддэг. Гэсэн хэдий ч sigmoid функцууд нь алга болох градиентийн асуудалтай тулгардаг бөгөөд энэ нь гүнзгий сүлжээн дэх сургалтын үйл явцад саад учруулж болзошгүй юм.

2. Танх: Гипербол тангенсийн функц буюу tanh нь оролтыг -1-ээс 1-ийн хоорондох утга руу буулгадаг. Энэ нь тэг төвтэй учир сигмоид функцээс илүү сайжирч, сүлжээнд суралцахад хялбар болгодог. Tanh нь ихэвчлэн давтагдах мэдрэлийн сүлжээ (RNN) болон convolutional neural network (CNN) -д ашиглагддаг.

3. ReLU: Шулуутгагдсан шугаман нэгж (ReLU) нь сөрөг оролтыг тэг болгож, эерэг оролтыг өөрчлөхгүй үлдээдэг түгээмэл идэвхжүүлэх функц юм. ReLU нь энгийн бөгөөд алга болох градиентийн асуудлыг багасгах чадвартай тул өргөн хэрэглэгддэг. Гэсэн хэдий ч ReLU нь мэдрэлийн эсүүд идэвхгүй болж, суралцахаа больдог "үхэж буй ReLU" асуудалд нэрвэгддэг.

4. Leaky ReLU: Leaky ReLU нь сөрөг оролтын жижиг налууг оруулснаар үхэж буй ReLU асуудлыг шийддэг. Энэ нь сөрөг оролттой байсан ч градиент урсах боломжийг олгож, мэдрэлийн эсүүд идэвхгүй болохоос сэргийлдэг. Leaky ReLU нь сүүлийн жилүүдэд алдартай болсон бөгөөд ихэвчлэн ReLU-г орлуулах болгон ашигладаг.

5. Softmax: softmax функцийг олон ангиллын ангиллын бодлогод ихэвчлэн ашигладаг. Энэ нь мэдрэлийн сүлжээний гаралтыг магадлалын тархалт болгон хувиргадаг бөгөөд гаралт бүр нь тодорхой ангилалд хамаарах оролтын магадлалыг илэрхийлдэг. Softmax нь бүх ангиудын магадлалын нийлбэр 1 хүртэл нэмэгдэхийг баталгаажуулдаг.

Идэвхжүүлэх функцууд нь мэдрэлийн сүлжээний загваруудын зайлшгүй бүрэлдэхүүн хэсэг юм. Тэд шугаман бус байдлыг нэвтрүүлж, сүлжээг өгөгдлийн нарийн төвөгтэй хэв маяг, харилцааг сурах боломжийг олгодог. Идэвхжүүлэх функцууд нь мэдрэлийн эсийн гаралтыг хэвийн болгож, сүлжээг дэлбэрч, градиент алга болох зэрэг асуудлуудаас сэргийлдэг. Идэвхжүүлэх янз бүрийн функцууд нь өөр өөр шинж чанартай бөгөөд өөр өөр хувилбаруудад тохиромжтой байдаг бөгөөд тэдгээрийн сонголт нь тулгарч буй асуудлын мөн чанараас хамаарна.

Сүүлийн үеийн бусад асуулт, хариулт TensorFlow ашиглан EITC/AI/DLTF гүнзгийрүүлэн судлах:

TensorFlow ашиглан EITC/AI/DLTF Deep Learning-д илүү олон асуулт, хариултыг үзээрэй

Илүү олон асуулт, хариулт:

Талбар: Хиймэл оюун
хөтөлбөр: TensorFlow ашиглан EITC/AI/DLTF гүнзгийрүүлэн судлах (гэрчилгээжүүлэх хөтөлбөрт очно уу)
Хичээл: TensorFlow (холбогдох хичээл рүүгээ яв)
сэдэв: Мэдрэлийн сүлжээний загвар (холбогдох сэдэв рүү оч)
Шалгалтын тойм

Доор тэмдэглэгдсэн: Идэвхжүүлэх функцууд, Хиймэл оюун, Leaky ReLU, Шугаман бус байдал, Хэвийн байдал, ReLU, Сигмоид, Softmax, Танх

EITCA академи

Мэдрэлийн сүлжээний загварт идэвхжүүлэх функцууд ямар үүрэг гүйцэтгэдэг вэ?

Сүүлийн үеийн бусад асуулт, хариулт TensorFlow ашиглан EITC/AI/DLTF гүнзгийрүүлэн судлах:

Илүү олон асуулт, хариулт:

EITCA академи нь Европын мэдээллийн технологийн гэрчилгээжүүлэх тогтолцооны нэг хэсэг юм

EITCA Академийн EITCI DSJC татаасыг 80% дэмжих эрхтэй

EITCA академи

НЭГДСЭН НЭГДСЭН МЭДЭЭЛЛИЙН НЭГДСЭН НЭГДСЭН ХЭРЭГЛЭЭГЭЭРЭЙ

Таны мэдээлэл үгээ мартсан уу?

Акаунт үүсгэх

Мэдрэлийн сүлжээний загварт идэвхжүүлэх функцууд ямар үүрэг гүйцэтгэдэг вэ?

Сүүлийн үеийн бусад асуулт, хариулт TensorFlow ашиглан EITC/AI/DLTF гүнзгийрүүлэн судлах:

Илүү олон асуулт, хариулт:

EITCA Академийн EITCI DSJC татаасыг 80% дэмжих эрхтэй