Хамгийн том эргэлтийн мэдрэлийн сүлжээ юу вэ?

by Тамас Сабо / Ням гараг, 10 оны 2024-р сарын XNUMX. / онд хэвлэгдсэн Хиймэл оюун, EITC/AI/DLPP Python ба PyTorch програмтай гүнзгий суралцах, Конволюцийн мэдрэлийн сүлжээ (CNN), Питорчтой Конвнет руу нэвтрэх

Гүнзгий сургалтын талбар, ялангуяа конволюцийн мэдрэлийн сүлжээ (CNN) нь сүүлийн жилүүдэд гайхалтай ахиц дэвшилд хүрч, том, нарийн төвөгтэй мэдрэлийн сүлжээний архитектурыг хөгжүүлэхэд хүргэсэн. Эдгээр сүлжээнүүд нь зураг таних, байгалийн хэлний боловсруулалт болон бусад домэйн зэрэгт бэрхшээлтэй ажлуудыг шийдвэрлэхэд зориулагдсан. Үүсгэсэн хамгийн том эвдэрсэн мэдрэлийн сүлжээний талаар ярихдаа давхаргын тоо, параметр, тооцооллын шаардлага, сүлжээг зохион бүтээсэн тусгай хэрэглээ гэх мэт янз бүрийн асуудлыг авч үзэх нь чухал юм.

Томоохон мэдрэлийн сүлжээний хамгийн тод жишээнүүдийн нэг бол VGG-16 загвар юм. Оксфордын их сургуулийн Visual Geometry группын бүтээсэн VGG-16 сүлжээ нь 16 жингийн давхаргаас бүрдэх ба үүнд 13 эргэлтийн давхарга, 3 бүрэн холбогдсон давхарга багтдаг. Энэ сүлжээ нь зураг таних даалгаврууд дахь энгийн, үр дүнтэй байдгаараа алдартай болсон. VGG-16 загвар нь ойролцоогоор 138 сая параметртэй бөгөөд энэ нь түүнийг хөгжүүлэх үеийн хамгийн том мэдрэлийн сүлжээнүүдийн нэг болсон юм.

Өөр нэг чухал эргэлтийн мэдрэлийн сүлжээ бол ResNet (Үлдэгдэл сүлжээ) архитектур юм. ResNet-ийг Microsoft Research компани 2015 онд нэвтрүүлсэн бөгөөд зарим хувилбар нь 100 гаруй давхаргатай, гүн бүтэцээрээ алдартай. ResNet-ийн гол шинэлэг зүйл бол алга болж буй градиент асуудлыг шийдвэрлэх замаар маш гүн сүлжээг сургах боломжийг олгодог үлдэгдэл блокуудыг ашиглах явдал юм. Жишээлбэл, ResNet-152 загвар нь 152 давхаргаас бүрдэх ба 60 сая орчим параметртэй бөгөөд гүн мэдрэлийн сүлжээг өргөжүүлэх чадварыг харуулдаг.

Байгалийн хэлний боловсруулалтын хүрээнд BERT (Transformers-аас хоёр чиглэлтэй кодлогчийн төлөөлөл) загвар нь мэдэгдэхүйц дэвшил болж байна. BERT нь уламжлалт CNN биш ч NLP-ийн салбарт хувьсгал хийсэн трансформаторт суурилсан загвар юм. Загварын жижиг хувилбар болох BERT-base нь 110 сая параметрийг агуулдаг бол BERT-large нь 340 сая параметртэй. BERT загваруудын том хэмжээ нь нарийн төвөгтэй хэл шинжлэлийн хэв маягийг барьж, NLP-ийн янз бүрийн даалгавруудыг хамгийн сүүлийн үеийн гүйцэтгэлд хүргэх боломжийг олгодог.

Нэмж дурдахад OpenAI-ийн боловсруулсан GPT-3 (Generative Pre-trained Transformer 3) загвар нь гүнзгий суралцах өөр нэг чухал үе шат юм. GPT-3 нь 175 тэрбум параметр бүхий хэлний загвар бөгөөд өнөөг хүртэл бүтээгдсэн хамгийн том мэдрэлийн сүлжээнүүдийн нэг юм. Энэхүү асар том хэмжээ нь GPT-3-д хүнтэй төстэй текст үүсгэх, хэлтэй холбоотой өргөн хүрээний даалгавруудыг гүйцэтгэх боломжийг олгож, том хэмжээний гүнзгий суралцах загваруудын хүчийг харуулдаг.

Судлаачид хүнд хэцүү даалгаврын гүйцэтгэлийг сайжруулах шинэ архитектур, арга зүйг судалж байгаа тул эргэлтийн мэдрэлийн сүлжээний хэмжээ, нарийн төвөгтэй байдал нэмэгдсээр байгааг анхаарах нь чухал юм. Томоохон сүлжээнүүд нь сургалт, дүгнэлт гаргахад ихээхэн хэмжээний тооцооллын нөөц шаарддаг ч компьютерийн хараа, байгалийн хэлний боловсруулалт, бататгах сургалт зэрэг төрөл бүрийн салбарт мэдэгдэхүйц ахиц дэвшлийг харуулсан.

Томоохон эргэлтийн мэдрэлийн сүлжээг хөгжүүлэх нь гүнзгий суралцах чиглэлээр чухал чиг хандлагыг илэрхийлж, нарийн төвөгтэй ажлуудад илүү хүчирхэг, боловсронгуй загваруудыг бий болгох боломжийг олгодог. VGG-16, ResNet, BERT, GPT-3 зэрэг загварууд нь янз бүрийн домэйн дэх янз бүрийн сорилтуудыг шийдвэрлэхэд мэдрэлийн сүлжээний өргөтгөх чадвар, үр нөлөөг харуулдаг.

Сүүлийн үеийн бусад асуулт, хариулт Конволюцийн мэдрэлийн сүлжээ (CNN):

Convolution neural network (CNN) дээрх бусад асуулт, хариултыг харах

Илүү олон асуулт, хариулт:

Талбар: Хиймэл оюун
хөтөлбөр: EITC/AI/DLPP Python ба PyTorch програмтай гүнзгий суралцах (гэрчилгээжүүлэх хөтөлбөрт очно уу)
Хичээл: Конволюцийн мэдрэлийн сүлжээ (CNN) (холбогдох хичээл рүүгээ яв)
сэдэв: Питорчтой Конвнет руу нэвтрэх (холбогдох сэдэв рүү оч)

Доор тэмдэглэгдсэн: Хиймэл оюун, БЕРТ, CNN, GPT-3, ResNet, VGG-16

EITCA академи

Хамгийн том эргэлтийн мэдрэлийн сүлжээ юу вэ?

Сүүлийн үеийн бусад асуулт, хариулт Конволюцийн мэдрэлийн сүлжээ (CNN):

Илүү олон асуулт, хариулт:

EITCA академи нь Европын мэдээллийн технологийн гэрчилгээжүүлэх тогтолцооны нэг хэсэг юм

EITCA Академийн EITCI DSJC татаасыг 80% дэмжих эрхтэй

EITCA академи

НЭГДСЭН НЭГДСЭН МЭДЭЭЛЛИЙН НЭГДСЭН НЭГДСЭН ХЭРЭГЛЭЭГЭЭРЭЙ

Таны мэдээлэл үгээ мартсан уу?

Акаунт үүсгэх

Хамгийн том эргэлтийн мэдрэлийн сүлжээ юу вэ?

Сүүлийн үеийн бусад асуулт, хариулт Конволюцийн мэдрэлийн сүлжээ (CNN):

Илүү олон асуулт, хариулт:

EITCA Академийн EITCI DSJC татаасыг 80% дэмжих эрхтэй