PyTorch-ийн nn.Conv2d функцийн эхний параметр болох оролтын сувгийн тоо нь оролтын зураг дээрх функцын газрын зураг эсвэл сувгийн тоог илэрхийлдэг. Энэ нь зургийн "өнгө" утгуудын тоотой шууд хамааралгүй, харин сүлжээнээс суралцах боломжтой ялгаатай шинж чанарууд эсвэл хэв маягийн тоог илэрхийлдэг.
Convolutional Neural Network (CNN)-д давхарга бүр функцүүдийг задлахын тулд оролтын зурагтай нэгтгэсэн олон шүүлтүүр эсвэл цөмүүдээс бүрддэг. Эдгээр шүүлтүүрүүд нь оролтын өгөгдөлд байгаа өөр өөр хэв маяг, онцлогуудыг судлах үүрэгтэй. Оролтын сувгийн тоо нь давхаргад ашигласан шүүлтүүрийн тоог тодорхойлдог.
Энэ ойлголтыг ойлгохын тулд жишээг авч үзье. Бидэнд 32×32 хэмжээтэй RGB зураг байна гэж бодъё. Зурган дээрх пиксел бүр улаан, ногоон, цэнхэр гэсэн гурван өнгөт сувагтай. Тиймээс оролтын зураг нь гурван оролтын сувагтай. Хэрэв бид энэ зургийг 16 оролтын суваг бүхий эвдрэлийн давхаргаар дамжуулвал давхарга нь 16 шүүлтүүртэй байх бөгөөд тэдгээр нь тус бүр нь оролтын зурагтай нийлж өөр өөр функцуудыг гаргаж авна гэсэн үг юм.
Олон тооны оролтын сувагтай байхын зорилго нь оролтын өгөгдлийн өөр өөр талууд эсвэл шинж чанарыг олж авах явдал юм. Зургийн хувьд суваг бүрийг ирмэг, бүтэц, өнгө гэх мэт тодорхой хэв маягийг агуулсан өөр өөр газрын зураг гэж харж болно. Олон тооны оролтын сувагтай болсноор сүлжээ нь оролтын өгөгдлийн илүү төвөгтэй дүрслэлийг сурч чадна.
Оролтын сувгуудын тоо нь конволюцийн давхарга дахь параметрийн тоонд мөн нөлөөлдөг. Давхарга дахь шүүлтүүр бүр нь сургалтын явцад сурсан жингийн жижиг матриц юм. Давхаргын параметрийн тоог шүүлтүүрүүдийн хэмжээ, оролт, гаралтын сувгийн тоогоор тодорхойлно. Оролтын сувгийн тоог нэмэгдүүлэх нь параметрийн тоог нэмэгдүүлэх бөгөөд энэ нь сүлжээг илүү илэрхийлэх боломжтой боловч тооцоолоход илүү үнэтэй болгодог.
nn.Conv2d функц дэх оролтын сувгийн тоо нь оролтын зураг дээрх функцын газрын зураг эсвэл сувгийн тоог илэрхийлнэ. Энэ нь эргэлтийн давхаргад хэрэглэгдэх шүүлтүүрийн тоог тодорхойлж, сүлжээний оролтын өгөгдлийн цогц дүрслэлийг сурах чадварт нөлөөлдөг.
Сүүлийн үеийн бусад асуулт, хариулт Конволюцийн мэдрэлийн сүлжээ (CNN):
- Хамгийн том эргэлтийн мэдрэлийн сүлжээ юу вэ?
- Гаралтын сувгууд юу вэ?
- Сургалтын үеэр CNN-ийн гүйцэтгэлийг сайжруулах нийтлэг аргууд юу вэ?
- CNN-ийг сургахад багцын хэмжээ ямар ач холбогдолтой вэ? Энэ нь сургалтын үйл явцад хэрхэн нөлөөлдөг вэ?
- Өгөгдлийг сургалт, баталгаажуулалтын багц болгон хуваах нь яагаад чухал вэ? Баталгаажуулахад ихэвчлэн хэр их өгөгдөл хуваарилагддаг вэ?
- Бид CNN-д зориулсан сургалтын мэдээллийг хэрхэн бэлтгэх вэ? Холбогдох алхмуудыг тайлбарлана уу.
- Конволюцийн мэдрэлийн сүлжээг (CNN) сургахад оновчтой болгох, алдагдлын функцийн зорилго юу вэ?
- CNN-ийг сургах явцад оролтын өгөгдлийн хэлбэрийг янз бүрийн үе шатанд хянах нь яагаад чухал вэ?
- Зурагнаас бусад өгөгдөлд эвхэгддэг давхаргыг ашиглаж болох уу? Жишээ үзүүлнэ үү.
- CNN-ийн шугаман давхаргад тохирох хэмжээг хэрхэн тодорхойлох вэ?
Convolution neural network (CNN) дээрх бусад асуулт, хариултыг харах