Дэмжлэгийн вектор машинууд (SVMs) нь машин сургалтын чиглэлээр ангилах, регрессийн даалгавар хийхэд ашигладаг хяналттай сургалтын загваруудын анги юм. Тэдгээр нь өндөр хэмжээст өгөгдөлтэй ажиллах чадвар, хэмжээсийн тоо нь дээжийн тооноос давсан хувилбарт үр нөлөөгөөрөө онцгойлон үнэлэгддэг. SVM нь өгөгдлийн цэгүүдийг өөр өөр ангилалд хамгийн сайн тусгаарладаг гипер хавтгайг олох үзэл баримтлалд суурилдаг.
SVM-ийн гол цөм нь хоёр хэмжээст орон зайд тус бүр нь өөр өөр ангиудыг төлөөлдөг онгоцыг хоёр хэсэгт хуваах шугам гэж үзэж болох гипер хавтгайн санаа юм. Хоёр хэмжээстээс илүү хэмжээгээр энэ гиперплан нь орон зайгаас нэг хэмжээст багатай хавтгай аффин дэд орон зай болж хувирдаг. SVM-ийн зорилго нь хоёр ангийн хамгийн ойр цэгүүдийн (мөн дэмжлэгийн вектор гэгддэг) хоорондын зайг хамгийн их байлгах гипер хавтгайг олох явдал юм. Маржин нь аль нэг ангиас хамгийн ойрын өгөгдлийн цэг болон гипер хавтгай хоорондын зай гэж тодорхойлогддог.
Энэхүү оновчтой гиперплатыг олох үйл явц нь хязгаарлагдмал оновчлолын асуудлыг шийдэх явдал юм. SVM алгоритм нь ангиллын алдааг багасгахын зэрэгцээ ахиу хэмжээг нэмэгдүүлэхийг эрмэлздэг. Энэ нь Лагранж үржүүлэгч болон квадрат програмчлалын техникийг ашиглах замаар хийгддэг. Оновчлолын асуудлыг дараах байдлаар илэрхийлж болно.
Багасгах:
Үүнд: бүгдэд нь
.
Энд, нь гипер хавтгайд перпендикуляр жинтэй вектор,
оролтын онцлог векторууд,
нь ангийн шошго, мөн
хазайсан нэр томъёо юм. Хязгаарлалтууд нь өгөгдлийн цэг бүрийг хамгийн багадаа 1-ийн зөрүүтэй зөв ангилахыг баталгаажуулдаг.
Олон практик хэрэглээнд өгөгдлийг шугаман байдлаар салгах боломжгүй байдаг. Үүнийг шийдвэрлэхийн тулд SVM нь цөмийн трик гэгддэг техникийг ашигладаг. Цөмүүд нь алгоритмыг тухайн орон зай дахь өгөгдлийн координатыг тодорхой тооцоолохгүйгээр өндөр хэмжээст орон зайд ажиллах боломжийг олгодог. Энэ нь цөмийн функцийг тодорхойлох замаар хийгддэг. , энэ нь хувиргасан функцийн орон зай дахь өгөгдлийн цэгүүдийн цэгийн үржвэрийг тооцоолдог. Цөмийн нийтлэг функцүүдэд олон гишүүнт цөм, радиаль суурь функц (RBF) цөм, сигмоид цөм орно.
Цөмийн сонголт нь SVM-ийн гүйцэтгэлд ихээхэн нөлөөлдөг. Шугаман цөм нь шугаман салгах боломжтой өгөгдөлд тохиромжтой байдаг бол RBF цөм нь шугаман бус хил хязгаарыг зохицуулах чадвартай тул илүү төвөгтэй өгөгдлийн багцад ихэвчлэн ашиглагддаг. Олон гишүүнт цөм нь олон гишүүнтийн зэргээс хамааран шийдвэрийн хил хязгаарыг илүү нарийн төвөгтэй хэлбэрт оруулах боломжийг олгож уян хатан байдлыг нэмэгдүүлдэг.
SVM-ийн хэрэглээг харуулахын тулд имэйлийг "спам" эсвэл "спам биш" гэж ангилах зорилготой хоёртын ангиллын даалгаврыг авч үзье. Имэйл бүрийг онцлог вектороор төлөөлдөг бөгөөд үүнд тодорхой түлхүүр үгсийн давтамж, хавсралт байгаа эсэх, илгээгчийн имэйл хаяг зэрэг шинж чанарууд багтаж болно. SVM-ийг имэйл бүрийг спам эсвэл спам биш гэж тэмдэглэсэн хаяглагдсан өгөгдлийн багц дээр сургаж болно. Дараа нь SVM нь функцын орон зайд хоёр ангийг тусгаарлах оновчтой гиперплатыг олох болно. Сургалтанд хамрагдсаны дараа SVM нь шинэ имэйлийг гиперплангийн аль талд унахыг тодорхойлох замаар ангилж болно.
SVM-ийн давуу талуудын нэг нь өндөр хэмжээст орон зайд хэт их тохирох чадвар юм. Энэ нь зохицуулалтын параметртэй холбоотой юм. , энэ нь ахиу хэмжээг нэмэгдүүлэх, ангиллын алдааг багасгах хоорондын солилцоог хянадаг. Илүү жижиг
зарим буруу ангилагдсан өгөгдлийн цэгүүдийн зардлаар илүү их маржийг урамшуулдаг бол илүү их
Сургалтын бүх жишээг илүү бага үнээр зөв ангилах зорилготой.
Тэдний давуу талыг үл харгалзан SVM нь зарим хязгаарлалттай байдаг. Квадрат програмчлалын асуудлыг шийдвэрлэх хэрэгцээ шаардлагаас шалтгаалан тэдгээр нь тооцооллын хувьд эрчимтэй байж болно, ялангуяа том өгөгдлийн багцын хувьд. Нэмж дурдахад цөм болон гиперпараметрийн сонголт нь гүйцэтгэлд ихээхэн нөлөөлж болох тул нарийн тааруулж баталгаажуулах шаардлагатай. Цаашилбал, SVM нь үндсэндээ хоёртын ангиллын даалгавруудад зориулагдсан боловч олон ангиллын асуудлыг шийдвэрлэх боломжийг олгодог нэг ба нэг эсрэг бүх арга гэх мэт өргөтгөлүүд байдаг.
Практикт SVM нь текстийн ангилал, дүрс таних, биоинформатик зэрэг төрөл бүрийн салбарт өргөн хэрэглэгддэг. Тэдний нарийн төвөгтэй, өндөр хэмжээст өгөгдөлтэй ажиллах чадвар нь тэднийг машин сургалтын дадлагажигч нарын арсенал дахь үнэ цэнэтэй хэрэгсэл болгодог.
Дүгнэж хэлэхэд, Support Vector Machines нь ангилал болон регрессийн даалгаврын хүчирхэг, олон талын арга юм. Эдгээр нь өндөр хэмжээст өгөгдөл болон шийдвэрийн нарийн хил хязгаартай холбоотой хувилбаруудад ялангуяа ашигтай байдаг. Цөмийн заль мэхийг ашигласнаар SVM нь өгөгдөл дэх шугаман бус харилцааг үр дүнтэй зохицуулж чадна. Гэсэн хэдий ч тэдгээрийн гүйцэтгэл нь цөм болон гиперпараметрийн сонголтоос ихээхэн хамаардаг тул нарийн тохируулга, баталгаажуулалтыг шаарддаг. Эдгээр сорилтуудыг үл харгалзан SVM нь бат бөх, үр дүнтэй байдаг тул машин сургалтын олон програмуудад түгээмэл сонголт хэвээр байна.
Сүүлийн үеийн бусад асуулт, хариулт EITC/AI/GCML Google Cloud Machine Learning:
- Та шугаман регресс, шийдвэрийн мод гэх мэт олон төрлийн алгоритмуудыг дурдсан. Эдгээр нь бүгд мэдрэлийн сүлжээ мөн үү?
- Загварын гүйцэтгэлийн үнэлгээний хэмжүүрүүд юу вэ?
- Шугаман регресс гэж юу вэ?
- Төрөл бүрийн ML загваруудыг нэгтгэж, мастер AI бүтээх боломжтой юу?
- Машины сургалтанд ашигладаг хамгийн түгээмэл алгоритмуудын зарим нь юу вэ?
- Загварын хувилбарыг хэрхэн бүтээх вэ?
- ML-ийн 7 алхамыг жишээ контекст хэрхэн хэрэгжүүлэх вэ?
- Барилга барих зөвшөөрлийн өгөгдөлд машин сургалтыг хэрхэн ашиглах вэ?
- AutoML Хүснэгтүүд яагаад зогссон ба тэдгээрийг юу амжилттай болгосон бэ?
- Тоглогчдын зурсан doodle-ийг хиймэл оюун ухааны хүрээнд тайлбарлах нь юу вэ?
EITC/AI/GCML Google Cloud Machine Learning-ээс бусад асуулт, хариултуудыг харна уу