Pandas номын санг ашиглан машин сургалтын загварыг сургахад манай өгөгдлийг бэлтгэхэд ямар алхамууд ордог вэ?

by EITCA академи / 02 оны 2023-р сарын XNUMX, Лхагва гараг / онд хэвлэгдсэн Хиймэл оюун, EITC/AI/GCML Google Cloud Machine Learning, Машин сургалтанд ахиц дэвшил гаргах, AutoML Vision - 1-р хэсэг, Шалгалтын тойм

Машин сургалтын салбарт өгөгдөл бэлтгэх нь загварыг амжилттай сургахад чухал үүрэг гүйцэтгэдэг. Pandas номын санг ашиглахдаа машин сургалтын загварыг сургах өгөгдлийг бэлтгэхэд хэд хэдэн үе шат байдаг. Эдгээр алхмуудад өгөгдөл ачаалах, өгөгдөл цэвэрлэх, өгөгдөл хувиргах, өгөгдөл хуваах зэрэг орно.

Өгөгдлийг бэлтгэх эхний алхам бол Pandas DataFrame-д ачаалах явдал юм. Үүнийг файлаас өгөгдлийг унших эсвэл мэдээллийн сангаас асуух замаар хийж болно. Pandas нь энэ үйл явцыг хөнгөвчлөхийн тулд `read_csv()`, `read_excel()`, `read_sql()` гэх мэт төрөл бүрийн функцуудыг хангадаг. Өгөгдөл ачаалагдсаны дараа тэдгээрийг хүснэгт хэлбэрээр хадгалдаг бөгөөд үүнийг удирдах, дүн шинжилгээ хийхэд хялбар болгодог.

Дараагийн алхам бол дутуу утгыг зохицуулах, давхардлыг арилгах, хэт давсан үзүүлэлттэй ажиллах зэрэг өгөгдлийг цэвэрлэх явдал юм. Алга болсон утгыг дундаж тооцоолол эсвэл урагш/буцах зэрэг аргуудыг ашиглан нөхөж болно. `duplicated()` болон `drop_duplicates()` функцуудыг ашиглан давхардлыг тодорхойлж устгаж болно. З-оноо эсвэл дөрөвний хоорондын муж (IQR) зэрэг статистикийн аргуудыг ашиглан хэт давсан үзүүлэлтүүдийг илрүүлж болох бөгөөд тэдгээрийг арилгах эсвэл илүү тохиромжтой утга болгон хувиргах замаар зохицуулж болно.

Өгөгдлийг цэвэрлэсний дараа дараагийн алхам бол өгөгдлийг хувиргах явдал юм. Үүнд категорийн хувьсагчдыг тоон дүрслэл болгон хувиргах, тоон хувьсагчдыг масштаблах, шинэ боломжуудыг бий болгох зэрэг орно. Категорийн хувьсагчдыг нэг халуун кодчилол эсвэл шошгоны кодчилол гэх мэт аргуудыг ашиглан хувиргаж болно. Тоон хувьсагчдыг стандартчилал эсвэл нормчилол гэх мэт арга техникийг ашиглан хэмжиж болно. Одоо байгаа функцуудыг нэгтгэх эсвэл математикийн үйлдлүүдийг ашиглах замаар шинэ боломжуудыг үүсгэж болно.

Эцэст нь, өгөгдлийг сургалт, туршилтын багц болгон хуваах шаардлагатай. Энэ нь үл үзэгдэх өгөгдөл дээр бэлтгэгдсэн загварын гүйцэтгэлийг үнэлэхийн тулд хийгддэг. Pandas дахь `train_test_split()` функцийг ашиглан өгөгдлийг санамсаргүй байдлаар заасан харьцаанд үндэслэн сургалт, туршилтын багц болгон хуваах боломжтой. Зорилтот хувьсагчийн тархалтыг хадгалахын тулд өгөгдлийг хуваах нь чухал юм.

Дүгнэж хэлэхэд, Pandas номын санг ашиглан машин сургалтын загварыг сургах өгөгдөл бэлтгэхэд шаардлагатай алхмууд нь өгөгдөл ачаалах, өгөгдлийг цэвэрлэх, өгөгдлийг хувиргах, өгөгдөл хуваах явдал юм. Эдгээр алхмууд нь өгөгдлийг загварт сургахад тохиромжтой форматтай байх, найдвартай үр дүнд хүрэхэд зайлшгүй шаардлагатай.

Сүүлийн үеийн бусад асуулт, хариулт Машин сургалтанд ахиц дэвшил гаргах:

Бусад асуулт, хариултыг "Machine Learning-д ахиц дэвшил" хэсгээс үзнэ үү

Илүү олон асуулт, хариулт:

Талбар: Хиймэл оюун
хөтөлбөр: EITC/AI/GCML Google Cloud Machine Learning (гэрчилгээжүүлэх хөтөлбөрт очно уу)
Хичээл: Машин сургалтанд ахиц дэвшил гаргах (холбогдох хичээл рүүгээ яв)
сэдэв: AutoML Vision - 1-р хэсэг (холбогдох сэдэв рүү оч)
Шалгалтын тойм

Доор тэмдэглэгдсэн: Хиймэл оюун, Өгөгдлийн цэвэрлэгээ, Мэдээлэл бэлтгэх, Өгөгдлийн хувиргалт, Машины сургалт, Пандас

EITCA академи

Pandas номын санг ашиглан машин сургалтын загварыг сургахад манай өгөгдлийг бэлтгэхэд ямар алхамууд ордог вэ?

Сүүлийн үеийн бусад асуулт, хариулт Машин сургалтанд ахиц дэвшил гаргах:

Илүү олон асуулт, хариулт:

EITCA академи нь Европын мэдээллийн технологийн гэрчилгээжүүлэх тогтолцооны нэг хэсэг юм

EITCA Академийн EITCI DSJC татаасыг 80% дэмжих эрхтэй

EITCA академи

НЭГДСЭН НЭГДСЭН МЭДЭЭЛЛИЙН НЭГДСЭН НЭГДСЭН ХЭРЭГЛЭЭГЭЭРЭЙ

Таны мэдээлэл үгээ мартсан уу?

Акаунт үүсгэх

Pandas номын санг ашиглан машин сургалтын загварыг сургахад манай өгөгдлийг бэлтгэхэд ямар алхамууд ордог вэ?

Сүүлийн үеийн бусад асуулт, хариулт Машин сургалтанд ахиц дэвшил гаргах:

Илүү олон асуулт, хариулт:

EITCA Академийн EITCI DSJC татаасыг 80% дэмжих эрхтэй