Баримт бичгийн ангилалд зориулсан мэдрэлийн бүтэцтэй сургалтын (NSL) загварыг бий болгох нь бат бөх, үнэн зөв загварыг бий болгоход чухал ач холбогдолтой хэд хэдэн үе шатыг агуулдаг. Энэхүү тайлбарт бид ийм загварыг бий болгох нарийвчилсан үйл явцыг нарийвчлан судалж, алхам бүрийн талаар иж бүрэн ойлголт өгөх болно.
Алхам 1: Мэдээлэл бэлтгэх
Эхний алхам бол баримт бичгийн ангилалд зориулж өгөгдлийг цуглуулах, урьдчилан боловсруулах явдал юм. Үүнд хүссэн ангилал, ангиллыг хамарсан олон төрлийн баримт бичгийг цуглуулах зэрэг багтана. Баримт бичиг бүрийг зөв ангитай холбож өгөхийн тулд өгөгдлийг шошготой байх ёстой. Урьдчилсан боловсруулалт нь шаардлагагүй тэмдэгтүүдийг арилгах, жижиг үсгээр хөрвүүлэх, текстийг үг эсвэл дэд үг болгон токен болгох замаар текстийг цэвэрлэх явдал юм. Нэмж дурдахад, текстийг илүү бүтэцтэй форматаар илэрхийлэхийн тулд TF-IDF эсвэл үг оруулах гэх мэт онцлог инженерчлэлийн аргуудыг ашиглаж болно.
Алхам 2: График барих
Neural Structured Learning-д өгөгдөл нь баримт бичгийн хоорондын харилцааг дүрслэн харуулах график бүтэц хэлбэрээр илэрхийлэгддэг. График нь ижил төстэй баримт бичгүүдийг агуулгын ижил төстэй байдалд үндэслэн холбох замаар бүтээгдсэн. Үүнийг хамгийн ойрын хөрш (KNN) эсвэл косинусын ижил төстэй арга техникийг ашиглан хийж болно. График нь ижил ангиллын баримт бичгийн хоорондын холболтыг дэмжихийн зэрэгцээ өөр өөр ангиллын баримт бичгийн хоорондын холболтыг хязгаарлах байдлаар хийгдсэн байх ёстой.
Алхам 3: Өрсөлдөөнтэй сургалт
Өрсөлдөөнтэй сургалт нь мэдрэлийн бүтэцтэй сургалтын гол бүрэлдэхүүн хэсэг юм. Энэ нь загварт шошготой болон хаяггүй өгөгдлүүдээс суралцахад тусалдаг бөгөөд үүнийг илүү бат бөх, ерөнхийд нь илэрхийлэх боломжтой болгодог. Энэ үе шатанд загварыг шошготой өгөгдөл дээр сургаж, шошгогүй өгөгдлийг нэгэн зэрэг цочирдуулдаг. Оролтын өгөгдөлд санамсаргүй шуугиан эсвэл сөрөг дайралт хийх замаар цочролыг нэвтрүүлж болно. Загвар нь эдгээр түгшүүрт бага мэдрэмтгий байхаар бэлтгэгдсэн бөгөөд энэ нь үл үзэгдэх өгөгдлийн гүйцэтгэлийг сайжруулахад хүргэдэг.
Алхам 4: Архитектурын загвар
Баримт бичгийн ангилалд тохирох загвар архитектурыг сонгох нь маш чухал юм. Нийтлэг сонголтууд нь эргэлтийн мэдрэлийн сүлжээ (CNN), давтагдах мэдрэлийн сүлжээ (RNN) эсвэл трансформаторын загвар юм. Баримт бичгүүдийн хоорондын холболтыг харгалзан график бүтэцтэй өгөгдөлтэй ажиллахаар загвар зохион бүтээгдсэн байх ёстой. Графикийн эргэлтийн сүлжээ (GCN) эсвэл графикийн анхаарлын сүлжээ (GATs) нь ихэвчлэн график бүтцийг боловсруулж, утга учиртай дүрслэлийг гаргаж авахад ашиглагддаг.
Алхам 5: Сургалт ба үнэлгээ
Загварын архитектурыг тодорхойлсны дараа дараагийн алхам нь шошготой өгөгдлийг ашиглан загварыг сургах явдал юм. Сургалтын үйл явц нь стохастик градиент descent (SGD) эсвэл Adam optimizer гэх мэт аргуудыг ашиглан загварын параметрүүдийг оновчтой болгох явдал юм. Сургалтын явцад загвар нь баримт бичгүүдийг тэдгээрийн онцлог, графикийн бүтцэд тусгагдсан харилцаа холбоогоор нь ангилж сурдаг. Сургалтын дараа загвар нь гүйцэтгэлийг хэмжихийн тулд тусдаа тестийн багц дээр үнэлэгддэг. Загварын үр нөлөөг үнэлэхийн тулд нарийвчлал, нарийвчлал, санах ой, F1 оноо зэрэг үнэлгээний хэмжүүрүүдийг ихэвчлэн ашигладаг.
Алхам 6: Нарийн тохируулга ба гиперпараметрийг тааруулах
Загварын гүйцэтгэлийг цаашид сайжруулахын тулд нарийн тохируулга хийж болно. Энэ нь шилжүүлгийн сургалт эсвэл сургалтын хурдны хуваарь гэх мэт арга техникийг ашиглан загварын параметрүүдийг тохируулах явдал юм. Гиперпараметрийн тохируулга нь загварын гүйцэтгэлийг оновчтой болгоход чухал үүрэг гүйцэтгэдэг. Сурах хурд, багцын хэмжээ, тогтворжуулах хүч зэрэг параметрүүдийг сүлжээ хайлт эсвэл санамсаргүй хайлт зэрэг аргуудыг ашиглан тохируулж болно. Нарийн тохируулга болон гиперпараметрийг тохируулах энэхүү давтагдах үйл явц нь хамгийн сайн гүйцэтгэлд хүрэхэд тусалдаг.
Алхам 7: Дүгнэлт ба байршуулалт
Загварыг сургаж, нарийн тохируулсны дараа баримт бичгийг ангилах ажилд ашиглаж болно. Шинэ, үл үзэгдэх баримт бичгүүдийг загварт оруулах боломжтой бөгөөд энэ нь сурсан загвар дээр үндэслэн тус тусын ангиудыг урьдчилан таамаглах болно. Бодит цагийн баримт бичгийг ангилах боломжийг олгохын тулд уг загварыг вэб програмууд, API эсвэл суулгагдсан систем зэрэг янз бүрийн орчинд байрлуулж болно.
Баримт бичгийн ангилалд зориулсан мэдрэлийн бүтэцтэй сургалтын загварыг бий болгох нь өгөгдөл бэлтгэх, график байгуулах, сөргөлдөөн хийх сургалт, загварын архитектур сонгох, сургалт, үнэлгээ, нарийн тааруулах, гиперпараметрийг тохируулах, эцэст нь дүгнэлт хийх, байршуулах зэрэг орно. Алхам бүр нь баримт бичгийг үр дүнтэй ангилж чадах үнэн зөв, бат бөх загварыг бий болгоход чухал үүрэг гүйцэтгэдэг.
Сүүлийн үеийн бусад асуулт, хариулт EITC/AI/TFF TensorFlow Fundamentals:
- Хэрхэн оруулах давхаргыг ашиглан үгсийг вектор болгон дүрслэх графикт тохирох тэнхлэгүүдийг автоматаар хуваарилах вэ?
- CNN-д хамгийн их нөөц бүрдүүлэх зорилго юу вэ?
- Хувирмал мэдрэлийн сүлжээ (CNN) дахь шинж чанарыг задлах процессыг дүрсийг танихад хэрхэн ашигладаг вэ?
- TensorFlow.js дээр ажиллаж байгаа машин сургалтын загваруудад асинхрон сургалтын функцийг ашиглах шаардлагатай юу?
- TensorFlow Keras Tokenizer API үгийн хамгийн их тооны параметр хэд вэ?
- TensorFlow Keras Tokenizer API-г хамгийн түгээмэл үгсийг олоход ашиглаж болох уу?
- TOCO гэж юу вэ?
- Машин сургалтын загвар дахь хэд хэдэн эрин үе ба загварыг ажиллуулахаас урьдчилан таамаглах нарийвчлалын хооронд ямар хамааралтай вэ?
- TensorFlow-ийн мэдрэлийн бүтэцтэй сургалтын API-тай хөрш зэргэлдээх багц нь байгалийн график өгөгдөл дээр суурилсан сургалтын нэмэгдүүлсэн мэдээллийн багц үүсгэдэг үү?
- TensorFlow-ийн мэдрэлийн бүтэцтэй сургалтын програмын хөршүүдийн API гэж юу вэ?
Бусад асуулт, хариултыг EITC/AI/TFF TensorFlow Fundamentals-аас үзнэ үү