User Tools

Site Tools


pr:advbook:ch3glossary

อภิธานศัพท์ บทที่ 3

  • การปรับเส้นโค้ง (curve fitting): การปรับพฤติกรรมของแบบจำลองทำนาย โดยการเปลี่ยนค่าของพารามิเตอร์ เพื่อให้พฤติกรรมทำนายสอดคล้องกับข้อมูลที่มี.
  • จุดข้อมูล (datapoint): ตัวอย่างข้อมูลที่มีค่าของตัวแปรต้น $x$ และตัวแปรตาม $y$ ที่เป็นคู่กัน.
  • ฟังก์ชันพหุนาม (polynomial function): ฟังก์ชัน $f: \mathbb{R} \mapsto \mathbb{R}$ ที่แสดงความสัมพันธ์ระหว่างตัวแปรต้น $x$ และตัวแปรตาม $y$ ด้วยสมการพหุนาม $y = f(x, \vec{w}) = \sum_{m=0}^M w_m x^m$ เมื่อ พารามิเตอร์ของฟังก์ชัน $\vec{w}$ $= [w_0, \; w_1, \; \ldots, \; w_M]^T$.
  • การฝึก (training): การฝึก หรือการเรียนรู้ คือการปรับค่าพารามิเตอร์ของแบบจำลอง เพื่อให้แบบจำลองมีพฤติกรรมการทำนายสอดคล้องกับข้อมูล.
  • ค่าเฉลย (ground truth): ค่าของตัวแปรตาม $y$ จากข้อมูล ที่คู่กับตัวแปรต้น $x$ ที่สนใจ.
  • คุณสมบัติความทั่วไป (generalization): ความสามารถของแบบจำลองทำนาย ที่สามารถทำนายข้อมูลที่ไม่เคยเห็นได้ดี.
  • ข้อมูลฝึก (training data): ข้อมูลที่ใช้ในกระบวนการฝึกแบบจำลอง
  • ข้อมูลทดสอบ (test data): ข้อมูลที่ใช้ในทดสอบแบบจำลอง.
  • การโอเวอร์ฟิต (overfitting): การที่แบบจำลองสามารถทำนายข้อมูลฝึกได้ดี แต่ทำนายข้อมูลใหม่ที่ไม่เคยเห็นได้ไม่ดี นั่นคือ การที่แบบจำลองไม่มีคุณสมบัติความทั่วไป.
  • ความซับซ้อนของแบบจำลอง (model complexity): การยืดหยุ่นของแบบจำลอง อาจบ่งชี้ได้จากจำนวนพารามิเตอร์ของแบบจำลอง.
  • โครงข่ายประสาทเทียม (artificial neural network): แบบจำลองคำนวณ ที่ทำการคำนวณ โดยใช้หน่วยคำนวณย่อยหลาย ๆ หน่วย ที่แต่ละหน่วยทำการคำนวณในแบบคล้าย ๆ กัน.
  • เพอร์เซปตรอนหลายชั้น (multi-layer perceptron): โครงข่ายประสาทเทียม ที่หน่วยคำนวณต่าง ๆ ต่อกันเป็นโครงข่ายในลักษณะชั้นคำนวณ.
  • โหนด หรือหน่วยคำนวณ (node หรือ unit): การคำนวณย่อยของโครงข่ายประสาทเทียม ที่มีลักษณะการคำนวณง่าย ๆ ไม่ซับซ้อน.
  • ชั้นคำนวณ (layer): กลุ่มของโหนด ในโครงข่ายประสาทเทียม ที่จัดโครงสร้างเป็นลักษณะชั้นคำนวณ โดยกลุ่มของโหนดในชั้นคำนวณเดียวกัน จะรับอินพุตจาก(กลุ่มของโหนดใน)ชั้นคำนวณก่อนหน้า หรือจะส่งเอาต์พุตออกไปให้(กลุ่มของโหนดใน)ชั้นคำนวณถัดไป หรือทั้งสองอย่าง.
  • ชั้นซ่อน (hidden layer): ชั้นคำนวณที่จะส่งเอาต์พุตออกไปให้(กลุ่มของโหนดใน)ชั้นคำนวณถัดไป โดยเอาต์พุตของชั้นซ่อนจะไม่ใช่เอาต์พุตสุดท้ายของโครงข่าย.
  • หน่วยซ่อน (hidden node หรือ hidden unit): โหนดในชั้นซ่อน.
  • ค่าน้ำหนักและค่าไบอัส (weights and biases): ค่าพารามิเตอร์ต่าง ๆ ของโครงข่ายประสาทเทียม.
  • ฟังก์ชันกระตุ้น (activation function): ฟังก์ชันคำนวณของโหนด.
  • ชั้นเอาต์พุต (output layer): ชั้นคำนวณชั้นสุดท้ายที่เอาต์พุตของชั้น จะเป็นเอาต์พุตของโครงข่าย.
  • การแพร่กระจายย้อนกลับ (backpropagation หรือ error backpropagation): ขั้นตอนวิธีการคำนวณหาค่าเกรเดียนต์ เพื่อปรับค่าน้ำหนัก สำหรับโครงข่ายประสาทเทียม.
  • การฝึกแบบหมู่ (batch training): การฝึกที่ใช้ข้อมูลฝึกทั้งหมดทีเดียว นั่นคือ การปรับค่าพารามิเตอร์ทำเดียวในแต่ละสมัยฝึก.
  • การฝึกแบบออนไลน์ (online training): การฝึกที่ใช้ข้อมูลฝึกทีละหนึ่งจุดข้อมูล นั่นคือ การปรับค่าพารามิเตอร์จะทำหลาย ๆ ครั้ง แต่ละครั้งสำหรับแต่ละจุดข้อมูล และจะทำจนกว่าจะครบทุกจุดข้อมูล ในแต่ละสมัยฝึก.
  • สมัย (epoch): รอบการปรับค่าพารามิเตอร์ โดยแต่ละรอบจะนับเมื่อมีการใช้ข้อมูลฝึกครบทุกจุด.
  • อัตราเรียนรู้ (learning rate): ขนาดก้าว ที่เป็นค่าสเกล่าร์ เพื่อควบคุมความเร็วในการฝึกแบบจำลอง เป็นค่าที่ใช้กับ\textit{ขั้นตอนวิธีการหาค่าดีที่สุด}ที่อยู่เบื้องหลังการฝึก.
  • การกำหนดค่าน้ำหนักเริ่มต้น (weight initialization): การกำหนดค่าน้ำหนักและไบอัส ให้กับโครงข่ายประสาทเทียม ก่อนการฝึก.
  • การจำแนกค่าทวิภาค (binary classification): ภาระกิจการทำนาย ที่ผลการทำนายมีได้สองแบบ.
  • ฟังก์ชันสูญเสียครอสเอนโทรปี (cross entropy loss): ฟังก์ชันจุดประสงค์ สำหรับการจำแนกค่าทวิภาค หรือการจำแนกกลุ่ม.
  • รหัสหนึ่งร้อน (one-hot coding หรือ one-of-K coding): รูปแบบแทนข้อมูลที่มีลักษณะเป็นกลุ่ม โดย รหัสจะมีจำนวนส่วนประกอบเท่ากับจำนวนกลุ่มทั้งหมด และตำแหน่งของแต่ละส่วนประกอบ แทนฉลากของกลุ่มแต่ละกลุ่ม. รหัสจะระบุฉลากของกลุ่ม โดยกำหนดให้ ส่วนประกอบที่อยู่ตำแหน่งฉลากนั้น มีค่าเป็นหนึ่ง และส่วนประกอบอื่น ๆ มีค่าเป็นศูนย์.
  • ซอฟต์แมกซ์ (softmax): ฟังก์ชันคำนวณ เพื่อควบคุมให้เอาต์พุต ให้อยู่ในรูปแบบที่สามารถเปรียบเทียบได้กับรหัสหนึ่งร้อน.
  • การทำนอร์มอไลซ์อินพุต (input normalization): การปรับขนาดของอินพุตทั้งหมด.
  • การหยุดก่อนกำหนด (early stopping): การทำเงื่อนไขจบการฝึก โดยใช้ข้อมูลตรวจสอบ.
  • ข้อมูลตรวจสอบ (validation data): ชุดข้อมูล เพื่อเสริมกระบวนการเตรียมแบบจำลอง อาจใช้ช่วยกระบวนการฝึก แต่ไม่ได้ใช้ฝึกแบบจำลองโดยตรง.

สารบัญ

pr/advbook/ch3glossary.txt · Last modified: 2020/12/05 15:21 by tatpong

Page Tools