ชุดการฝึกอบรมและการทดสอบในการเรียนรู้ของเครื่องหมายถึงชุดย่อยสองชุดของข้อมูลที่ใช้ในการพัฒนาอัลกอริธึมการเรียนรู้ของเครื่อง ชุดการฝึกคือชุดข้อมูลที่ใช้ในการฝึกโมเดลการเรียนรู้ของเครื่อง ในขณะที่ชุดทดสอบคือชุดข้อมูลที่ใช้ในการประเมินประสิทธิภาพการทำงานทั่วไปของโมเดลที่ได้รับการฝึก โดยทั่วไปชุดการฝึกใช้เพื่อปรับพารามิเตอร์ของแบบจำลอง เช่น น้ำหนักและความลำเอียง เพื่อให้แบบจำลองอธิบายข้อมูลในชุดการฝึกได้อย่างถูกต้อง ชุดทดสอบใช้เพื่อประเมินความแม่นยำของการคาดการณ์แบบจำลองกับข้อมูลที่มองไม่เห็น โดยใช้หน่วยเมตริก เช่น ความแม่นยำ การเรียกคืน และคะแนน F1
การใช้ชุดการฝึกอบรมและการทดสอบในแมชชีนเลิร์นนิงถือเป็นสิ่งสำคัญในการพัฒนาแบบจำลองที่แม่นยำและแข็งแกร่ง เนื่องจากประสิทธิภาพของแบบจำลองกับข้อมูลที่เคยเห็นมาก่อนมักจะไม่ได้บ่งบอกถึงประสิทธิภาพที่แท้จริงเมื่อจัดการกับข้อมูลที่มองไม่เห็น ขอแนะนำให้ใช้ทั้งสองชุดรวมกันเพื่อวัตถุประสงค์ที่แตกต่างกัน ตัวอย่างเช่น การสร้างชุดการตรวจสอบที่ใช้ในการปรับแต่งไฮเปอร์พารามิเตอร์และเปรียบเทียบอัลกอริธึมต่างๆ และชุดทดสอบเพื่อประเมินประสิทธิภาพของโมเดลขั้นสุดท้าย
โดยทั่วไป ชุดการฝึกและชุดทดสอบควรแบ่งแบบสุ่ม เพื่อให้ข้อมูลมีการกระจายเท่าๆ กันระหว่างสองชุด นอกจากนี้ สิ่งสำคัญคือต้องแน่ใจว่าชุดการฝึกอบรมและการทดสอบเป็นตัวแทนของข้อมูลที่ใช้ในการใช้งานจริง เนื่องจากการติดตั้งชุดการฝึกอบรมมากเกินไปอาจทำให้ชุดการทดสอบมีประสิทธิภาพต่ำ