การเรียนรู้ของเครื่องมากเกินไปเป็นปรากฏการณ์ทั่วไปที่แบบจำลองหรืออัลกอริธึมเหมาะสมกับข้อมูลการฝึกอบรมเป็นอย่างดีจนไม่สามารถสรุปข้อมูลใหม่ได้ เกิดขึ้นเมื่อแบบจำลองซับซ้อนเกินไป โดยมีพารามิเตอร์หรือคุณลักษณะมากเกินไปซึ่งสัมพันธ์กับจำนวนข้อมูล มีแนวโน้มที่จะอธิบายสัญญาณรบกวนในข้อมูลแทนที่จะเป็นสัญญาณพื้นฐาน นำไปสู่อัตราความแม่นยำสูงในข้อมูลการฝึกอบรม แต่ประสิทธิภาพต่ำในข้อมูลที่มองไม่เห็น
การติดตั้งมากเกินไปอาจเกิดจากปัจจัยหลายประการ รวมถึงการมีโมเดลที่ซับซ้อนมากเกินไปซึ่งไม่สามารถจับแนวโน้มที่ซ่อนอยู่ในข้อมูลได้ หรือมีคุณลักษณะมากเกินไปเมื่อเทียบกับจำนวนข้อมูลการฝึกที่มีอยู่ นอกจากนี้ยังอาจเกิดจากการใช้แบบจำลองที่ให้ความยืดหยุ่นมากเกินไป เช่น โมเดลที่มีความสัมพันธ์แบบพหุนามหรือลำดับที่สูงกว่าระหว่างคุณลักษณะต่างๆ การติดตั้งมากเกินไปอาจนำไปสู่แบบจำลองที่ไวต่อจุดข้อมูลเฉพาะมากเกินไป และทำให้ไม่สามารถสรุปข้อมูลทั่วไปในอนาคตได้
เพื่อป้องกันไม่ให้มีการติดตั้งมากเกินไป จำเป็นต้องรักษาความซับซ้อนของโมเดลให้ต่ำโดยจงใจลบคุณลักษณะบางอย่างออก หรือโดยใช้วิธีการทำให้เป็นมาตรฐาน เทคนิคดังกล่าวยังสามารถทำให้เกิดอคติเพิ่มเติมในแบบจำลองได้ แต่วิธีนี้ยังคงดีกว่าการปรับมากเกินไป การตรวจสอบข้ามยังสามารถใช้เพื่อระบุเมื่อแบบจำลองเริ่มมีข้อมูลมากเกินไป การเก็บชุดการตรวจสอบความถูกต้องแยกจากข้อมูลการฝึกถือเป็นสิ่งสำคัญ เนื่องจากสามารถใช้เพื่อตรวจสอบความถูกต้องของแบบจำลองได้ ท้ายที่สุด สามารถใช้วิธีการทั้งมวล เช่น การเสริมกำลัง เพื่อลดโอกาสที่จะเกิดการโอเวอร์ฟิตได้