Scikit-learn เป็นไลบรารีการเรียนรู้ของเครื่องที่เขียนด้วยภาษา Python ซึ่งออกแบบมาเพื่อรวมอัลกอริธึมการเรียนรู้ของเครื่องแบบคลาสสิกเข้ากับเวิร์กโฟลว์วิทยาศาสตร์ข้อมูลร่วมสมัย Scikit-learn เป็นไลบรารีโอเพ่นซอร์สฟรีที่ประกอบด้วยเครื่องมือที่เรียบง่ายและมีประสิทธิภาพสำหรับการขุดข้อมูลและการวิเคราะห์ข้อมูล ซึ่งออกแบบมาเพื่อทำงานกับภาษาคอมพิวเตอร์ทางวิทยาศาสตร์ยอดนิยม SciPy และ NumPy
ไลบรารีนี้สร้างขึ้นจากโปรเจ็กต์โอเพ่นซอร์สที่มีอยู่ เช่น SciPy, NumPy, pandas และ Cython และผสมผสานการวิจัยแมชชีนเลิร์นนิงในอดีตเข้ากับวิศวกรรมซอฟต์แวร์สมัยใหม่ มีอัลกอริธึมการเรียนรู้แบบมีผู้ดูแลและไม่ได้รับการดูแลที่หลากหลาย
อัลกอริธึมที่ใช้ได้ ได้แก่ การถดถอยโลจิสติก ฟอเรสต์สุ่ม และสนับสนุนเครื่องเวกเตอร์ พร้อมด้วยแบบจำลองการจัดกลุ่ม (เช่น เคมีน) แผนผังการตัดสินใจ และวิธีการรวมกลุ่ม Scikit-learn ยังมีฟังก์ชันยูทิลิตี้สำหรับการแสดงภาพ การประมวลผลล่วงหน้า การเลือกคุณสมบัติ และอื่นๆ อีกมากมาย สามารถรวมเข้ากับไลบรารีอื่น ๆ ได้อย่างง่ายดาย เช่น Matplotlib และสมุดบันทึก Jupyter
ด้วยการออกแบบ API ทำให้ผู้ใช้สามารถขยายไลบรารีได้ง่าย นอกจากนี้ยังมีเอกสารที่ครอบคลุมสำหรับห้องสมุดในรูปแบบเอกสารหรือบทช่วยสอนออนไลน์และชุมชนผู้ใช้ที่เติบโตอย่างต่อเนื่อง
Scikit-Learn สามารถนำไปใช้งานได้หลากหลาย รวมถึงการจำแนกประเภท การถดถอย การจัดกลุ่ม และการลดขนาด และสามารถใช้เพื่อกำหนด ฝึกอบรม ทดสอบ และประเมินโมเดลแมชชีนเลิร์นนิง เหมาะอย่างยิ่งสำหรับชุดข้อมูลขนาดเล็กถึงขนาดกลาง รวมถึงการฝึกอบรมข้อมูลขนาดใหญ่