Матрица путаницы — это инструмент, используемый в числовых классификациях машинного обучения для оценки производительности модели классификации. Это таблица, используемая для оценки точности алгоритма классификации. Каждая строка матрицы представляет собой прогнозируемый класс, а каждый столбец — фактический класс. Матрица состоит из четырех различных показателей: истинные положительные результаты (TP), истинные отрицательные результаты (TN), ложные положительные результаты (FP) и ложные отрицательные результаты (FN).
Матрица путаницы — полезный инструмент для анализа эффективности прогнозной модели. Он используется для определения количества ошибок, допущенных моделью при прогнозировании или классификации точек данных, а также для сравнения двух методов классификации для одного и того же набора данных. Матрицу также можно использовать для оценки точности прогнозов модели.
Точность модели рассчитывается путем суммирования общего количества истинных положительных и истинных отрицательных результатов и деления этой суммы на общее количество точек данных. Расчет других показателей, таких как точность (отношение истинно положительных результатов ко всем образцам, классифицированным как положительные) и полнота (отношение истинно положительных результатов ко всем истинно положительным результатам), также становится возможным с использованием матрицы путаницы.
Матрица путаницы — полезный инструмент для анализа эффективности различных классификаторов, а также для сравнения эффективности различных методов классификации. Это может помочь выявить переоснащенные модели, которые склонны к смещению в сторону переобучения и недостаточной спецификации. Его также можно использовать для оценки способности модели правильно классифицировать невидимые данные и определять, нужно ли использовать больше данных для дальнейшего повышения точности.
Матрицы путаницы используются в широком спектре приложений, включая маркетинг, финансы, медицину, инженерию, статистику и машинное обучение. Они особенно популярны в машинном обучении, поскольку обеспечивают визуальное представление производительности различных классификаторов в заданном наборе данных.