La régression ordinale est un type d'algorithme d'apprentissage statistique utilisé pour faire des prédictions dans l'analyse des données. Il est largement utilisé pour analyser des ensembles de données avec des valeurs cibles qui sont soit des nombres entiers, des catégories ou, dans certaines situations, des valeurs continues. Il s'agit d'une technique d'apprentissage supervisé qui prédit la probabilité qu'une variable cible catégorielle se trouve dans une catégorie parmi un ensemble prédéfini de catégories.
La régression ordinale est couramment utilisée dans les applications d'apprentissage automatique telles que la prédiction de la fraude par carte de crédit ou le diagnostic médical. Il peut également être utilisé pour la recherche dans des domaines comme la médecine et la psychologie. L'algorithme fonctionne en trouvant une fonction linéaire ou polynomiale qui sépare au mieux les données d'entrée en différentes catégories de sortie.
Par exemple, l’algorithme de régression ordinale pourrait être utilisé pour prédire les relations adulte-enfant dans un ensemble de données intégrant des facteurs tels que l’âge, le sexe, le lieu, l’éducation et le type d’emploi. Chacun des points de données pourrait ensuite être classé en différentes catégories telles que mère-enfant, père-enfant, tante-neveu, etc. L'algorithme de régression ordinale produira alors la relation adulte-enfant la plus probable en fonction des données saisies.
La régression ordinale est également utilisée dans les études de marché pour mieux comprendre les préférences des consommateurs. Il a été utilisé dans les prévisions et les prédictions de ventes, la prise de décision analytique et même le placement de produits dans les magasins.
Les algorithmes les plus populaires pour la régression ordinale comprennent la régression logistique, les classificateurs d'arbres de décision, les réseaux de neurones, les machines à vecteurs de support et les méthodes basées sur les classements. La régression logistique est l'algorithme le plus couramment utilisé, car il est robuste aux valeurs aberrantes et peut gérer plusieurs catégories, MAIS toutes les alternatives présentent également des avantages spécifiques dans certains scénarios.