L'erreur moyenne absolue en pourcentage (MAPE) a fait son temps et doit maintenant être retirée.

Blog

L'erreur moyenne absolue en pourcentage (MAPE) a fait son temps et doit maintenant être retirée.

Selon Gartner (2018 Gartner Sales & Operations Planning Success Survey), la mesure d'évaluation la plus populaire pour les prévisions dans le cadre de la planification des ventes et des opérations est l'erreur absolue moyenne en pourcentage (MAPE). Cela doit changer. Les prévisions modernes portent sur de petites quantités à un niveau désagrégé, par exemple produit-lieu-jour. Pour des prévisions aussi granulaires, les valeurs MAPE sont extrêmement difficiles à évaluer et ne constituent donc pas des indicateurs utiles de la qualité des prévisions. Le MAPE induit également les utilisateurs en erreur en exagérant certains problèmes et en en dissimulant d'autres, ce qui les incite à choisir des prévisions systématiquement biaisées. Les situations dans lesquelles le MAPE est adapté sont de plus en plus rares. Il ne s'agit pas d'une théorie aride : Nous simulons un supermarché qui s'appuie sur une valeur prévisionnelle optimisée par MAPE pour le réapprovisionnement. Les sous-stocks et les surstocks dans les magasins à vente rapide et à vente lente poussent rapidement le magasin à la faillite.

Lorsque les erreurs absolues et relatives se contredisent, à qui devons-nous faire confiance ?

Vous aviez prévu une demande de 7,2 pommes et 9 ont finalement été vendues. Vous aviez prévu 91,8 bouteilles d'eau et 108 ont été vendues. Vous aviez prévu 1,9 boîte de thon et une a été vendue. Comment jugez-vous ces erreurs de prévision ? Une approche simple consiste à calculer l'écart absolu de la prédiction par rapport à la réalité et à le diviser par cette dernière, c'est-à-dire l'erreur absolue relative, éventuellement sous la forme d'un pourcentage(erreur absolue en pourcentage, APE). Cela semble beaucoup plus compliqué que cela ne l'est : L'utilisation de l'APE comme première solution pour "l'évaluation de la qualité des prévisions" est tout à fait typique. Pour les trois exemples, vous obtenez des APE apparemment modérés de 20% (=|7.2-9|/7.2), modeste 15% (=|91.8-108|/108) et 90% (=|1,9-1|/1), respectivement. Le MAPE, pourcentage absolu moyen d'erreur, est la moyenne arithmétique de ces trois pourcentages et s'élève à 41,67%. Ces pourcentages d'erreur indiquent que la prévision sur le thon est moins bonne que celle sur les pommes, et que la prévision sur les bouteilles est plus performante que les autres. Mais cela reflète-t-il vraiment la qualité des prévisions ? Regardez à nouveau le début de cette section - la grande différence absolue entre les bouteilles d'eau prévues et réelles est inquiétante, et sa petite erreur relative ne peut pas vraiment vous rassurer. D'autre part, l'erreur de 90% sur le thon pourrait être due au hasard (à la malchance) - il ne s'agit que d'un seul élément. Devriez-vous taire votre intuition et vous fier aveuglément aux APE ? Par conséquent, devriez-vous réviser les prévisions concernant le thon et laisser les prévisions concernant l'eau en l'état ? Si une autre prévision est émise, avec un MAPE global de seulement 30%, cette nouvelle prévision est-elle nécessairement meilleure ?

Bien entendu, je ne vous demanderai jamais sérieusement d'ignorer votre jugement humain ! Ce paradoxe désagréable est résolu ci-dessous : Le MAPE n'est pas adapté aux prévisions probabilistes modernes au niveau granulaire (c'est-à-dire au niveau du jour de l'emplacement du produit, où de "petits" nombres ou même "0" peuvent se produire), en raison de plusieurs problèmes intolérables et insolubles. Le MAPE d'une prévision ne nous renseigne pas sur la qualité de cette prévision, mais sur le comportement étrange de l'APE.

Ignorer consciemment l'échelle : Quand les erreurs de pourcentage peuvent avoir un sens

Avant d'aborder les prévisions granulaires dans le commerce de détail (au niveau du produit, de l'emplacement et du jour), supposons qu'il faille prévoir une quantité beaucoup plus importante : Le produit intérieur brut (PIB) annuel des pays, mesuré en dollars américains. Ces prévisions pourraient être utilisées pour définir des politiques pour des pays entiers, et ces politiques devraient être applicables de la même manière à des pays de tailles différentes. Il est donc juste de pondérer chaque pays de la même manière dans ce cas d'utilisation : Une erreur de 5% sur le PIB des États-Unis (environ 25 000 milliards de dollars) fait autant de mal qu'une erreur de 5% sur le PIB de Tuvalu (environ 66 millions de dollars, soit 380 000 fois moins que le PIB des États-Unis). L'erreur absolue en pourcentage (APE) prend ici tout son sens : Le PIB réel n'est jamais proche de 0 (ce qui causerait un terrible mal de tête en le divisant, j'y reviendrai plus loin), et l'objectif des prévisions n'est pas d'obtenir le PIB global de la planète, mais d'en être le plus proche possible pour chaque pays, sur des échelles allant de quelques millions à quelques milliers de milliards. Minimiser l'erreur absolue totale du modèle (c'est-à-dire (erreur en US$, pas en pourcentage) met en avant les plus grandes économies et néglige les plus petites. Il ne pondère pas chaque pays de la même manière, mais en fonction de sa puissance économique. Un modèle avec une belle erreur de 3% sur le PIB américain et une erreur inacceptable de 200% sur le PIB de Tuvalu semblerait "meilleur" qu'un modèle avec une erreur de 4% sur le PIB américain et une erreur de 10% sur le PIB de Tuvalu en termes absolus de dollars. Le MAPE, quant à lui, incite à utiliser cette dernière prévision, qui sacrifie une grande partie de la précision absolue du PIB des États-Unis (1% de 25 billions de dollars américains) pour une modeste amélioration absolue de la précision de Tuvalu (190% de 66 millions de dollars américains). Le GPD des États-Unis est beaucoup plus important que celui de Tuvalu, mais on déciderait consciemment, et pour de bonnes raisons, de les traiter sur un pied d'égalité. Les États-Unis et Tuvalu peuvent être considérés comme "importants" dans le sens où l'on ne peut pas s'attendre à ce que les fluctuations statistiques ou la "malchance" soient responsables de l'erreur de prévision - c'est-à-dire que les déviations seront généralement statistiquement significatives et indiqueront un potentiel d'amélioration du modèle.

En résumé, lorsque des cas individuels de prévisions de valeurs différentes doivent être traités de la même manière, c'est-à-dire lorsque nous pouvons comparer des pommes énormes à des oranges minuscules, le MAPE peut s'avérer utile. Mais un traitement égal est-il toujours juste ?

Chargement du composant...

Chargement du composant...

Chargement du composant...