Prévoir peu est différent : Partie 2

Blog

Prévoir peu est différent : Partie 2

Il s'agit d'un article en deux parties sur la gestion des prévisions de ventes concernant des articles à rotation rapide ou lente. Retrouvez la première partie ici.

Quel est le degré de précision d'une prévision de vente ?

Le mécanisme d'annulation des fluctuations garantit que les prévisions granulaires à petite échelle sont plus imprécises, bruyantes et incertaines que les prévisions agrégées et à gros grain à grande échelle : Nous sommes meilleurs (en termes relatifs) pour prédire le nombre total de bretzels pour une semaine entière que pour un seul jour.

Jusqu'à présent, nous avons argumenté qualitativement en faveur de cette relation, mais pouvons-nous faire une déclaration quantitative sur le niveau de précision auquel nous pouvons idéalement nous attendre, pour différents taux de vente prédits ? Heureusement, cela est possible, de manière universelle et indépendante de l'industrie. Dans notre précédent billet sur le biais rétrospectif dans l'évaluation des prévisions, nous avons affirmé que les prévisions déterministes et parfaitement certaines ne sont pas réalistes : Prenons l'exemple de notre prévision de 5 bretzels. Au niveau des clients individuels, une prévision déterministe de 5 se traduit par 5 clients qui, quoi qu'il arrive, achèteront un bretzel le jour prévu. Mais non seulement nous supposons que nous connaissons extrêmement bien ces 5 clients (peut-être mieux qu'ils ne se connaissent eux-mêmes, qui n'a jamais décidé spontanément de prendre ou non un bretzel ?), mais nous excluons aussi totalement la possibilité qu'un autre client achète un bretzel. Un tel degré de certitude est manifestement impossible. Si l'on tient compte d'une certaine incertitude, par exemple 6 clients avec une probabilité de 5/6=83,3% d'acheter chacun un bretzel, on obtient ce que les mathématiciens appellent une distribution binomiale du nombre total de bretzels vendus : La probabilité de vendre 6 bretzels est (5/6)^6, la probabilité de n'en vendre aucun est (1/6)^6, la probabilité de vendre entre un et cinq contient les coefficients binomiaux respectifs. Cependant, connaître 6 clients qui achèteront avec une forte probabilité reste irréaliste. Même en supposant que 10 clients avec une probabilité de 50% achètent chacun un bretzel, c'est un défi. Nous pouvons continuer à augmenter le nombre de clients potentiels tout en diminuant leur probabilité d'acheter un bretzel, en suivant le chemin de la distribution limite de Poisson: Dans la limite de Poisson, nous supposons une base de clients illimitée, dans laquelle chaque client a une probabilité d'achat infiniment petite, tandis que nous avons le contrôle sur le produit du nombre de clients et de la probabilité d'achat : le taux de vente. La distribution de Poisson s'échelonne de manière cohérente : Si les ventes quotidiennes suivent une distribution de Poisson de moyenne 5, les ventes hebdomadaires suivent une distribution de Poisson de moyenne 35. La distribution de Poisson est l'étalon-or de la prévision des ventes : Nous supposons connaître tous les facteurs qui influencent les ventes d'un produit donné, mais nous n'avons pas accès aux données individuelles des clients qui nous permettraient de faire des déclarations plus solides sur le comportement d'achat des clients individuels. Lorsque la précision de vos prévisions est aussi bonne que celle attendue de la distribution de Poisson, vous avez généralement atteint la limite de ce qui est possible.

Une distribution de Poisson n'intègre qu'un seul paramètre, le taux de vente ; la largeur de la distribution, c'est-à-dire l'étendue des résultats probables autour de la moyenne, est entièrement déterminée par sa forme fonctionnelle, qui reflète l'autoconsistance. En d'autres termes, le degré de précision réalisable ne dépend que du taux de vente prédit dans l'intervalle de temps considéré : Les ventes de 5 bretzels prédits par jour suivent la même distribution que les ventes de 5 gâteaux d'anniversaire prédits par semaine, de 5 brioches prédites par heure ou de 5 gâteaux de mariage prédits par trimestre. En d'autres termes, l'erreur relative réalisable dans le meilleur des cas est entièrement déterminée par la valeur prévue elle-même : L'erreur relative réalisable dans le meilleur des cas est entièrement et uniquement déterminée par la valeur prévue elle-même !

Pourquoi les produits ultrafrais à vente lente ne peuvent-ils pas être proposés de manière durable ?

En gardant à l'esprit cet aperçu de l'échelle des erreurs, revenons à la question de savoir pourquoi le concombre de mer frais n'est pas proposé partout dans le monde : Nous montrons la distribution attendue des ventes par jour pour une prévision de Poisson parfaite d'un concombre de mer par jour :

forecasting-few-is-different-part-2-body-01

Nous connaîtrons 37% des jours sans aucune demande, 37% des jours où un amateur de fruits de mer voudra acheter un concombre de mer cru, et dans 26% des jours, nous verrons une demande de deux concombres ou même plus. Combien de concombres de mer devons-nous garder en stock, étant donné que nous devons les jeter à la fin de la journée si personne ne les achète ? Si nous n'avons qu'une seule pièce en stock, nous devrons la jeter dans 37% des jours, tandis que dans 26% des jours, nous aurons des clients mécontents qui ne pourront pas acheter le concombre de mer qu'ils avaient l'intention d'acheter. Avec deux pièces en stock, nous devons en jeter au moins une après 74% des jours - quel gâchis, étant donné que les concombres de mer sont protégés dans de nombreux endroits ! Il est clair qu'un modèle commercial visant à répondre à la demande infime de concombres de mer crus n'est pas viable et ne pourrait être maintenu que si la marge était extrêmement importante : Les personnes qui achètent le concombre de mer cru doivent subventionner tous les jours où aucun concombre de mer n'est vendu - et ces personnes ne seront même pas sûres d'en obtenir un si elles en veulent un ! Selon des hypothèses modérées concernant la marge et les coûts d'écoulement, la quantité de stock adéquate pour un vendeur ultra-frais et super-lent est : zéro.

Là encore, tout cela est dû à une mise à l'échelle non proportionnelle : La distribution attendue des ventes pour une prévision de 100 concombres de mer frais par jour n'est pas seulement une version gonflée de la distribution ci-dessus pour 1 concombre de mer par jour, mais elle a une forme différente - tout comme un éléphant ne ressemble pas à un grand impala :

forecasting-few-is-different-part-2-body-02

Mauvaise nouvelle pour tous ceux qui espèrent obtenir des bretzels à Busan ou une plus grande variété de fruits en Europe du Nord ! Il y a cependant de l'espoir : Lorsque la demande dépasse un certain seuil parce qu'un plat périssable devient à la mode, cet aliment nouveau peut s'implanter dans de nouveaux endroits - on trouve de bons sushis presque partout sur la planète.

En résumé, en raison de l'échelle non proportionnelle de l'erreur de prévision, les surstocks et les sous-stocks d'un produit - même dans l'hypothèse d'une prévision parfaite - augmentent de manière disproportionnée lorsque le taux de vente diminue. Par conséquent, ce n'est qu'à partir d'un certain taux de vente par durée de conservation que l'offre d'un certain produit alimentaire périssable peut être maintenue.

Évaluation de l'erreur de prévision

Nous avons maintenant compris pourquoi nous ne pouvons pas espérer trouver des produits frais étrangers chez nous. Tirons-en quelques leçons pour les scientifiques des données et les utilisateurs professionnels chargés d'évaluer la qualité des prévisions : Pour les taux de vente prévus élevés, les fluctuations aléatoires qui font monter ou descendre la valeur réelle des ventes par rapport à la moyenne prévue ne peuvent servir d'excuse à un écart substantiel, et nous pouvons attribuer cet écart à une erreur ou à un problème réel dans la prévision. Les particularités statistiques dont nous avons parlé plus haut n'ont pas d'importance. Si une demande totale de 1 000 000 a été prévue et que les ventes totales s'élèvent à 800 000, cette erreur de 20% n'est pas due à des fluctuations inévitables, mais à une prévision biaisée.

Pour les petits nombres prévus, nous ne pouvons plus attribuer sans ambiguïté les écarts observés à une mauvaise prévision : Étant donné une prévision de 1, l'observation 0 (qui est à 100% près) est tout à fait probable (avec une probabilité de 37%), tout comme l'observation 2 (qui est également à 100% près). Il est beaucoup plus difficile de juger si une prévision est bonne ou mauvaise, car la ligne de base naturelle, le bruit inévitable, est prédominant.

Devons-nous alors diviser nos prévisions en "vendeurs rapides", pour lesquels nous attribuons les écarts observés à une erreur de prévision, et en "vendeurs lents", pour lesquels nous sommes plus bienveillants ? Nous vous le déconseillons : Qu'en est-il du cas intermédiaire, une prédiction de, disons, 15 ? Où se situe la limite entre "lent" et "rapide" ? Si un produit devient légèrement plus populaire, que se passe-t-il s'il franchit cette limite et que son jugement de qualité prévisionnelle fait un bond soudain ? Il existe une transition continue entre "rapide" et "lent" qui ne présente pas de limite naturelle, comme le montre ce graphique de l'erreur relative attendue d'une prévision en fonction de la valeur prévue (notez l'échelle logarithmique de l'abscisse et le fait que nous calculons l'erreur attendue à l'aide de l'estimateur ponctuel optimal, qui n'est pas la moyenne mais la médiane de la distribution de Poisson) :

forecasting-few-is-different-part-2-body-03

En raison de cette transition continue, nous recommandons une évaluation stratifiée par taux prédit, ce qui signifie que les prévisions sont regroupées en groupes de valeurs similaires et que les mesures d'erreur sont évaluées séparément pour chaque groupe. Notre précédent article de blog sur le biais de rétrospection explique pourquoi cette répartition doit être effectuée en fonction de la valeur prévue et non des ventes observées, même si cette dernière méthode semble plus naturelle que la première. Pour chacune de ces tranches, nous évaluons si la précision des prévisions est conforme à l'attente théorique (comme le montre le graphique ci-dessus) ou si elle s'en écarte de manière substantielle. Nos attentes à l'égard d'une prévision devraient dépendre du taux prévu : Pour des valeurs extrêmement faibles (inférieures à 0,69), la plupart des ventes réelles observées sont égales à 0, et nous sommes essentiellement "toujours complètement à côté de la plaque" avec une erreur de 100% - inévitablement. Pour un taux de vente prévu de 10, nous devrons nous accommoder d'une erreur relative effrayante de 25% - dans le meilleur des cas ! Lorsque nous prévoyons 100=10^2, nous nous attendons toujours à une erreur relative d'environ 8%, pour un taux de 1'000=10^3, l'erreur tombe à 2,5%. Demander, par exemple, un seuil d'erreur de 10% pour tous les taux de vente est donc contre-productif : La grande majorité des vendeurs lents ne respecteront pas ce seuil et mobiliseront des ressources pour savoir pourquoi "la prévision est erronée", tandis qu'une amélioration pourrait encore être possible pour les vendeurs rapides qui respectent le seuil et n'attirent donc pas l'attention.

Dans la pratique, l'écart par rapport à la ligne idéale que nous avons tracée ci-dessus dépendra de l'horizon de la prévision (est-ce pour demain ou pour l'année prochaine ?). et sur l'industrie (prévoyons-nous un produit d'épicerie non saisonnier bien connu ou une robe exquise non conventionnelle à la limite entre la mode et le mauvais goût ?) Néanmoins, la prise en compte de l'échelle non proportionnelle universelle de l'erreur de prévision est l'aspect le plus important que doit remplir votre méthode d'évaluation des prévisions !

Évitez le piège de l'échelle naïve, acceptez et gérez stratégiquement le bruit des vendeurs lents.

Outre l'inscription des visites de restaurants locaux sur la liste des choses à faire lors de vos prochaines vacances, quelles conclusions devriez-vous tirer de cet article de blog ?

Assurez-vous que l'échelle d'agrégation temporelle que vous définissez dans votre évaluation correspond à l'échelle de temps de la décision commerciale : Comme les fraises et les concombres de mer ne durent qu'une journée, ils sont planifiés pour une journée et une évaluation au niveau quotidien est appropriée. Vous ne pouvez pas compenser la demande de fraises d'aujourd'hui par les stocks excédentaires d'hier et vice-versa. Pour les articles qui durent plus longtemps, l'échelle à laquelle une erreur dans une décision commerciale se matérialise réellement n'est certainement pas un jour : Si une chemise n'a pas été achetée le lundi, elle le sera peut-être le mardi ou deux semaines plus tard - ce qui n'est pas important pour le stock de chemises commandé chaque mois. Si vous rencontrez dans votre évaluation de nombreux articles avec de petits nombres prévus (<5), vérifiez à nouveau qu'il s'agit bien de l'article pertinent, sur lequel une décision d'achat, de réapprovisionnement ou autre est prise.

Ne fixez pas d'objectifs constants en matière de précision des prévisions pour l'ensemble de votre portefeuille de produits, que ce soit en termes absolus ou relatifs : Vos vendeurs rapides atteindront facilement des erreurs relatives faibles, tandis que vos vendeurs lents auront apparemment du mal à le faire. Au lieu de cela, divisez vos prévisions en groupes de valeur similaire et évaluez chaque groupe séparément. Fixez un objectif réaliste, dépendant du taux de vente.

Pour les vendeurs lents, il est impératif d'être conscient de la nature probabiliste des prévisions et de tenir compte stratégiquement du bruit inévitable, que ce soit par le biais d'une heuristique de stocks de sécurité dans le cas d'articles non périssables, ou par des stratégies de production à la commande, par exemple pour les gâteaux de mariage.

Bien que l'inévitabilité de l'erreur de prévision chez les vendeurs lents puisse être irritante, il est encourageant de constater que les limites de la technologie de prévision peuvent être établies quantitativement de manière rigoureuse, de sorte que nous puissions en tenir compte stratégiquement dans nos décisions commerciales.