Les valeurs aberrantes sont des observations extrêmes qui diffèrent considérablement du reste des données. Par exemple, un achat unique de 1000 dollars peut être considéré comme inhabituel si la valeur moyenne des commandes est de 50 dollars. Si un utilisateur effectue 30 achats en un mois, cela peut également être considéré comme anormal lorsque le nombre moyen d’achats par client au cours de la même période est de 1,5.
Les valeurs aberrantes peuvent être la conséquence d’un comportement légitime de l’utilisateur et, bien qu’elles soient rares, elles peuvent avoir suffisamment de poids pour fausser les résultats d’un test.
Détection des valeurs aberrantes
Dynamic Yield détecte et traite deux types de valeurs aberrantes :
- Valeurs extrêmes des événements : s’applique à tous les événements ou objectifs ayant une valeur associée.
- Utilisateurs ayant un nombre extrême d’événements : appliqué à tous les événements ou objectifs (à partir du 1er juillet 2023).
Valeurs extrêmes des événements
Pour chaque événement ou objectif ayant une valeur (comme l’achat), le seuil de valeurs extrêmes est calculé sur la base de la moyenne et de l’écart-type de toutes les valeurs d’événements collectées au cours des 30 derniers jours. Le seuil est défini comme étant 3 écarts types au-dessus de la moyenne. Les valeurs des événements individuels qui dépassent le seuil sont remplacées par la valeur moyenne des événements inférieurs au seuil. Un nouveau seuil de valeurs aberrantes est calculé quotidiennement sur une période glissante de 30 jours et appliqué aux événements de la journée en cours. Le seuil n’est appliqué que s’il y a au moins 100 événements au cours des 30 derniers jours.
Utilisateurs ayant un nombre extrême d’événements
Pour chaque événement ou objectif, nous calculons un seuil de valeurs aberrantes basé sur le nombre d’événements par DYID au cours des 30 derniers jours. Nous ne prenons en compte que les DYID qui ont déclenché chaque événement plusieurs fois et nous appliquons une variante de la technique de détection des valeurs aberrantes DoubleMAD :
- Calculer le nombre médian d’événements par DYID.
- Calculer l’écart absolu par rapport à la médiane pour les DYID supérieurs à la médiane.
- Fixer le seuil à la médiane + 3 fois l’écart absolu par rapport à la médiane.
Tous les DYID qui ont déclenché plus d’événements que le seuil au cours des 30 derniers jours sont considérés comme des valeurs aberrantes pour le jour en cours, et leurs événements déclenchés le jour en cours sont exclus des rapports, de même que leur valeur. Supposons, par exemple, que :
- Un nouvel utilisateur commence à consulter le site et effectue un achat chaque jour.
- Le seuil de valeurs aberrantes pour l’événement d’achat est de 10.
Les valeurs de ce nouvel utilisateur seraient signalées comme aberrantes à partir du jour de son onzième achat, ce qui limiterait à 10 le nombre d’achats pris en compte dans les rapports.
Un nouveau seuil de valeurs aberrantes est calculé quotidiennement sur une période glissante de 30 jours et appliqué aux événements de la journée en cours. Le seuil n’est appliqué que s’il y a au moins 100 événements au cours des 30 derniers jours.
Valeurs aberrantes dans les rapports d’expérience
Par défaut, les rapports de tests A/B excluent les valeurs aberrantes, mais vous pouvez les inclure en vous rendant dans More Options (plus d’options) et en désactivant le commutateur Exclude Outliers (exclure les valeurs aberrantes).
Les deux types de valeurs aberrantes (les valeurs extrêmes des événements et les utilisateurs ayant un nombre extrême d’événements) sont exclus à l’aide du même sélecteur.
Toutes les données des rapports de tests A/B sont affectées par ce sélecteur, à l’exception du ciblage prédictif, qui est toujours calculé avec des résultats excluant les valeurs aberrantes.
Exportation des valeurs aberrantes : Journal des événements de recettes
Pour exporter un journal contenant tous les événements de revenus déclenchés par les utilisateurs dans le test A/B, cliquez sur Export en haut de la page du rapport d’expérience, puis sélectionnez Revenue event log (journal des événements de revenus). Cela inclut tous les événements contenant une valeur, indiquant si ces événements étaient aberrants ou non en fonction de l’une ou l’autre des méthodes de traitement des valeurs aberrantes. Le journal des événements de revenus est disponible pour tous les tests A/B (campagnes utilisant l’allocation de test A/B et comportant au moins 2 variations).