Skip to main content

À cette époque sur Internet, il y avait une guerre dans des endroits où les données. Une bataille, quelqu'un est allé au drapeau du rocher et certaines personnes ont cassé Chen Cang. Sur le champ de bataille de grandes données, tout le monde est épuisé et tous les types d'attaques de l'aile, juste sans «trois corps» in vitro civilisations, des objets tridimensionnels ont atteint trois objets dans la direction de l'espace en deux dimensions. En fait, nous Utilisez de nombreux modèles statistiques pour créer des données, puis les temps d'arrêt tridimensionnels seront encore évalués pour offrir de nombreuses critiques. Le jardinier est à cette époque, l'intention d'enregistrer une attaque sur la voiture en fonction de l'indice de tarif et des lecteurs.


Brève introduction d'un historique réel. L'industrie Internet est une industrie rapide et industrielle, tandis qu'un grand nombre de nouveaux produits sont en ligne et que les anciens processus de rénovation de produits impliquant un test important (test A / B. Test A / B est vraiment un test de contrôle.Le plus simple aléatoire, cette idée est d'afficher différentes versions de site Web de différents visiteurs, puis comparez la différence entre les versions. C'est une évaluation des objectifs et concis, mais c'est aussi un innombrable piège.

A / B Consultancy Consultancy du site de commerce électronique du propriétaire est responsable de la réponse à de nombreux esprits antiques différents. Un jour, certaines personnes ont traversé et ont demandé: "Hé, récemment, nous voulons voir le prix des expériences pour les choses vendues sur le site, il y a une erreur, je ne l'ai pas trouvé." Attendez, ne sais pas que vous ne pouvez pas étudier? Avez-vous des mots?


Vous ne pouvez pas dire un programmeur: votre code a une erreur. Sa première réaction est la suivante: 1, votre environnement a un problème; 2, est-ce stupide que vous utiliserez? Si vous êtes impatient: votre programme ne convient légèrement pas adapté aux attentes, vous verrez s'il y a un problème avec mon utilisation. Son instinct pensera: exercice, trouJE!

La surface principale du jardin calme. Après les cheveux, après le consultant, j'ai vérifié le dragon à parcourir, c'était vraiment une histoire. Cette erreur n'est pas très compliquée, en fait, dans l'expérience A / B, le prix moyen de tous les biens achetés par le groupe expérimental et le groupe de contrôle de l'utilisateur. Il ne semble pas être un nombre moyen et moins, ce qui ne va pas? Du point de vue du propriétaire, il existe trois questions importantes pour faire attention à chacun des éléments suivants.


Problème 1:

La signification la plus importante des expériences randomisées consiste à utiliser une allocation aléatoire pour supprimer la déviation de sélection entre le groupe de test et l'équipe de contrôle. Assurez-vous que vous êtes une comparaison équitable. Dans chaque expérience aléatoire, nous choisirons une unité pour aléater au hasard. Dans cet exemple, nous sommes attribués au hasard un site Web visiteurs, puis nous mesurons les observations des visiteurs moyens (Note::::: 注: 注 注 Seulement des personnes DAvoir des actes d'achat moyens, il peut être inclus dans la déviation de sélection (acheter ou non, il sera affecté par des expériences).


Question 2: Traitement des valeurs extrêmes
Parce que le comportement de l'utilisateur est talentueux, afin de réduire la variance pour améliorer l'efficacité estimée, nous gérons généralement des valeurs extrêmes dans les résultats. (Supprimé les données définies directement ou lui confère une limite ci-dessus, c'est-à-dire la fermeture du couvercle). Ces traitements peuvent également veiller à ce que la convergence soit extrêmement définie - les données comportementales de l'utilisateur d'Internet ont une distribution plus exceptionnelle, ce qui signifie la limite des chapeaux de distribution numérique (définis dans les wikis, définis dans les wikis). La limite ultra-centrale et la bootstrap peuvent échouer. Si nous ne mesurons pas la queue, l'artificiel crée une méthode de traitement simple pour assurer le temps de deux commandes.

Question 3: Le temps de comportement de l'utilisateur est auto-concentration

Trop d'hypothèses sont distribuées de donnéesAmniotique indépendant (i.i.d). Nous comprenons une compréhension du comportement des utilisateurs, souvent supposé que l'indépendance du comportement indépendant (au hasard, nous nous efforçons de veiller à ce que les deux groupes n'ont aucun impact, mais également de garantir que non des effets de débordement importants entre les unités de chaque groupe). Le comportement de l'utilisateur n'est pas indépendant (évidemment une personne qui a acheté un iPhone la semaine dernière, cette semaine a été capable d'acheter des coquillages iPhone, si les utilisateurs n'ont pas de mémoire pour le passé, l'algorithme proposé de l'histoire de l'achat n'a pas à le faire..).


Après avoir écouté cette pile, si vous devez toujours regarder patiemment, vous serez une connaissance forte et célèbre. Eh bien, nous avons des problèmes, il n'y a aucune difficulté à créer des difficultés. Aléatoire n'est que la première étape de mars. Le problème est clair, nous pouvons commencer à agrandir les astuces et à réduire les attaques. Nous espérons trouver un moyen de savoir presque aucun paramètre, simple et plus efficace?

À l'exercice tactique, tout le monde a dit et recueilli les stratégies suivantes.


Chaussures d'enfants A: Prix moyen direct de chaque client, ce qui signifie que le prix moyen de toutes les données de vente est calculé directement au niveau de l'utilisateur. Pour ceux qui n'ont pas encore acheté quelque chose, ils attribuent directement une valeur Et le nombre total d'utilisateurs est toujours tous les visiteurs. Ensuite, nous pouvons prendre des tests T.
] Chaussures pour enfants B: Je pense que cela n'a pas raison. Ceux qui n'achètent pas les choses ne peuvent pas être simplifiés 0. Imaginez qu'un seul article sur notre site Web, le prix est de 1000 téléphones mobiles. Le groupe expérimental a été témoin de la magnifique image de PS et de l'équipe de contrôle a été témoin de «ID ID» enregistré par le ministère de l'industrie et de la technologie de l'information.
Après cela, l'utilisateur de l'équipe de test et le groupe de contrôle sont arrivés à son tour et que le groupe de test a été acheté à 10% et seulement 5% du groupe de contrôle acheté. AprèsIl est clair que nous savons que des expériences ne peuvent avoir aucun impact sur les prix des produits de base. Cela ne peut être que la probabilité que les gens n'achètent pas. Si vous spécifiez une personne qui n'a rien à devenir 0, alors, enfin, vous pouvez obtenir une erreur de conclusion qui double le prix des marchandises en fonction des prix des produits de base, trompant ainsi l'équipe de développement ou les décideurs. Je pense donc que cela ne peut que comparer les utilisateurs avec un comportement d'achat.

Résumé: Comment identifier les ensembles de données d'observation

Chaussures d'enfants C: Je pense que b indique que cela signifie, mais le prix d'achat moyen de chaque client existe des problèmes. Une telle définition est similaire aux "tarifs d'invités", reflétant l'impact de l'expérience de la disponibilité de la puissance de consommation des utilisateurs et des prix de négociation moyenne pour nous qu'il y a beaucoup de rangées moins chères que je vends plus. Si tel est le cas, il peut être vendu, mais les ventes totales ne changeront pas grand chose et si le rapport Remake peut être assisté.Les fourmis, un grand nombre de travaux après-vente peuvent être attendus.


Résumé: Comment identifier un indicateur

Chaussures pour enfants D: J'accepte essentiellement des points C, mais si nous comparons Directement si le prix de l'unité de prix, le traitement des valeurs extrêmes sera plus difficile. Si quelqu'un vient d'avoir acheté 100 morceaux de gomme, il gagnera beaucoup de prix moyens. Mais ces clients peuvent acheter dans le groupe de tests et l'équipe de contrôle, son comportement n'a pas à voir avec l'expérience. Par conséquent, nous devrions chercher à éliminer les écarts de ces exemples extrêmes.


Résumé: Comment contrôler des valeurs extrêmes.

Chaussures pour enfants E: Oui, en plus des valeurs extrêmes, avez le temps du comportement des utilisateurs. Nous pouvons envisager de réduire les variations auto-pertinentes de manière à partager des données.


Résumé: Comment contrôler le temps d'autocorrélation.
Voir notre stratégie préliminaire.

Le premier problème réel dans un cas particulier, nous n'avons pas le temps de faire du buffet structurel (modèles de structure) (vraiment peur des ennuis, pour cette femme à l'intérieur de la ville natale, plus de problèmes). Cette approximation simple est quand une expérience peut affecter plusieurs étapes ou liens, nous avons décomposé chaque étape (vous pouvez ajouter un test aux hypothèses indépendantes entre chaque étape).


Après la décomposition, nous pouvons le faire au lieu de pas à pas. De cette manière, nous devons d'abord faire pour déterminer le prix moyen de cet indicateur: ce n'est pas un indicateur inconditionnel. Au lieu de cela, il ne peut être déterminé que sur la vente. Voici les vues sur les chaussures pour enfants B. Si vous avez terminé, je me fiche de ce qui s'est passé à l'avant, sur la base de ce qui s'est passé devant, je suis intéressé par les expériences de l'effet Tonic Sung pour un impact supplémentaire sur les prix des produits de base. Cependant, quand les chaussures de trSon C indique, nous voulons toujours connaître le prix au lieu du changement de consommation, il est donc nécessaire d'utiliser des ventes comme une installation moyenne.

Évidemment, tels que les chaussures d'enfants, il a déclaré que pour vérifier les problèmes liés aux utilisateurs auto-liés mentionnés par la difficulté de s'échapper. Étant donné que le différentiel principal est la variance alternative, nous pouvons ajouter une variance pour le niveau utilisateur. Si l'utilisateur a acheté de nombreux articles, nous pouvons ajouter le coût total de l'utilisateur et le nombre total de marchandises achetées. Par conséquent, pour lui, le prix moyen de la cargaison est vraiment le coût total / achat total. De cette manière, le prix des marchandises devient plus d'un des deux autres indicateurs, il peut être interprété comme un indicateur de rapport général (données de rapport, vitesse de commutation simple, etc.), peut également réécrire le poids moyen.


Pour l'indicateur de vitesse, l'effet moyen peut être calculé directement et estime sa variance sans une solution claire et parlée.Général à travers Taylor pour lancer la solution approximative de la méthode Delta ... (voir: TaylorappdeltametHodHod.pdf, la deuxième page de la deuxième formule).

De cette manière, nous avons résolu un problème et des problèmes sur une flèche. Pour les questions 2, des valeurs extrêmes ne sont pas traitées, tant que nous nous assurons que certaines approches peuvent limiter la distribution dans un espace limité, nous pouvons être assurés que le Centre extrêmement limité et ne s'intéresse pas à cet indice de ratio. C'est une distribution (s'il n'y a pas besoin de sacrifier les modèles de paramètres).


Donc, ici, nous pouvons jouer un espace fantastique, puis la mettre aux données réelles pour la déterminer le plus possible. Briques de porte-ménage:

Toutes ne font pas ... (aussi une valeur de référence).

Le prix moyen est affecté par le prix extrêmement élevé d'un article, nous devrions donc avoir un prix unique sur un produit est la limite ci-dessus (limite inférieure à 0), puis il arrive au niveau de la charité de niveauNg.

L'origine des valeurs extrêmes est extrêmement utilisatrice, donc après le niveau utilisateur, la limite supérieure est définie à la vente et aux ventes, puis calculez directement l'efficacité moyenne et calculez la méthode Delta de différence.

Les utilisateurs peuvent avoir des comportements d'achat qui ne sont pas affectés par le test (par exemple, il a toujours acheté 100 gommes à effacer), mais il a acheté d'autres choses qui pourraient être affectées par les tests de tests (par exemple, il a également acheté un 200- pièce ordinateur). Nous devons nous inquiéter que l'achat d'un grand produit acheté par d'autres achats auprès du même utilisateur. Vous pouvez donc définir la limite ci-dessus sur le volume des ventes au niveau de la cargaison, vous pouvez ajouter le niveau utilisateur.

Nous pouvons gérer les prix moyens des produits de base comme moyenne pondérée (ventes pondérées avec des ventes), donc si nous avons des prix élevés, nous devons simplement le réduire pour le réduire .. Nous devons donc calculer le prix moyen et le montant de l'achat de chaque client, puis placez les préceptesLe terme ci-dessus pour les prix et les achats de produits de base, puis calculez l'effet et la variance moyens.


Pour des moyens subtils de gérer différentes valeurs extrêmes, le propriétaire ne peut dire que les données sont dites. Selon le processus de création de données, les méthodes ci-dessus sont vraiment équivalentes les unes aux autres.

Ici, nous identifions les indicateurs, puis prenons des mesures pour les données aggamiques et gérer des valeurs extrêmes. Cependant, il s'agit de la prémisse que nous nous soucions de l'effet expérimental moyen. Il existe une distance entre la distribution du groupe expérimental et le groupe témoin, mais parce que la première queue se compense l'une pour l'autre, la valeur moyenne ne voit pas la distance? De plus, le traitement des valeurs extrêmes est due au nombre moyen affecté par des valeurs extrêmes et si nous ne calculons pas la moyenne, il n'existe pas de telle personne intentionnelle pour définir les limites ci-dessus.


La prochaine étape, le jardinier introduit un test statistique standard- Test RankWilcoxon. Il peut être ajouté par T-Test pour nous aider à vérifier l'erreur.

Queue

Il existe également un problème dans notre travail réel, car ces problèmes ciblent non seulement l'indicateur de taux, alors écoutez ici.


Utilisation des informations de l'utilisateur en groupes (ou couches, stratification)


afin de réduire les estimations de la variance de l'information (simple, introduisez des variables de contrôle Dans l'équation de régression, peut également surmonter les trames linéaires de la liaison ou des baies). La classification est très pratique par rapport à l'introduction de variables continues, mais l'incident apportera des problèmes appropriés.


Problème 5

Comparaison de comparaison) Lorsque nous sommes mesurés en plusieurs métriques, il peut y avoir de nombreux problèmes comparatifs. Cependant, il peut ne pas être indépendant entre chaque indicateur. Par exemple, dans Ce cas, si nous effectuons des ventes, des ventes et des chèques de prix moyens, nous devonsRéglage de P-Vaue?
Le problème de six
Effets relatives et effets absolus (effets relatives, nous appelons souvent des ascenseurs) Les effets simples et absolus sont le groupe de test et La différence de groupe de contrôle absolu est le pourcentage du groupe de test à augmenter dans le groupe témoin. Le calcul des deux n'est pas le même.


Sujets