Skip to main content

Source de données: Paiement du joueur de jeu DC pour le concours de prédiction

Adresse Web: http://t.cn/a67rujxo


Données d'emballage Il y a presque

229 Millions d'enregistrements et 109 domaines les domaines suivants sont des domaines plus importants.


: code utilisateur, identifiant d'utilisateur unique BD_Stronghold_level
]: 要, équivalent Au niveau du compte de jeu Wood_reduce_Value
: La quantité de consommation de bois
Stone_reduce_value : Consommation de la pierre
Ivory_reduce_value : Numéro de consommation d'ivoire
: Consommation de la viande
MAGIC_RECE_VALUE : Numéro de consommation magique







]: Nombre de consommation d'accélération générale
Building_accelanner_reduce_Value : Le bâtiment accélère la consommation

: La recherche augmente la demande de qualité


Former_accelanner_reduce_value

: creuserCréation de la demande de quantité

: Traitement de la consommation accélérée

: joueurs de joueurs
pve_bating_count ]: le nombre de joueurs ]
avg_online_minutes : Temps moyen en ligne : Consommation
: Consommation


Sac à selles

Situation de la distribution du temps d'inscription de l'utilisateur?

Paiements des utilisateurs (taux de paiement, arpu, arppu)? Quelle est la situation de paiement de chaque utilisateur de classe?

import numpy as npimport pandas as pdfrom pandas import read_csvfrom sklearn.cluster import KMeansimport matplotlib.pyplotas pltimport pylab as plfrom matplotlib.font_managerimport FontManager, FontPropertiespd.set_option('display.max_columns',None)#为了数据安全,copy一份数据df=df0#检查是否有空值print(df.isnull().any().any())#观察数据构成print(df.head()) Habitudes de consommation de l'utilisateur?


#以user_id为维度,删除重复数据,并查看用户总数df=df.drop_duplicates(subset='user_id')print('用户总数:',len(df['user_id']))→用户总数:2288007


1. Entrez des données

#首先将注册时间精确到天register_date=[]for i in df['register_time']: date=i[5:10] register_date.append(date)df['register_time']=register_date#计算每天的注册人数df_register=df.groupby('register_time').size()df_register.columns=['日期','注册人数']print(df_register)(可视化)plt.plot(df_register)plt.grid(True)pl.xticks(rotation=90)font=FontProperties(fname='/System/Library/Fonts/PingFang.ttc')plt.title('用户注册分布图',fontproperties=font)plt.show()


2. Données de nettoyage

3. Calculez la distribution du temps d'inscription de l'utilisateur #付费率(付费人数/活跃人数)df_pay_user=df[(df['pay_price']>0)]pay_rate=df_pay_user['user_id'].count()/df_active_user['user_id'].count()print('付费率:%.2f'%(pay_rate))#ARPU(总付费金额/活跃人数)arpu=df_pay_user['pay_price'].sum()/df_active_user['user_id'].count()print('ARPU:%.2f'%(arpu))#ARPPU(总付费金额/付费人数)arppu=df_pay_user['pay_price'].sum()/df_pay_user['user_id'].count()print('ARPPU:%.2f'%(arppu))


. le nombre enregistré d'utilisateurs ayant un grand pic le 19 février, une autre fois est aussi quelques petits sommets, vUn très court temps très court. On peut supposer que car le jeu lance un certain nombre d'activités de récompense ou des promotions de la société, les utilisateurs enregistrés ont augmenté.


4. Paiements des utilisateurs

(Taux de paiement, Arpu, ARPPU)

df_user=df['user_id','bd_stronghold_level','pay_price','pay_count']df_table=pd.pivot_table(df_user,index=['bd_stronghold_level'],values=['user_id','pay_price','pay_count'],aggfunc={'user_id':'count','pay_price':'sum','pay_count':'sum'})df_stronghold_pay=pd.DataFrame(df_table.to_records())#各等级付费人数df_stronghold_pay['pay_num']=df_user[(df_user['pay_price']>0)].groupby('bd_stronghold_level').user_id.count()#各等级付费转化率df_stronghold_pay['pay_rate']=df_stronghold_pay['pay_num']/df_stronghold_pay['user_id']#各等级平均付费金额df_stronghold_pay['avg_pay_price']=df_stronghold_pay['pay_price']/df_stronghold_pay['user_id']#各等级平均付费次数df_stronghold_pay['avg_pay_count']=df_stronghold_pay['pay_count']/df_stronghold_pay['user_id']#重命名列名df_stronghold_pay.columns=['要塞等级','总付费次数','总付费金额','总人数','付费人数','付费转化率','人均付费金额','人均付费次数']df_stronghold_pay=df_stronghold_pay['要塞等级','总人数','付费人数','付费转化率','总付费金额','人均付费金额','总付费次数','人均付费次数']df_stronghold_pay=df_stronghold_pay.round(2)print(df_stronghold_pay)

de la photo ci-dessus, On sait que l'ARPU de jeu mobile rentable actuel dépasse 5 yuans. En général, les jeux mobiles sont compris entre 3 et 5 yuans, bénéficiant de 3 yuans, Arpu du jeu est de 8,55 yuans,
montre que le bénéfice supérieur.

5. Paiement des utilisateurs de niveau différents

#要塞等级—付费转化率x=df_stronghold_pay['要塞等级']y=df_stronghold_pay['付费转化率']plt.xticks(x,range(0,len(x),1))plt.plot(x,y)plt.grid(True)plt.title('不同等级用户付费转化率',fontproperties=font)plt.show()


#要塞等级-人均付费金额x=df_stronghold_pay['要塞等级']y=df_stronghold_pay['人均付费金额']plt.xticks(x,range(0,len(x),1))plt.plot(x,y)plt.grid(True)plt.title('不同等级用户人均付费jine',fontproperties=font)plt.show()

x=df_stronghold_pay['要塞等级']y=df_stronghold_pay['人均付费金额']plt.xticks(x,range(0,len(x),1))plt.plot(x,y)plt.grid(True)plt.title('不同等级用户人均付费jine',fontproperties=font)plt.show()#要塞等级-人均付费次数x=df_stronghold_pay['要塞等级']y=df_stronghold_pay['人均付费次数']plt.xticks(x,range(0,len(x),1))plt.plot(x,y)plt.grid(True)plt.title('不同等级用户人均付费次数',fontproperties=font)plt.show()



. Lorsque le niveau utilisateur était à 10 ans, le taux de paiement de 60%. Lorsque le niveau est atteint 13, le taux de paiement est de près de 100% et le montant payé par habitant et le nombre de fois inclus dans l'utilisateur. Après 10 niveaux, il a grandi nHeureux, les utilisateurs peuvent donc identifier 10 utilisateurs ou plus. Mais observant la distribution au niveau de l'utilisateur, la plupart des utilisateurs sont toujours au niveau 10 ci-dessous, de sorte que comment utiliser les ménages à atteindre 10, c'est le problème de le jeu à utiliser ensuite. 6. Habitudes de consommation de différents joueurs Le jeu de dépôt principal est des accessoires (bois, pierre, ivoire, viande, magie) et coupons (en général, architecture, Recherche scientifique, formation, santé). Selon l'échelle de recharge des utilisateurs, la consommation de deux biens de consommation est analysée séparément. UTILISATEURS GÉNÉRALES ET DES JOUEURS HAUTEURS AVEC UNE GRANDE Consommation de bois, de roches et de viande et une consommation de magie plus petite, mais en consommation d'ivoire, les joueurs sont une consommation élevée et des joueurs réguliers ont une grande distance. de l'image ci-dessus, deux types de joueurs ont une faible consommation d'accéléromètre etLa consommation de coupons d'accélération générale est grande.Trois autres coupons d'accélération sont différents. 1. Le jeu a un grand nombre de basses utilisateur et de nouveaux utilisateurs enregistrés par des activités de jeu, une nouvelle version, etc.Les facteurs ont un impact plus important. 2. Arpu du jeu est de 8,55, montrant des jeux rentables plus rentables. 3. Après que le niveau utilisateur atteint 10, disposé à augmenter de manière significative et 13 sera de près de 100%.Mais la plupart des utilisateurs sont toujours au niveau 10 ci-dessous, à l'aide des utilisateurs pour augmenter le niveau 10 particulièrement important. 4. Les habitudes de consommation, les dents des acteurs de la consommation élevée et des coupons accélérés sont beaucoup plus utilisés que les acteurs courants.

Sujets

Catégories