MySQL user retention and day to day |
- No disposa de taules de pivotació ( per transposar les dates a columnes tal com es veu a la imatge)
- No disposa de funcions analítiques.
- No disposa de generadors de dates ( ni tans sols generadors d'enters )
- No disposa de CTE per poder trencar la consulta en consultes més fàcils.
Amb tot això aquesta és la solució proposada i les dades resultants:
- Subqueries de subqueries.
- Passar format datetime a date com string.
- Generador d'enters fet a mà
el cas és que la select funciona i obté els resultats desitjats.
Però la gràcia de l'indicador és que serveixi per ajudar a prendre millors decissions. Això no és senzill de fer sense una bona visualització dels resultats. Mitjançant un petit programet python he generat resultats aleatòris per disposar d'una mostra més àmplia que serveixi d'exemple de visualització, i aquí la tenim:
Assenyalat en vermell els diumenges. Cada dada deixa una estela que va decrementant-se. El punt més elevat representa el número de persónes que ha utlitzat el suposat servei i, l'estela, serien les persones que han repetit l'experiència el dia posterior, dos dies més tart i així fins a 7 dies, tal com demanava l'autor de la pregunta.
Una altre visualització de les mateixes dades, intercanviant fileres per columnes, seria aquesta:
Veiem per exemple que el dia 21 de juliol s'hi van connectar 486 persones, d'aquestes, el dia 22, es van tornar a connectar la majoria, no totes, i així seguiriem l'estela fins arribar a 7 dies més tart on veiem que van fer 'retention' unes 75.
Aquí el codi del programa pyton que genera les dades aleatòries:
from datetime import date, timedelta
import random
dia = date.today()
for n in range(50):
dia = dia - timedelta( days = 1 )
inicial = random.randint( 300, 500 )
print ( dia, dia, 0, inicial, sep=",")
for r in range( 1, 8 ):
resta = random.randint( 20, 100 )
inicial -= resta
if inicial > 0:
print ( dia, dia - timedelta( days = r ), r, inicial, sep="," )
Cap comentari:
Publica un comentari a l'entrada