Introduction
En général, le but de faire des statistiques est de trouver un pattern parmi des observations. Ce pattern peut être utile pour prévoir
des événements ou pour corriger une situation.
Nous pouvons regrouper les outils Excel en 4 catégories :
-
Deux séries de données numériques sont utilisées :
- La première série concerne un facteur prévisible. Par exemple, les heures de la journée, le jour de la semaine.
- La seconde série est un facteur à prédire, mais qui dépend de la première série. Par exemple, le nombre de patients admis à l'urgence d'un hôpital.
- Nous devons trouver comment elles sont reliées. C'est le cas idéal car nous pouvons alors prédire les événements. Nous pouvons
utiliser des outils comme le coefficient de corrélation, la pente et l'ordonnée à l'origine. Par exemple, le nombre de patients admis à l'urgence d'un hôpital par rapport à l'heure de la journée.
- Dans ce cas, le graphique idéal sera le nuage de points, car il nous permet de visualiser les deux séries en deux dimensions.
- Le graphique en secteurs n'est pas approprié, car il représente bien une variable, mais pas deux.
- Le graphique en histogramme n'est pas approprié non plus, car il ne réordonne pas les données de façon croissante, il les distribue selon l'ordre d'apparition.
Deux séries de données sont utilisées : une série numérique et une série de catégories
- La série de catégories concerne un facteur prévisible. Par exemple, le diagnostic de chaque maladie des patients admis à l'urgence d'un hôpital.
- La série numérique est un facteur à prédire, mais qui dépend de la première série. Par exemple, le nombre de diagnostics des maladies précédentes.
- Nous devons trouver comment elles sont reliées. C'est le cas idéal car nous pouvons alors prédire les événements. Nous pouvons
utiliser des outils comme la moyenne pour chaque catégorie.
- Dans ce cas, le graphique idéal sera le graphique en histogramme, car il distribue les données numériques en ordonnée et les données par catégorie en abcisse.
Une seule série de données est utilisée. Par contre, si on se rend compte que cette série de données se centre autour d'une valeur,
on crée artificiellement une seconde série :
- La première série concerne nos observations à prédire.
- La seconde série est la fréquence de chaque observation.
- Ce n'est pas idéal, mais nous pouvons prédire les événements avec une certaine
probabilité. Nous pouvons utiliser la moyenne, l'écart-type et la loi normale. Pour ceux qui sont plus avancés, d'autres lois sont
disponibles (loi de Poisson, Khi-carré, loi de Student, loi Gamma, etc.)
- Dans ce cas, le graphique idéal sera le nuage de points, car il nous permet de visualiser la série de données en abcisse et la fréquence en ordonnée.
Une seule série de données est utilisée. De plus, si on se rend compte que cette série de données ne se centre pas
autour d'une valeur, mais qu'elle semble plutôt se distribuer aléatoirement, on ne peut faire que quelques fonctions comme la moyenne et l'écart-type.