Fonctions statistiques

Statistiques sur une variable

NB = Nombre de valeurs numériques dans une liste.
NBVAL = Nombre de données non vides dans une liste.
MEDIANE = valeur du milieu
MOYENNE = moyenne arithmétique des nombres.
AVERAGEA = moyenne arithmétique des nombres, textes et booléens.
MAX
MIN
NB.SI = Nombre conditionnel (1 condition) de valeurs numériques.
NB.SI.ENS = Nombre conditionnel (plusieurs conditions) de valeurs numériques.
MOYENNE.SI = Moyenne conditionnelle (1 condition).
MOYENNE.SI.ENS = Moyenne conditionnelle (plusieurs conditions).
VAR.P = variance (écarts par rapport à la moyenne).

Statistiques sur 2 variables

Statistiques sur une variable avec fréquence

Loi Normale donne la probabilité d'avoir exactement une valeur (densité) ou d'avoir une valeur ou moins (cumulatif).

Introduction

En général, le but de faire des statistiques est de trouver un pattern parmi des observations. Ce pattern peut être utile pour prévoir des événements ou pour corriger une situation.

Nous pouvons regrouper les outils Excel en 4 catégories :

Deux séries de données numériques sont utilisées :
- La première série concerne un facteur prévisible. Par exemple, les heures de la journée, le jour de la semaine.
- La seconde série est un facteur à prédire, mais qui dépend de la première série. Par exemple, le nombre de patients admis à l'urgence d'un hôpital.
- Nous devons trouver comment elles sont reliées. C'est le cas idéal car nous pouvons alors prédire les événements. Nous pouvons utiliser des outils comme le coefficient de corrélation, la pente et l'ordonnée à l'origine. Par exemple, le nombre de patients admis à l'urgence d'un hôpital par rapport à l'heure de la journée.
- Dans ce cas, le graphique idéal sera le nuage de points, car il nous permet de visualiser les deux séries en deux dimensions.
- Le graphique en secteurs n'est pas approprié, car il représente bien une variable, mais pas deux.
- Le graphique en histogramme n'est pas approprié non plus, car il ne réordonne pas les données de façon croissante, il les distribue selon l'ordre d'apparition.

Deux séries de données sont utilisées : une série numérique et une série de catégories
- La série de catégories concerne un facteur prévisible. Par exemple, le diagnostic de chaque maladie des patients admis à l'urgence d'un hôpital.
- La série numérique est un facteur à prédire, mais qui dépend de la première série. Par exemple, le nombre de diagnostics des maladies précédentes.
- Nous devons trouver comment elles sont reliées. C'est le cas idéal car nous pouvons alors prédire les événements. Nous pouvons utiliser des outils comme la moyenne pour chaque catégorie.
- Dans ce cas, le graphique idéal sera le graphique en histogramme, car il distribue les données numériques en ordonnée et les données par catégorie en abcisse.

Une seule série de données est utilisée. Par contre, si on se rend compte que cette série de données se centre autour d'une valeur, on crée artificiellement une seconde série :
- La première série concerne nos observations à prédire.
- La seconde série est la fréquence de chaque observation.
- Ce n'est pas idéal, mais nous pouvons prédire les événements avec une certaine probabilité. Nous pouvons utiliser la moyenne, l'écart-type et la loi normale. Pour ceux qui sont plus avancés, d'autres lois sont disponibles (loi de Poisson, Khi-carré, loi de Student, loi Gamma, etc.)
- Dans ce cas, le graphique idéal sera le nuage de points, car il nous permet de visualiser la série de données en abcisse et la fréquence en ordonnée.

Une seule série de données est utilisée. De plus, si on se rend compte que cette série de données ne se centre pas autour d'une valeur, mais qu'elle semble plutôt se distribuer aléatoirement, on ne peut faire que quelques fonctions comme la moyenne et l'écart-type.

Fonctions statistiques

Fonctions statistiques

Statistiques sur une variable

Statistiques sur 2 variables

Statistiques sur une variable avec fréquence

Utilisation

Introduction

Deux séries de données numériques sont utilisées :

Deux séries de données sont utilisées : une série numérique et une série de catégories

Une seule série de données est utilisée. Par contre, si on se rend compte que cette série de données se centre autour d'une valeur, on crée artificiellement une seconde série :

Une seule série de données est utilisée. De plus, si on se rend compte que cette série de données ne se centre pas autour d'une valeur, mais qu'elle semble plutôt se distribuer aléatoirement, on ne peut faire que quelques fonctions comme la moyenne et l'écart-type.

Exemples

0- Introduction

1- Une série aléatoire

2- Une série aléatoire avec calcul de moyenne

3- Une catégorie et une série

4- Une catégorie avec une série en progression

5- Une catégorie avec une série en progression continue

6- Une catégorie avec une série en progression discontinue

7- Optimisation

8- Pareto

9- Loi Normale

10- Loi Normale groupée