«

»

Statistique à 2 variables

L’analyse statistique de 2 séries distinctes vous permet de trouver des connexions entre ces séries et ainsi d’affiner les résultats.

C’est le cas par exemple entre :

  • le salaire et l’âge des salariés
  • le temps d’utilisation d’une machine outil et le nombre d’unités produites
  • le chiffre d’affaire des ventes de glaces avec les relevés pluviométrie

Comment trouver la connexion entre ces séries ? Pour cela, il existe plusieurs fonctions dans Excel comme, COVARIANCE, COEFFICIENT.CORRELATION, DROITEREG ou encore TENDANCE.

COVARIANCE

La fonction COVAR retourne la covariance de 2 séries de données.

La covariance évalue le sens de variation de 2 variables et, ainsi, qualifie l’indépendance de ces variables. Deux autres fonctions calculent la covariance COVARIANCE.S (échantillon) ou COVARIANCE.P (Population entière).




COEFFICIENT.CORRELATION

Calculer le coefficient de corrélation entre 2 variables numériques revient à chercher la liaison qui existe entre les variables à l’aide d’une droite. Un coefficient de corrélation égal à 0 indique que les 2 séries sont indépendantes et inversement, un coefficient de corrélation proche de 1 indique une forte dépendance entre les 2 séries.

DROITEREG

La fonction DROITEREG, dans sa forme simple, renvoie les 2 valeurs qui constituent la droite de régression d’un nuage de points. Mais elle peut également vous renvoyer une analyse très détaillée des valeurs entre-elles.

Présentation

La fonction a besoin de 4 arguments

  • Votre série de donnée Y
  • Votre série de donnée X (obligatoirement dans cette ordre)
  • La prise en compte, ou non d’une constante (Vrai / Faux)
  • Afficher les résultats sous forme réduite (FAUX) ou étendue (VRAI)

Une droite a pour équation :

y = ax + b

La valeur de y est déterminée par un coefficient a multiplié à la valeur x auquel est ajouté un terme constant b.

La fonction DROITEREG vous calcule en même temps les coefficients a et b. Comme une seule fonction vous retourne plusieurs valeurs, il faut valider la fonction selon la méthode matricielle (Ctrl + Shift + Entrée)

Exemple de calcul de droite de régression dans sa forme réduite.

Pour déterminer les 2 paramètres de l’équation :

  1. Sélectionnez les deux cellules qui vont accueillir les résultats (les deux cellules doivent être contiguës et horizontales).
  2. Saisissez ensuite la formule =DROITEREG
  3. Sélectionnez la série de valeur correspondant à Y
  4. Sélectionnez la série de valeur correspondant à X.
  5. Saisissez la valeur VRAI (calcul de la constante)
  6. Saisissez la valeur FAUX (écriture réduite)
  7. Validez par la combinaison de touches Ctrl+Shift+Entrée




Le résultat donné en R2:S2 renvoit les paramètres de l’équation de la droite. A titre de vérification, la droite de tendance affichée dans le graphique donne exactement le même résultat comme vous pouvez le visualiser dans la figure 8.1.9.3.3.2-1.

Exemple de calcul de droite de régression dans sa forme étendue

La même fonction peut aussi calculer d’autres paramètres statistiques plus poussés, comme le coefficient de détermination, la valeur d’erreur, …). Pour afficher ces paramètres, vous devez mettre le quatrième paramètre à VRAI.

Les paramètres statistiques sont les suivants :

Statistique Description
se1,se2,…,sen Les valeurs d’erreur type correspondant aux coefficients m1,m2,…,mn.
seb La valeur d’erreur type correspondant à la constante b (seb = #N/A si l’argument constante a la valeur FAUX).
r2 Le coefficient de détermination compare les valeurs y estimées aux valeurs y réelles et varie entre 0 et 1. Un coefficient de détermination égal à 1 indique une corrélation parfaite de l’échantillon (aucune différence entre les valeurs y estimées et réelles). A l’inverse, un coefficient de détermination égal à 0 (zéro) indique que l’équation de régression ne peut servir à prévoir une valeur y. Pour plus d’informations sur le mode de calcul de r2, consultez la section “ Notes “, plus loin dans cette rubrique.
sey L’erreur type pour la valeur y estimée.
F La statistique F ou valeur F observée. Utilisez ce paramètre pour déterminer si la relation observée entre les variables dépendantes et indépendantes est due au hasard.
df Les degrés de liberté. Ils vous aident à trouver les valeurs critiques de la statistique F dans une table statistique. Comparez les valeurs trouvées dans la table à la statistique F renvoyée par la fonction DROITEREG pour déterminer le niveau de confiance du modèle.
ssreg La somme de régression des carrés.
ssresid La somme résiduelle des carrés. Pour plus d’informations sur le mode de calcul de ssreg et de ssresid, consultez les “ Notes “ plus loin dans cette rubrique.

 




Tendance

La fonction TENDANCE vous permet de trouver la valeur d’un élément qui suit la tendance d’une droite de régression.

La fonction TENDANCE a besoin de 4 arguments

  • La série des données Y
  • La série des données X
  • La valeur de X
  • La constante (VRAI ou FAUX)

Pour déterminer le nombre d’unité nous estimons produire si nous faisons fonctionner notre machine pendant 8 heures, nous allons écrire la fonction suivante.

= TENDANCE (B2:O2,B1:O1,B5,1) => 168,46

Nous pouvons estimer produire 168 unités si nous laissons notre machine tourner pendant 8 heures.




Lien Permanent pour cet article : https://www.excel-exercice.com/statistique-a-2-variables/

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *