Chapitres
1. Les tris à plat
a. Variables qualitatives, fermées ou nominales :
- Effectiffs : le nombre de réponses le plus important à une question
- Pourcentage : le taux de réponses ou de non réponses à une question
- Mode : la variable qui a l'effectif le plus élevé
b. Variables quantitatives numériques ou métriques :
- Mode : la variable qui a l'effectif le plus élevé
- Moyenne : le rapport entre la somme des valeurs et le nombre de valeurs
- Médiane : la valeur qui sépare l'effectif en deux
- Etendue ou intervalle de variation : la différence entre la donnée la plus grande et la plus petite
- Variance : la moyenne des carrés des écarts à la moyenne
- Ecart-type : la dispersion entre les séries. Il mesure l'écart par rapport à la moyenne
Variance = 1/n ∑ mi (xi - x)2
x correspond à la moyenne ∑ correspond à la somme n correspond au total
Valeurs | xi | mi | xi - x | (xi - x)2 | mi(xi - x)2 |
Ecart-type = racine carrée de la variance
c. L'analyse univariée
- Le χ² (khi-deux)
Données | χ² observé | χ² théorique | (observé - théorique)2 | (observé - théorique)2 / théorique |
Khi-deux observé :
χ² obs = Ʃ ( effectif théorique – effectif observé) 2
effectif théorique
Comparaison du χ² obs avec le χ² th. Le χ² théorique dépend de la taille du tableau et du seuil d'erreur (généralement de 5%)
Taille du tableau = degré de liberté = (nombre de colonnes - 1) x (nombre de lignes - 1)
Khi-deux théorique :
Pour connaître le khi-deux théorique on regarde dans la table statistique du khi-deux
(en colonne : le seuil d'erreur en ligne : le degré de liberté)
Le khi-deux théorique est la différence acceptable entre les deux tableaux compte tenu du seuil d'erreur et de la taille du tableau.
Si :
χ² obs < χ² th alors il n'y a pas de lien
χ² obs > χ² th alors il y a un lien
2. Les tris croisés
a. Liaison entre 2 variables métriques
- Coefficient de corrélation : il permet de savoir s'il y a un lien entre les deux valeurs
- Coefficient de détermination
- Droite de régression
x (valeur explicative) | y (valeur expliquée) | xi - X | yi - Y | (xi - X) (yi - Y) | (xi - X)2 | (yi - Y)2 |
Y et X correspondent à la moyenne
Coefficient de corrélation = (xi - X) (yi - Y)
Racine carrée ∑ (xi - X)2 ∑ (yi - Y)2
Il faut trouver un résultat entre -1 et 1
Coefficient de détermination = (coefficient de corrélation)2
Le coefficient de détermination = le % expliqué à la varibale explicative
La droite de régression : y = ax + b (équation d'une droite)
Elle va passer par le point moyen donc : Y (moyenne de y) = aX (moyenne de x) + b
b = Y - aX
n = nombre d'observation (nombre de lignes)
a = ∑ (xi - yi) - n (XY)
∑ xi2 - n (X)2
x (valeur explicative) | y (valeur expliquée) | xi yi | xi2 |
b. Liaison entre une variable métrique et une variable nominale
- Dispersion totale des données (DSPT)
- Dispersion factorielle (DISPF)
- Dispersion résiduelle (DISPR)
- Variance factorielle
- Variance résiduelle
- Fisher
Dispersion totale des données = somme des carrés = carré de la somme / n
Dispersion totale des données (DSPT) = dispersion factorielle (DSPF) + dispersion résiduelle (DSPR)
Dispersion factorielle = moyenne des carrés des ∑ - carré de la ∑ / n
Dispersion résiduelle = somme des carrés - moyenne des carrés des ∑
Variance factorielle : VF = DISPF / k - 1
Variance résiduelle : VR = DISPR / n - 1
Fisher = VF / VR
Lecture dans la table : v1 (colonnes) = (k - 1) et v2 (lignes) = (n - k). Le chiffre dans la table qui correspond à l'intersection de v1 et v2 correspond au seuil où il y a dépendance ou non.
Si vous désirez une aide personnalisée, contactez dès maintenant l’un de nos professeurs !