La mucoviscidose

Naviguer dans le site:

Aller plus loin

III/ L'application du modèle d'Hardy-Weinberg à la mucoviscidose

Introduction

Notre but, dans cette partie, sera de comparer les valeurs théoriques des fréquences génotypiques obtenues à l'aide du modèle d'Hardy-Weinberg et les valeurs réelles de ces fréquences.

Ainsi, nous commencerons par calculer les valeurs réelles à partir de différentes données, puis à l'aide d'un programme nous calculerons les valeurs théoriques à l'aide de l'équilibre de Hardy-Weinberg.

  1. A/Calcul des valeurs réelles
  2. B/Calcul des valeurs théoriques
  3. C/Comparaison de ces valeurs

1/ Principe du calcul

Afin de calculer les valeurs réelles de la fréquence de chaque allèle dans le monde, nous allons d'abord calculer la fréquence de chaque génotype, soit respectivement celles de la population saine, de la population porteuse saine et de la population malade. Cela est faisable en ayant pour données la fréquence de la population malade et celle de la population hétérozygote, en appliquant la formule suivante: fqSaine = 1 - (fqMalade + fqPorteuseSaine).


Lorsque cela est fait, on peut calculer les fréquences alléliques par la formule suivante: fqA = fqAA + 1/2 * fqAB et fqB = fqBB + 1/2fqAB avec A et B deux allèles d'un même gène. On obtient alors les valeurs réelles de chaque fréquence allélique et de chaque génotype.

2/ Application

a/Population caucasienne

    Données

  • Fréquence de la population malade : 1/3500 = 0.000286
  • Fréquence de la population porteuse saine : 1/25 = 0.040000
  • On applique la formule pour obtenir la fréquence de la population saine : fqSaine = 1 - (1/3500 + 1/25) = 3359/3500 = 0.959714

On obtient alors respectivement :

  • La fréquence du gène sain : 3359/3500 + 1/50 = 3429/3500 = 0.979714
  • La fréquence du gène malade : 1/3500 + 1/50 = 71/3500 = 0.020286

b/ Population du Moyen-Orient

    Données

  • Fréquence de la population malade : 1/4400 = 0.000227
  • Fréquence de la population porteuse saine : 1/33 = 0.030303
  • La fréquence de la population saine est donc : fqSaine = 1 - (1/4400 + 1/33) = 12797/13200 = 0.969470

On obtient alors les valeurs suivantes :

  • Le gène sain a pour fréquence : 12797/13200 + 1/66 = 12997/13200 = 0.984621
  • Le gène malade a pour fréquence : 3/13200 + 1/66 = 203/13200 = 0.015379

c/ Population asiatique

    Données

  • Fréquence de la population malade : 1/32400 = 0.000030
  • Fréquence de la population porteuse saine : 1/90 = 0.011111
  • Calcul de la fréquence de la population saine : fqSaine = 1 - (1/32400 + 1/90) = 32039/32400 = 0.988858

On peut maintenant calculer toutes les fréquences alléliques:

  • Fréquence du gène sain : 32039/32400 + 1/180 = 32219/32400 = 0.994414
  • Fréquence du gène malade : 1/32400 + 1/180 = 181/32400 = 0.005586

d/ Population hispanique

    Données

  • Fréquence de la population malade : 1/8500 = 0.000118
  • Fréquence de la population porteuse saine : 1/46 = 0.021739
  • On calcule maintenant la fréquence de la population saine : fqSaine = 1 - (1/8500 + 1/46) = 191227/195500 = 0.978143

On obtient donc en appliquant la formule:

  • Fréquence du gène sain : 191227/195500 + 1/92 = 48338/48875 = 0.989013
  • Fréquence du gène malade : 1/8500 + 1/92 = 537/48875 = 0.010987

e/ Population noire

    Données

  • Fréquence de la population malade: 1/20000 = 0.000050
  • Fréquence de la population porteuse saine : 1/70 = 0.014285
  • D'après ces données, la fréquence de la population saine est : fqSaine = 1 - (1/20000 + 1/70) = 137993/140000 = 0.985664

On peut donc calculer :

  • Fréquence du gène sain : 137993/140000 + 1/140 = 138993/140000 = 0.992807
  • Fréquence du gène malade : 1/20000 + 1/140 = 1007/140000 = 0.007193

Nous avons maintenant calculer toutes les valeurs réelles, qui nous serviront elles-mêmes à appliquer la loi d'Hardy-Weinberg, et à comparer ainsi les valeurs réelles et théoriques

1/Hypothèses

Avant de pouvoir appliquer la loi d'Hardy-Weinberg à la mucoviscidose, il faut vérifier que les hypothèses du modèle sont appliquables à cette maladie génétique. Comme vu précedemment, en effet, l'équilibre d'Hardy-Weinberg possède un certain nombre d'hypothèses à vérifier avant de pouvoir appliquer le modèle.

  • Ainsi, il faut une population importante pour pouvoir vérifier l'hypothèse des grands nombres. Ici, on étudie l'ensemble de la population malade et saine. Donc la loi des grands nombres est forcément vérifiée.
  • L'espèce doit ici être diploïde, ce qui est le cas de l'homme
  • L'espèce ne doit pas migrer: malheureusement, et en particulier dans le monde d'aujourd'hui, l'espèce humaine est capable d'énormément bouger, donc cette hypothèse n'est pas vérifiée.
  • La panmixie n'est pas non plus vérifiée, l'homme étant doté d'une volonté propre, il est capable de choisir, comme les autres mammifères, avec qui s'accoupler, il n'y a donc pas panmixie. Cette hypothèse n'est pas non plus vérifiée.
  • Le gène est toujours susceptible de subir des mutations, qui peuvent ou non être silencieuses. Encore une hypotèse qui n'est pas vérifiée.
  • Enfin, l'espèce observée a une reproduction sexuée: cela est vérifié, la population humaine se reproduisant entre individus.

2/ Calcul des valeurs théoriques

À gauche de ce texte, vous pouvez trouver un calculateur, qui s'occupera, en fonction de la population choisie, d'afficher directement les fréquences alléliques et génotypiques en appliquant bêtement le modèle d'Hardy-Weinberg.

Lorsqu'on choisit une population, les valeurs réelles des fréquences alléliques que l'on a précédemment calculées s'affichent directement dans les deux premières cases, et le programme s'occupe de calculer les fréquences génotypiques à l'aide de la loi d'Hardy-Weinberg: il identifie les valeurs entrées dans chaque cadre comme étant les fréquences alléliques respectivement de l'allèle sain et de l'allèle malade. Puis, il met au carré la première valeur et affiche cette valeur sous l'intitulé "Fréquence de la population saine", fait le produit des deux valeurs qu'il multiplie par 2 et affiche la valeur obtenue sous la "Fréquence de la population porteuse" et enfin met au carré la deuxième valeur pour l'afficher sous "Fréquence de la population malade". Vous pouvez également entrer d'autres valeurs comprises entre 0 et 1, le calculateur se chargera de tout calculer.

1/Calcul de l'erreur relative

Maintenant que nous avons calculé toutes les valeurs réelles et obtenu les valeurs théoriques, nous pouvons les comparer en calculant l'erreur relative. Cela nous permettra ainsi d'évaluer la fiabilité du modèle d'Hardy-Weinberg par rapport à son application sur la mucoviscidose à l'échelle des différentes populations humaines.


Après calcul de toutes les erreurs relatives, on obtient le tableau suivant:

Fréquence de la population saine Fréquence de la population porteuse saine Fréquence de la population malade
Populations Fréquence du gène sain Fréquence du gène malade Valeur réelles Valeur théoriques Erreur relative Valeur réelles Valeur théoriques Erreur relative Valeur réelles Valeur théoriques Erreur relative Erreur relative moyenne
Caucasienne 0.979714 0.020286 0.959714 0.959840 0.0131% 0.040000 0.039749 -0.6275% 0.000286 0.000412 44.0559% 14.4805%
Moyen-Orient 0.984621 0.015379 0.969470 0.969479 0.0009% 0.030303 0.030285 -0.0594% 0.000227 0.000237 4.4052% 1.4489%
Hispanique 0.989013 0.010987 0.978143 0.978147 0.0004% 0.021739 0.021733 -0.0272% 0.000118 0.000121 2.5424% 0.8385%
Asiatique 0.994414 0.005586 0.988858 0.988859 0.0001% 0.011111 0.011111 0% 0.000030 0.000031 3.3333% 1.1111%
Noire 0.992807 0.007193 0.985664 0.985666 0.0002% 0.014285 0.014283 -0.0140% 0.000050 0.000052 0.0400% 0.0087%

2/ Conclusion

Nous pouvons ainsi voir que le modèle d'Hardy-Weinberg n'est pas vraiment fiable à 100%, mais il l'est plus dans certains cas que dans d'autres: l'erreur relative moyenne est environ 10x plus grande chez la population caucasienne que chez les populations du Moyen-Orient, hispanique et asiatique. Dans la population noire, cette erreur relative est même 1000x plus petite!

Ces erreurs relatives sont dûes au nombre d'hypothèses qui ne sont pas vérifiées, et qui induisent donc une marge d'erreur relativement conséquente. Quand aux différences d'erreurs relatives observées, on peut émettre l'hypothèse que cela est dû au fait que la population caucasienne est la plus touchée par la mucoviscidose, ayant une prévalence beaucoup plus élevée que parmi les autres populations. Cela pourrait expliquer pourquoi son erreur relative est plus grande que dans les autres populations

Aller à la conclusion

Calculateur d'Hardy-Weinberg

Fréquence de l'allèle sain:

Fréquence de l'allèle
responsable de la maladie:

Fréquence de la population saine:

Fréquence de la population porteuse saine:

Fréquence de la population malade:

Comprendre mon fonctionnement