Antworten

Test ADN - Parentes - Ethnies

Forum sur la généalogie génétique
selfonlypath
selfonlypath
Beiträge: 184
Eingabeform: Grafisch
Navigation: Grafisch
Den Stammbaum ansehen
Bonjour à toutes et tous,

Par curiosité, je serais intéressé à connaître votre opinion, sondage, retour d'expérience sur les valeurs en pourcentage où cela fait sens de creuser.

De mon côté et ce depuis mi-2019, j'ai effectué un test chez 23andme qui ensuite a été également exporté vers d'autres sociétés. Cela m'a permis de trouver de bons produits mais aussi beaucoup de produits avec bien trop de marketing et beaucoup trop d'erreurs donc perte de temps considérable.

Pour les estimations de parentés, sauf erreur de ma part il semble que le seuil de décision acceptable serait vers les 0.8% car en dessous, il y a soit du bruit de calcul, soit les différents algorithmes ne fonctionnent pas bien.

Pour les estimations ethniques ou régions du monde, je tendrais à ne faire confiance qu'à des pourcentages au delà de 4% pour éviter les time line story telling souvent farfelues.

Un consensus semble clair, trouver des parentés via l'ADN marche quand même très bien mais pour les origines ethniques ou géographiques, il va falloir du temps et de l'innovation (algorithme, base de données).

Pour en revenir à ma question initiale, je ne suis pas intéressé par des témoignages (parenté) d'un 0.2% ou 0.4% qui effectivement se confirme dans un arbre généalogique sachant que dans la plupart des case, ce taux est une fausse détection. Ma question est de savoir à partir de quels pourcentage (parentés et géographiques), c'est vraiment quasi certain d'être fiable et mérite de concentre plus de temps, d'efforts et d'investigations.

Merci par avance, Albert
lilou8391
female
Beiträge: 302
Eingabeform: Grafisch
Navigation: Grafisch
Den Stammbaum ansehen
Pour les origines ethniques ça dépend vraiment des compagnies, certaines donnent des résultats très vagues ou farfelues. L'idéal c'est d'utiliser divers calculateurs et de voir ce qui ressort le plus. Pour moi et de tout ce que j'ai observé depuis plusieurs mois, pour les personnes d'Europe de l'Ouest, les meilleurs calculateurs sont ceux d'Eurogenes sur gedmatch, le K13 et K15 couplés avec vahaduo (https://vahaduo.genetics.ovh/) et surtout le G25 de Davidski.
Parfois un faible pourcentage autour de 3% voire moins peut être significatif lorsqu'il revient sur divers calculateurs.
Pour les correspondances adn, je ne saurais vous dire avec certitude sur quel pourcentage minimum il faut se concentrer. J'ai lu plusieurs fois autour de 1% mais je dirais même moins que ça: à partir de 0.6% soit 45cM tout en sachant qu'on peut trouver un lien de parenté avec juste un segment de 8cM comme dans mon cas ... Il faut faire attention que les segments ne soient pas dans des Pill up zones (définition ici https://www.exploreyourdna.com/lexique.aspx)
ffoucart
male
Beiträge: 1903
Eingabeform: Grafisch
Navigation: Text
Den Stammbaum ansehen
Bonjour Albert,

Personnellement, je n’utilise pas les % d’ADN partagé. Pas d’intérêt en ce qui me concerne. Et ce n’est pas fiable.

J’utilise les segments triangulés pour trouver des cousins. Rien d’autre.

Bien cordialement,
sylvaine20
female
Beiträge: 114
Eingabeform: Grafisch
Navigation: Grafisch
Den Stammbaum ansehen
Bonjour,

En ce qui concerne la parenté estimée celà peut être nettement en dessous des réalité. Par exemple deux frères peuvent ne partager aucun segment d'ADN, deux cousins peuvent ne pas avoir de segment d'ADN en commun car par hérité des mêmes segments.

Par exemple une cousine pas très éloignée c'est à dire au quatrième degrés ne partage qu'un petit bout de segment d'ADN avec moi et ma mère. Il y a écrit faible niveau de confiance alors que je sais qu'elle partage tout une branche de mon arbre genealogique.

En ce qui concerne les pourcentage la catégorie Europe du Nord et de l'Ouest est évaluée à 5.1% chez moi alors que mes ancêtres dans cette catégorie sont majoritaires.

Sur 23 andme cette catégorie atteint 80%.Il y a donc une incohérence flagrante. Car la catégorie Europe du SUD passe de 56% sur My Heritage à 11%.
jerome4
male
Beiträge: 9752
ffoucart hat geschrieben: 18 September 2021, 09:30 Bonjour Albert,

Personnellement, je n’utilise pas les % d’ADN partagé. Pas d’intérêt en ce qui me concerne. Et ce n’est pas fiable.

J’utilise les segments triangulés pour trouver des cousins. Rien d’autre.

Bien cordialement,
Triangulés? Mais avec un membre de votre famille très proche ou de votre correspondant?

Sinon, c'est très rare d'avoir hérité d'un même segment entre 3 cousins du 3ème degré ou plus .
Et justement, c'est les segments triangulés que j'évite, puisque se sont dans la quasi-totalité des IBP peu informatifs...
ffoucart
male
Beiträge: 1903
Eingabeform: Grafisch
Navigation: Text
Den Stammbaum ansehen
jerome4 hat geschrieben: 18 September 2021, 10:32

Triangulés? Mais avec un membre de votre famille très proche ou de votre correspondant?

Sinon, c'est très rare d'avoir hérité d'un même segment entre 3 cousins du 3ème degré ou plus .
Et justement, c'est les segments triangulés que j'évite, puisque se sont dans la quasi-totalité des IBP peu informatifs...
Les 2. Les segments triangulés sont les seuls intéressants. Les autres sont généralement des IBP ou des IBC. Généralement sans aucun intérêt.
selfonlypath
selfonlypath
Beiträge: 184
Eingabeform: Grafisch
Navigation: Grafisch
Den Stammbaum ansehen
Concernant l'archéo-génétique telle que promue par MyTrueAncestry où j'ai un compte ZEUS ainsi que les mise à jour récente de YourDNAportal (PANGEA et EUROSIA) où j'ai également un compte. On est d'accord, ici on parle de comparer une partie d'un raw data file avec des échantillons provenant d'excavation archéologique donc pouvant remonter à plusieurs siècles avant JC.

Que pensez-vous de la validité ou pertinence de 2 matchs spécifiques ci-bas où il est indiqué des valeurs assez élevées pour Largest Chain et Cumul de Chain (dans MyTrueAncestry cela est issu de la fonction Deep Dive - Ancient relatives) ?

Ancient XXX 1861 BC
Shared DNA: (Sample Quality: 96)
9 SNP chains (min. 60 SNPs) / 126.6 cM
Largest chain: 218 SNPs / 49.97 cM

Ancient YYY 700 AD
Shared DNA: (Sample Quality: 100)
13 SNP chains (min. 60 SNPs) / 207.7 cM
Largest chain: 193 SNPs / 55.56 cM

J'ai d'autres matches mais qui à mon avis sont moins pertinents car le largest chain est bien plus faible, idem pour le total chain et le quality sample plus bas.

Merci par avance, Albert
ffoucart
male
Beiträge: 1903
Eingabeform: Grafisch
Navigation: Text
Den Stammbaum ansehen
selfonlypath hat geschrieben: 18 September 2021, 19:14
Ancient XXX 1861 BC
Shared DNA: (Sample Quality: 96)
9 SNP chains (min. 60 SNPs) / 126.6 cM
Largest chain: 218 SNPs / 49.97 cM

Ancient YYY 700 AD
Shared DNA: (Sample Quality: 100)
13 SNP chains (min. 60 SNPs) / 207.7 cM
Largest chain: 193 SNPs / 55.56 cM
Il s'agit de segments avec très peu de SNPs communs. Normalement, on ne retient qu'à partir de 100 SNPs par cM.

Donc, je suis circonspect.
selfonlypath
selfonlypath
Beiträge: 184
Eingabeform: Grafisch
Navigation: Grafisch
Den Stammbaum ansehen
ffoucart hat geschrieben: 22 September 2021, 16:38
selfonlypath hat geschrieben: 18 September 2021, 19:14
Ancient XXX 1861 BC
Shared DNA: (Sample Quality: 96)
9 SNP chains (min. 60 SNPs) / 126.6 cM
Largest chain: 218 SNPs / 49.97 cM

Ancient YYY 700 AD
Shared DNA: (Sample Quality: 100)
13 SNP chains (min. 60 SNPs) / 207.7 cM
Largest chain: 193 SNPs / 55.56 cM
Il s'agit de segments avec très peu de SNPs communs. Normalement, on ne retient qu'à partir de 100 SNPs par cM.

Donc, je suis circonspect.
Ok merci, du coup je comprends la signification (min 60 SNPs) où du coup, MyTrueAncestry arriverait à cumuler plus de cM en acceptant des segments plus courts.
Avez-vous une idée si tous les autres sociétés (i.e. 23andme, FTDNA, MyHeritage, Geneanet...) en général s'obligent à retenir des segments ayant au moins 100 SNPs par cM ?
ffoucart
male
Beiträge: 1903
Eingabeform: Grafisch
Navigation: Text
Den Stammbaum ansehen
Bonjour,

Moins de SNPs peut faire sens sur des échantillons anciens, puisqu'il a dérive génétique depuis. Mais à prendre avec des pincettes.

Oui, la règle de 100 SNPs/cM est la norme reprise par tout le monde.

Sur Gedmatch vous pouvez toutefois l'abaisser (ce qui peut être utile dans certains cas).

A titre personnel, je ne retiens que les petits segments (environ 7 cMs) que si j'arrive à les trianguler et s'ils ont un nombre de SNPs nettement supérieur à 100 SNPs/ cM. Cela fait plusieurs années que j'essaie de trouver ce qu'il se cache derrière un segment d'environ 7 cMs commun surtout avec des Norvégiens, mais qui est dense en SNPs (j'en ai avec plus de 2000 SNPs partagés sur ce segment, qui varie entre 6,7 cMs et 8,4 cMs suivant les correspondances, et que je partage avec mon père et l'un de mes fils).

Bien cordialement,
jerome4
male
Beiträge: 9752
ffoucart hat geschrieben: 23 September 2021, 09:27 Bonjour,

Moins de SNPs peut faire sens sur des échantillons anciens, puisqu'il a dérive génétique depuis. Mais à prendre avec des pincettes.

Oui, la règle de 100 SNPs/cM est la norme reprise par tout le monde.

Sur Gedmatch vous pouvez toutefois l'abaisser (ce qui peut être utile dans certains cas).

A titre personnel, je ne retiens que les petits segments (environ 7 cMs) que si j'arrive à les trianguler et s'ils ont un nombre de SNPs nettement supérieur à 100 SNPs/ cM. Cela fait plusieurs années que j'essaie de trouver ce qu'il se cache derrière un segment d'environ 7 cMs commun surtout avec des Norvégiens, mais qui est dense en SNPs (j'en ai avec plus de 2000 SNPs partagés sur ce segment, qui varie entre 6,7 cMs et 8,4 cMs suivant les correspondances, et que je partage avec mon père et l'un de mes fils).

Bien cordialement,
Je ne suis pas sûr que le nombre de SNPs soit un bon indicateur.

Selon le segment, il peut exister beaucoup ou très peu de différence entre deux personnes non apparentés. Généralement, dans les zones où il existe peu de différence, beaucoup de SNP sont testés dans les tests et donc renvoie un nombre important de SNPs similaires.
Je pense à la zone HLA du chromosome 6 qui est fortement testée.. Mais comme deux personnes non apparentés ont énormément de SNPs en commun, cela relativise la pertinence.
selfonlypath
selfonlypath
Beiträge: 184
Eingabeform: Grafisch
Navigation: Grafisch
Den Stammbaum ansehen
ffoucart hat geschrieben: 23 September 2021, 09:27 Moins de SNPs peut faire sens sur des échantillons anciens, puisqu'il a dérive génétique depuis. Mais à prendre avec des pincettes.

Oui, la règle de 100 SNPs/cM est la norme reprise par tout le monde.

Sur Gedmatch vous pouvez toutefois l'abaisser (ce qui peut être utile dans certains cas).
Bonjour, en fait j'ai regardé plus en détail l'interface homme-machine sur MyTrueAncestry et on peut choisir le nombre de SNPs/cm entre 60 et 500. Du coup, j'ai relancé la simulation avec un seuil de 100 et voici en pièce-jointe les 2 résultats où à priori, le match lointain pourrait faire sens du coup, qu'en pensez-vous ?
Dateianhänge
Capture d’écran 2021-09-23 à 11.24.09.png
Capture d’écran 2021-09-23 à 11.25.02.png
ffoucart
male
Beiträge: 1903
Eingabeform: Grafisch
Navigation: Text
Den Stammbaum ansehen
jerome4 hat geschrieben: 23 September 2021, 11:23
Je ne suis pas sûr que le nombre de SNPs soit un bon indicateur.

Selon le segment, il peut exister beaucoup ou très peu de différence entre deux personnes non apparentés. Généralement, dans les zones où il existe peu de différence, beaucoup de SNP sont testés dans les tests et donc renvoie un nombre important de SNPs similaires.
Je pense à la zone HLA du chromosome 6 qui est fortement testée.. Mais comme deux personnes non apparentés ont énormément de SNPs en commun, cela relativise la pertinence.
Oui, tu as raison, il faut relativiser et toujours tenir compte d'un certain nombre de facteurs. Mais généralement, une zone lambda où tu as beaucoup de SNPs sur un segment commun, avec un nombre d'individus restraint plus ou moins de même origine, cela me semble un bon indice de parenté plus ou moins lointaine.

En l'occurence, il s'agit d'une comparaison avec des échantillons anciens, donc logiquement le nombre de SNPs doit être faible.

Bien à toi,
ffoucart
male
Beiträge: 1903
Eingabeform: Grafisch
Navigation: Text
Den Stammbaum ansehen
selfonlypath hat geschrieben: 23 September 2021, 11:29 Bonjour, en fait j'ai regardé plus en détail l'interface homme-machine sur MyTrueAncestry et on peut choisir le nombre de SNPs/cm entre 60 et 500. Du coup, j'ai relancé la simulation avec un seuil de 100 et voici en pièce-jointe les 2 résultats où à priori, le match lointain pourrait faire sens du coup, qu'en pensez-vous ?
Sincérement, pas grand chose. La présentation m'échappe un peu, et si j'ai bien compris, on a au max, 193 SNPs pour 55 cMs et 218 pour près de 50 cMs. On est donc très loin des ratios habituels (on devrait en avoir 5000 par segment).

Je pense qu'il faut prendre ces résultats avec beaucoup de précautions. De toutes façons, nous sommes à de nombreuses générations d'écart de ces individus. Au mieux cela indique une trace de ces populations chez vous. Mais, à priori, sans grande surprise.
selfonlypath
selfonlypath
Beiträge: 184
Eingabeform: Grafisch
Navigation: Grafisch
Den Stammbaum ansehen
ffoucart hat geschrieben: 23 September 2021, 15:25 Sincérement, pas grand chose. La présentation m'échappe un peu, et si j'ai bien compris, on a au max, 193 SNPs pour 55 cMs et 218 pour près de 50 cMs. On est donc très loin des ratios habituels (on devrait en avoir 5000 par segment).

Je pense qu'il faut prendre ces résultats avec beaucoup de précautions. De toutes façons, nous sommes à de nombreuses générations d'écart de ces individus. Au mieux cela indique une trace de ces populations chez vous. Mais, à priori, sans grande surprise.
Je pense qu'il y a 2 sujets, à savoir comparer son génome avec des échantillons très anciens issus de fouille archéologique et comparer son génome avec une personne toujours en vie.

Dans le cas où MTA trouve un segment 50 cM avec 218 SNPs entre mon fichier une fouille remontant à 1861 Avant JC, il est impensable d'imaginer qu'un segment de grande longueur se soit transmis sans mutation ou imputation partielle. Je pense que c'est pour cela que sur une distance cM on va s'attacher à moins de SNPs voir de toute façon, les logiciels ne testent pas tous les SNP car cela couterait très cher.

Au passage, vous dites que l'on devrait avoir en ratio habituel 5000 SNPs par segments mais par exemple, sur 23andme où je match avec mon cousin 2nd avec un total de 342 cM sur 13 segments, quelques segments représentent bien moins que 5000.... Par exemple notre segment commun de 11,77 cM est validé avec 1083 SNPs.

Il y a la longueur absolue en cM et comment elle est quantifiée ou connue avec la granularité en SNP qui va se dégrader en fonction du temps ou de l'âge de l'échantillon ainsi que le fait que la zone ADN en question est plus zoomée ou étudiée ou connue.
Antworten

Zurück zu „ADN (généalogie génétique)“