Když loni v dubnu zachytili notoricky známého „zlatého zabijáka“, který byl v Kalifornii v 70. a 80. letech 20. století známý pro řadu znásilnění a vražd, došlo k hromadnému úlevě. Způsob, jakým autority našli vraha - pomocí údajů z genealogických webových stránek - však nechal lidi znepokojující pocity ohledně síly genetického testování.
Je to proto, že zabiják Zlatého státu byl nabit jeho DNA, když policie přizpůsobila vzorky vzorku svého třetího bratrance, který nahrál genetická data do genealogické databáze. Od té doby se debata rozvíjela kolem etiky používání genealogických webů pro pomoc při forenzním vyšetřování.
A nyní nová studie ukazuje, jak rozsáhlé tyto genealogické weby skutečně jsou. Vědci zjistili, že přibližně 60 procent lidí v databázi více než 1,2 milionu lidí by mohlo být uzavřeno s alespoň jednou další osobou v databázi, která byla třetím bratrancem nebo ještě bližším vztahem.
Ve skutečnosti musí genetická databáze pokrýt pouze 2 procenta cílové populace, aby bylo možné najít alespoň zápas třetí sestřenice s téměř jakoukoli osobou, jak napsali ve studii zveřejněné včera (11. října) v časopise Science.
Skupina analyzovala data od 1,28 milionu anonymních lidí na genealogickém webu My Heritage. (Hlavní autor studie, Yaniv Erlich, je hlavní vědecký referent webové stránky.) Porovnáním toho, co se v DNA DNA říká segmenty identifikace podle původu (IBD), server dokáže najít i vzdálené příbuzné, jako jsou druhé nebo třetí bratranci. Čím větší je podíl IBD mezi dvěma lidmi, tím bližší je jejich vztah.
Vědci se zaměřili na sdílené segmenty IBD, které by odpovídaly druhým, třetím nebo čtvrtým bratrancům. Zjistili, že 60 procent jejich pátrání vrátilo zápas - většina z nich byla třetí sestřenice nebo blíž. Vědci pak provedli podobné, ale menší vyhledávání na GEDmatch (databáze, která byla použita k chytání Golden State Killer) a zjistili, že 76 procent z jejich 30 náhodných vyhledávání se shodovalo s třetím bratrancem nebo blíže.
Dále zjistili, že lidé se severoevropskými předky se nejjednodušší spojili. Přibližně 75 procent lidí v databázi bylo ze severní Evropy a bylo o 30 procent vyšší pravděpodobnost, že budou mít zápas než jednotlivci s genetickým pozadím ze subsaharské Afriky.
Tým zjistil, že jakmile se tito příbuzní nacházejí, lze totožnost anonymní osoby snadno zjistit pomocí prozkoumání rodinných linií a demografických informací, jako je věk osoby nebo bydliště. Ukázali to odhalením identity anonymní ženy poté, co našli své vzdálené příbuzné.
Podle průzkumů bylo mezi dubnem a srpnem letošního roku podle průzkumů vyřešeno alespoň 13 studených případů v USA (včetně případu Golden State Killer). Co je dělá tak silnými, je to, že zatímco forenzní rešerše databází - které jsou přísně regulovány - mohou najít pouze blízké příbuzné prvního nebo druhého stupně, vyhledávání genetické databáze může najít vzdálenější.
„Zatímco tvůrci politik a široká veřejnost mohou být pro takové zdokonalené forenzní schopnosti pro řešení trestných činů, spoléhá se na databáze a služby, které jsou přístupné všem,“ psali autoři. „Stejná technika by tedy mohla být využita i pro škodlivé účely, jako je například opětovné určení výzkumných subjektů z jejich genetických dat.“
Vědci navrhují, aby byla zavedena politika na ochranu genetických údajů lidí. Doporučují také, aby weby s genologií začaly chránit soubory surových genetických dat zabezpečeným digitálním podpisem, což ztěžuje přístup k těmto datům.