Rokonsági kapcsolatok vizsgálata régészeti DNS mintákban
Maróti Zoltán1,3, Varga Gergely István2,3, Schütz Oszkár2 és Török Tibor2,3 1 SZTE, Gyermekgyógyászati Klinika, genetikai Diagnosztikai Laboratórium 2 SZTE, Genetikai Tanszék, Archeogenetikai csoport 3 Magyarságkutató Intézet, Archeogenetikai Kutatóközpont A genetikai adatok alapján történő rokonsági fok becslések alkalmasak igazságügyi kérdések tisztázására, de hozzájárulnak a régebbi korokban élt emberek társadalmi szerveződésének jobb megértéséhez is. A korábban használt, több százezer genetikai marker statisztikai elemzésén alapuló módszertan alkalmas volt a közeli, 1-4. fokú rokonok azonosítására, azonban a legújabb módszerek lehetővé teszik a távolabbi akár 8-10. fokú rokonok azonosítását is. Ezen módszerek alapja az, hogy a markerek genotípusai alapján azonosítja azokat a hosszabb-rövidebb megegyező (shared) DNS szegmenseket két rokon között, melyeket mindkettő egy közös ősüktől örökölt (identity by descent – IBD).A régészeti mintákban a DNS az idő során degradálódik, jellemzően 40-60 bázis pár hosszú darabokra töredezik, ezen felül a felnyíló egy szálú DNS post mortem károsodást (specifikus nukeotid módosulások) is szenved, és az emberi DNS mellett nagy mennyiségben mikrobiális DNS kontamináció is jelen van. Így a régészeti leletekből jellemzően alacsony genom lefedettségű, genotipizálási hibákat is tartalmazó szekvencia adatok állnak rendelkezésre.
Az alacsony lefedettségű szekvencia adatok imputációja igen nagy precizitással (~95%) teszi lehetővé a legvalószínűbb diploid haplotípusok predikcióját. Az imputációs hibákat is figyelembe vevő, Hidden-Markov modellen (HMM) alapuló ancIBD szoftver akár 0.5x lefedettségű adatok esetében is nagy pontossággal azonosítja a két rokon minta közös IBD szegmenseit. A HMM által valószínűsített IBD szegmenseket, jelenleg az experimentális adatok és szimulációk alapján meghatározott kemény határértékek (IBD hossz, és marker sűrűség) alkalmazásával osztályozzák true pozitív (TP), és false pozitív (FP) találatokra. Jelen előadás bemutatja, hogy több minta együttes analízisével, a kohort alapú megközelítés hogyan segítheti a TP/FP klasszifikációt, lehetővé téve a szignifikánsan rövidebb IBD szegmensek azonosítását is, illetve körbejárja azokat a lehetőségeket, hogy a valós rokonsági kapcsolatok (hard truth) ismerete nélkül hogyan lehet validálni módszerünk hatékonyságát.
