Genomikai szabályozási módszerek kidolgozása és alkalmazása genomszéles társulási vizsgálatokhoz nem additív modellek alkalmazásával
Szövetségi Citológiai és Genetikai Intézet SD RAS, Novoszibirszk, Oroszország, Novoszibirszki Állami Egyetem, Novoszibirszk, Oroszország
Helmholtz Zentrum München Genetikai Epidemiológiai Intézet - Német Környezet-egészségügyi Kutatóközpont, Neuherberg, Németország
Helmholtz Zentrum München - Genetikai Epidemiológiai Intézet
Helmholtz Zentrum München, a molekuláris epidemiológia hovatartozás-kutatási egysége - Német Környezet-egészségügyi Kutatóközpont, Neuherberg, Németország
Epidemiológiai Osztály, Erasmus MC Rotterdam, Hollandia
Szövetségi Citológiai és Genetikai Intézet SD RAS, Novoszibirszk, Oroszország, Novoszibirszki Állami Egyetem, Novoszibirszk, Oroszország
Társulástudományi és Genetikai Intézet SD RAS, Novoszibirszk, Oroszország, Novoszibirszki Állami Egyetem, Novoszibirszk, Oroszország, Népegészségügyi Tudományok Központja, Edinburghi Egyetem, Edinburgh, Egyesült Királyság
- Jakov A. Tsepilov,
- Janina S. Ried,
- Konstantin Strauch,
- Harald Grallert,
- Cornelia M. van Duijn,
- Tatiana I. Axenovich,
- Jurij S. Aulcsenko
Ábrák
Absztrakt
A genom egészére kiterjedő asszociációs vizsgálatok (GWAS) hatékony eszközt tartalmaznak a komplex tulajdonságú gének feltérképezéséhez. A tesztstatisztika inflációja azonban előfordulhat a populáció alstruktúrája vagy rejtélyes rokonság miatt, ami hamis asszociációkat okozhat. Ha nagyszámú genetikai markerről áll rendelkezésre információ, akkor az elemzési eredmények kiigazítása lehetséges a genomi kontroll (GC) módszerével. A GC-nek eredetileg a Cochran-Armitage additív trend teszt kijavítását javasolták. Nem additív modelleknél a korrekció kimutatták, hogy az allél frekvenciáitól függ. Ezért a GC használata azokra a helyzetekre korlátozódik, ahol a null markerek és a jelölt jelölők allél frekvenciái megegyeznek.
Ebben a munkában kibővítettük a GC módszer képességeit a nem additív modellek esetében, ami lehetővé teszi számunkra, hogy tetszőleges allélfrekvenciájú null markereket használjunk a GC számára. Az allélfrekvenciától és számos populációs paramétertől való függőséget leíró tesztstatisztika inflációjára vonatkozó analitikai kifejezéseket kaptunk az öröklődés recesszív, domináns és túlsúlyos modelljeire. Javasoltunk egy módszert ezen szükséges populációs paraméterek becslésére. Javasoltunk továbbá egy GC-módszert, amely a korrekciós együttható közelítésén alapszik az allélfrekvencia polinomjával, és eljárásokat írtunk le a genotípusos (két fokú szabadság) teszt kijavítására olyan esetekben, amikor az öröklődés modellje ismeretlen. A leírt módszerek statisztikai tulajdonságait szimulált és valós adatok felhasználásával vizsgáltuk. Kimutattuk, hogy az összes vizsgált módszer hatékony volt az 1-es típusú hibák kontrollálásában genetikai alstruktúra jelenlétében. A javasolt GC módszerek alkalmazhatók a GWAS statisztikai tesztjeihez különböző öröklődési modellekkel. Az ebben a munkában kidolgozott és tesztelt összes módszert az R nyelv használatával valósítottuk meg a GenABEL csomag részeként.
Idézet: Tsepilov YA, Ried JS, Strauch K, Grallert H, van Duijn CM, Axenovich TI és mtsai. (2013) Genomikai szabályozási módszerek fejlesztése és alkalmazása nem-additív modellek felhasználásával végzett genomszéles társulási vizsgálatokhoz. PLoS ONE 8 (12): e81431. https://doi.org/10.1371/journal.pone.0081431
Szerkesztő: Lin Chen, a Chicagói Egyetem, Amerikai Egyesült Államok
Fogadott: 2013. július 30 .; Elfogadott: 2013. október 12 .; Közzétett: 2013. december 16
Finanszírozás: A KORA tanulmányt a Helmholtz Zentrum München, a Környezetegészségügyi Német Kutatóközpont kezdeményezte és finanszírozta, amelyet a német szövetségi oktatási és kutatási minisztérium (BMBF) és Bajorország állam finanszíroz. A KORA kutatását a müncheni Egészségtudományi Központ (MC-Health), a Ludwig – Maximilians – Universität, az LMUinnovativ részeként támogatta. Az ezekhez az eredményekhez vezető kutatások a Helmholtz Egyesület és az RFBR (Orosz Alapkutatási Alapítvány, 11-04-00098 és 12-04-91322 támogatások) támogatásából kaptak támogatást egy Helmholtz – Oroszország közös kutatás keretében. Valamint az Európai Unió hetedik keretprogramjából (FP7-Health-F5-2012) a 305280. számú támogatási megállapodás alapján (MIMOmics).
Versenyző érdeklődési körök: A szerzők kijelentették, hogy nincsenek versengő érdekek.
Bevezetés
A genom egészére kiterjedő asszociációs vizsgálatok (GWAS) hatékony eszköz a komplex tulajdonságú gének feltérképezésére. A GWAS-hoz alkalmazott standard statisztikai módszerek, mint például a lineáris regresszió, feltételezik, hogy a fenotípus és a genotípusos marker közötti összefüggés fennáll maga a marker vagy az ok-okozati lókussal való erős egyensúlyi egyensúly miatt. Ez a feltételezés akkor áll fenn, ha a minta egy panmiktikus populáció képviselőiből áll. Mindazonáltal más, a zavaró tényezők által okozott összefüggések lehetségesek, amelyek mind a különböző lokuszok fenotípusait, mind genotípusait befolyásolják. A GWAS-ban a vizsgált minták genetikai alstruktúrája a legfontosabb zavarók közé tartozik. Ha az elemzést a populáció alstruktúrája nem zavarja, a teszt statisztikája fel van fújva [1], ami megnehezíti annak statisztikai értelmezését, és hamis pozitív eredményekhez vezethet.
Ha nagyszámú genetikai markerről áll rendelkezésre információ, akkor az elemzési eredményeket ki lehet igazítani a nem-specifikus hatások hatásának számbavételével a genomi kontroll (GC) módszer alkalmazásával. Számos módszert javasoltak a GC kiigazítására [1] - [5]. Devlin és Roeder [1] egy korrekciós együttható alkalmazását javasolta, amelyet variancia-inflációs tényezőként (VIF) jelöltek a tesztstatisztika eloszlásának korrigálására. Általában kimutatták, hogy a VIF a marker allél frekvenciák és a populációs paraméterek függvénye [1]. Azt is levonták, hogy egy additív modell esetében a VIF nem függ az allél frekvenciájától. Így egy additív modell esetében a „GC inflációs tényező” állandó, λ, empirikusan megbecsülhető null (nem társított) lókuszokból. Megjegyezzük azonban, hogy kisebb allélfrekvenciák és kisebb minták esetében az aszimptotikus feltételezések nem fognak érvényesülni, következésképpen a tesztstatisztika inflációja még additív modell esetén is függ az allél frekvenciáitól.
A Genomic Control λ inflációs állandójának több becslését is fel lehet használni. Például az átlagos tesztstatisztika egy λ becslője, amely azonban szenved abban, hogy a kiugró értékek erősen befolyásolják (például a valódi asszociációs jelek miatt). A mediánbecslőt (λmedian), amelyet a tesztstatisztika megfigyelt eloszlásának mediánja és 0,455 (az eloszlás mediánja) [1] arányaként határoznak meg, valószínűleg a legjobban használják. Egy másik becslő úgy határozható meg, hogy a megfigyelt tesztstatisztika regressziós együtthatója a nulllókuszokra várható statisztikára (regresszióbecslő λregresszió). Ez a becslés abból az egyszerű megfigyelésből adódik, hogy a két rendezett véletlen változó közötti kovariancia, amelyek közül az egyik elosztva, a másik pedig λ *, egyenlő 2 * λ, míg a várható eloszlás varianciája 2. Mindezek a becslések olyan konstansok, amelyek használhatjuk statisztikai torzítás indikátoraként vagy együtthatóként, amelyek lehetővé teszik a megfigyelt tesztstatisztika korrekcióját.
A VIF általános megfogalmazása [2] elvileg lehetővé teszi a GC kiterjesztését domináns és recesszív modellekre. A nem additív modell esetében azonban a VIF az allél gyakoriságától és számos olyan paramétertől függ, amelyek leírják a minta genetikai szerkezetét. Ezáltal lehetséges a VIF empirikus megbecsülése (mint az additív modell esetében), ha a null lokuszok allél frekvenciája megegyezik a teszt lokuszéval (specifikus VIF minden allélcsoportra), de ebben az esetben a rendelkezésre álló null markerek száma korlátozott, és ezáltal korlátozza a GC módszer alkalmazhatóságát. Alternatív módon meg kell becsülni a populáció szerkezetének paramétereit. Számítási szempontból kiterjedtek azok a módszerek, amelyek a populáció szerkezetére következtetnek és az egyéneket populációkhoz rendelik [6].
Az empirikus VIF becslés másik módszerét javasolta Zheng és mtsai. [3] .a két szabadságfokú (2df) modell esetében, amely nem korlátozza a fenotípusok és a genotípusok kapcsolatát, és nem szab szigorú korlátozásokat a heterozigóta genotípus súlyára vonatkozóan. Ez a „robusztus GC” módszer a korrigált tesztstatisztikák kombinálásán alapult a domináns és a recesszív modellektől [3]. Még egy korrekciós módszert - a delta decentralizációt (a nem központi chi-négyzet központosításán alapul) - javasolta Gorroochurn és munkatársai [7], de később Dadd et. al. [8].
Ebben a munkában nem-additív (recesszív, domináns, túlsúlyos és 2df genotípusos) modellek felhasználásával a GWAS eredményeinek GC korrekciójára szolgáló meglévő módszerek kidolgozását és értékelését tűztük ki célul. Ezért több pontra összpontosítunk: a VIF-kifejezések megfogalmazása különféle modellekhez egy szabadságfokkal (1df) és VIF-alapú eljárások kidolgozása e modellek eredményeinek GC korrekciójára; a populáció alstruktúráját leíró modellparaméterek becslése a VIF becsléséhez; új „polinom” GC (PGC) módszer kidolgozása, amely a korrekciós együttható polinomiális közelítésén alapul, mind egy-, mind kétfokú teszteknél alkalmazható. Valamennyi módszert szimulált és valós adatok felhasználásával teszteltük.
Eredmények
VIF nem additív modellekhez
A VIF-et az allélfrekvencia (p), az öröklődés modelljének függvényében származtattuk (x jelzi a heterozigóta genotípus hatását; recesszív, additív és domináns modell esetén x egyenlő 0, 0,5, illetve 1-rel), minta méret (N) és a populáció paraméterei. A túlsúlyos modellt (a genotípus hatása homozigóták esetében 0, heterozigóták esetében 1), külön leírjuk. A populációs paraméterek közé tartozik a Wright beltenyésztési F együtthatója (0 és 1 közötti tartományban) [9], valamint egy olyan együttható, amely leírja a populáció alstruktúráját (), ahol és az egyes alpopulációk képviselőinek száma az eset-, illetve a kontrollmintákban. A valóságban az átlagos beltenyésztés F értéke 2 megközelíti a nullát, ha a tervezés kiegyensúlyozott (pl. Eset: a kontrollarány minden alpopulációban 1∶1), és megközelíti a maximum 1/2 értékét, ha akár esetekből, akár csak kontrollokból vesznek mintát minden egyes populáció.
A VIF-et úgy kapjuk, ahol Gi az i-edik eset genotípusa (Gi∈). és meghatározása: és. A VIF levezetéseit és részletes képleteit az S1 kiegészítő megjegyzés tartalmazza.
Az 1. ábra bemutatja a populációs paraméterek halmazának VIF függvényét (F = 0,05; N = 1000; K = 11 000). Ez az ábra azt mutatja, hogy a VIF csak az additív modellnél (x = ½) függ az allél frekvenciájától, amelyet korábban bemutattak [2]. A függvény pontszimmetrikus az x = ½ értéknél - a recesszív modell a domináns tükörképe. A végtelenbe hajló x esetében is - a várakozásoknak megfelelően - megközelíti az öröklődés túlsúlyos modelljének funkcióját.
- Fékezze meg étvágyát - 7 egyszerű módszer az éhség visszaszorítására
- A vérnyomás étrendi ellenőrzése - ez nem csak a nátriumról szól
- Étrendi minták az elhízás csökkentésére gyógynövényekkel Észak-Pakisztánban
- Megfordítható-e a merevedési zavar? A legjobb módszerek
- Clenbuterol (Clen) - 5 dolog, amit szeretnél tudni, mielőtt használnád