A mérési hibák elszámolása a levegőszennyezés omikus jelekre gyakorolt ​​hatásának felmérésére

Erica Ponzi

1 Biostatisztikai, Epidemiológiai, Biostatisztikai és Megelőzési Intézet, Zürichi Egyetem, Hirschengraben 84, 8001 Zürich, Svájc,

hibák

2 Biostatisztikai Tanszék, Oslo Epidemiológiai és Biostatisztikai Központ, Osloi Egyetem, Norvégia,

3 Epidemiológiai és Biostatisztikai Tanszék, Közegészségügyi Iskola, Imperial College London, London, Egyesült Királyság,

Paolo Vineis

3 Epidemiológiai és Biostatisztikai Tanszék, Közegészségügyi Iskola, Imperial College London, London, Egyesült Királyság,

4 Olasz Genomikai Orvostudományi Intézet (IIGM), Torino, Olaszország,

Kian Fan Chung

5 National Heart and Lung Institute, Imperial College London, Egyesült Királyság,

6 Royal Brompton és Harefield NHS Trust, London, Egyesült Királyság,

Marta Blangiardo

3 Epidemiológiai és Biostatisztikai Tanszék, Közegészségügyi Iskola, Imperial College London, London, Egyesült Királyság,

Társított adatok

A tanulmányban bemutatott eredmények alapjául szolgáló adatok, valamint az elemzés papíron történő reprodukálásához szükséges minimális adatkészlet a Nemzetközi Rákkutató Ügynökség (IARC) kérésére rendelkezésre áll, felhasználásukat és elérhetőségüket az Exposomics Steering szabályozza. Az IARC Etikai Bizottsága. Az érdeklődő kutatók hozzáférést kérhetnek az adatokhoz, ha kapcsolatba lépnek Pietro Ferrarival az IARC-tól az rf.crai@PirarreF címen. A vizsgálat eredményei teljes egészében reprodukálhatók az adatok megszerzésével és a Módszerek részben leírt protokoll követésével, vagy a kiegészítő anyagként megadott szkriptekkel. Megerősítjük, hogy a szerzők nem rendelkeztek olyan különleges hozzáférési jogosultságokkal ezekhez az adatokhoz, amelyek mások nem rendelkeznének.

Absztrakt

1. Bemutatkozás

A légszennyezés egészségre gyakorolt ​​hatásai jelentős közegészségügyi problémát jelentenek, és az elmúlt évtizedekben egyre nagyobb figyelmet kaptak [1, 2, 3]. Ebben az összefüggésben a kockázati tényezők, valamint a környezeti expozíció és az egészségi állapot közötti összefüggések megbízható becsléséhez nagy mennyiségű expozíciós adat összegyűjtése szükséges viszonylag nagy számú vizsgálati alanyra vonatkozóan, ami gyakran nem praktikus, és számos hibalehetőség vagy pontatlanság függvénye . Ez nemcsak a torzítás jelenlétéhez vezethet a vizsgálat szempontjából releváns paraméterek becslésénél, hanem pontatlan következtetésekhez is vezethet a szennyezők, a betegség kockázata és a biomarkerek közötti összefüggések értékelésekor. Bár a mérési hiba jelenlétét az ilyen vizsgálatokban a legutóbbi szakirodalom tárgyalta, és mára potenciális problémaként ismerik fel [4, 5], a szokásos elemzések során gyakran nem veszik figyelembe, amint arra [6, 7] rámutatott.

Jelen tanulmányban mérési hibatechnikák alkalmazását javasoljuk a környezeti expozíció hibájának kijavítására, figyelembe véve a nagy áteresztőképességű molekuláris adatokkal való összefüggésüket. Ez különösen nagy kihívást jelent az adatok nagy dimenzióssága, valamint az ugyanazon egyéntől mintavételezett omikák közötti összefüggés miatt. Bayes-féle keretrendszert használunk a probléma kezelésére, amely nagyon rugalmas módszert kínál a mérési hibák számbavételére, és az adatok különböző hibatípusainak és függőségi struktúráinak modellezésére. Különösen a Bayes-i hierarchikus modellek tűnnek ideálisnak ebben a kontextusban, mivel egyszerű utat kínálnak a kitettségek, de a különböző válaszváltozók közötti függőség beillesztésére is. Sőt, a hibakomponensekkel kapcsolatos előzetes ismeretek beépítésének lehetősége jobb modelleket és pontosabb becsléseket eredményezhet. Ezenkívül számos rögzített és véletlenszerű effekt modellezésének lehetősége, valamint a különböző linkfüggvények rugalmasságot és általános alkalmazhatóságot adnak a módszerekhez.

Ebben a cikkben ezt a megközelítést alkalmazzuk az Oxford Street II vizsgálatra, egy randomizált crossover vizsgálatra, ahol omikat és légszennyezés méréseket alkalmaznak a forgalommal összefüggő légszennyezés rövid távú kitettsége és a különféle omikus jelek zavarása közötti összefüggés vizsgálatára [16, 17]. Hibajavított modelleket valósítunk meg egy klasszikus mérési hiba keretrendszerben, és általánosítjuk ezeket a modelleket, hogy figyelembe vegyük a szennyező anyagok, valamint a válasz omikus változók közötti függőségeket. Ez újszerű módszert kínál a nagy dimenziójú omikus adatok kezelésére, beépítve őket egy Bayes-féle hierarchikus megfogalmazásba. Több omiás jel egyidejű modellezésének lehetősége lehetővé teszi a jelek közötti függőség számbavételét is. Ráadásul a hierarchikus megfogalmazásnak köszönhetõen egyszerû és rugalmas mérési hibakör felvétele eddig nem javasolt nagy áteresztõképességû biológiai adatok jelenlétében.

Modelleinket a Monte Carlo Markov Chain (MCMC) segítségével valósítjuk meg a JAGS-ben, de a számítás sebességének növelése érdekében az integrált beágyazott Laplace-közelítő megközelítést (INLA) [18] is alkalmazzuk, amelyet nemrégiben használtak mérési hibamodellek megvalósítására., például a [19] és [20].

A cikk fennmaradó része a következőképpen épül fel: először leírjuk a tanulmányt és a modellt a különböző légszennyező anyagok és az omikus mérések közötti összefüggés értékelésére, az anyagcsere útvonalaira összpontosítva. A cikk ezután bemutatja a Bayes-féle hierarchikus modellt, amelyet a mérési hiba elszámolásához fogalmazunk meg egy klasszikus hiba beépítésével (lásd a klasszikus mérési hibák meghatározását és elméleti megfontolását a 3. szakaszban). Ezt a modellt kibővítjük egy többválaszos modellel, figyelembe véve a függőségi struktúrát a különböző omikus jelek között, és egy többváltozós modellre, hogy a különböző szennyező anyagok közötti függőséget figyelembe vegyük. Ezután megmutatjuk az eredményeket az Oxford Street II tanulmány adatai alapján, végül több vitaponttal és a javasolt módszer lehetséges bővítésével zárulunk.

2 Metabolikus utak az Oxford Street II vizsgálatban

2.1 A tanulmány

2.2 A modell

A metabolit szintek és a TRAP expozíciók közötti összefüggést vegyes modell keretében értékelték, Bayes-féle megközelítést alkalmazva, és véletlenszerű hatásokat is tartalmaztak az egyénre, valamint az egyes mérések helyére és időpontjára. Rögzített hatások voltak a nem, az életkor, a BMI és az egészségcsoport (kategorikus változóként definiálva, egészséges, COPD és IHD szintként), valamint a kísérlet előtt egy évvel az átlagos légszennyezettségi koncentráció, háttérként vagy hosszú távú expozícióként, és az érdekes expozíció pillanatnyi mérése. A fent leírt négy kitettséget (CBLK, NO2, PM25 és PM10) külön-külön vettük figyelembe.

A modellt a következőképpen fogalmaztuk meg: