Informace

Frekvence alel ABO: Proč používat EM algoritmus?

Frekvence alel ABO: Proč používat EM algoritmus?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

V učebnicích a poznámkách a diapozitivech zveřejněných online se určování frekvencí alel pomocí informací o krevní skupině (ABO) za předpokladu Hardy-Weinbergovy rovnováhy provádí pomocí EM algoritmu. Zdá se mi však, že tento problém lze vyřešit pomocí základní algebry: If $a$, $ b $, $ o $ jsou frekvence $A$, $ B $, a $O$ alely, resp $p_A$, $ p_B $, a $p_O$ jsou podíly dotyčné populace vykazující krevní skupiny $A$, $ B $, a $ O $, pak

$$ p_A = a^2 + 2ao,quad p_B = b^2 + 2bo,quad ext{and}quad p_O = o^2. $$

Obrácení třetí rovnice dává $o$ ve smyslu $ p_O $:

$$ o = sqrt{p_O}. $$

Když to zapojíme do první rovnice a přeuspořádáme, dostaneme kvadratickou rovnici.

$$ a^2 + 2 sqrt {p_O} a - p_A = 0 $$

Řešením pomocí kvadratického vzorce a vyhozením záporného řešení dostaneme

$$ a = sqrt{p_O + p_A} - sqrt{p_O}. $$

Symetricky,

$$ b = sqrt{p_O + p_B} - sqrt{p_O}. $$

Vyřešili jsme tedy alelové frekvence $ a $, $b$, a $o$ pouze se základní algebrou.

Ve standardním učebnicovém případě, ve kterém $ p_A = fa = 186/521 $, $ p_B = 38/521 $, a $p_O = 284/521 $, to dává

$$ a cca 0,21, quad b cca0,05, quad text {a} quad o cca 0,74, $$

což se blíží tomu, co získáte po několika iteracích EM algoritmu.

Otázka (nakonec): Pokud je výše uvedený výpočet správný (pokud ne, dejte mi prosím vědět!), Jaký je „nejjednodušší“ nesyntetický (skutečná data z literatury) příklad výpočtu alelové frekvence z fenotypových dat, která ve skutečnosti vyžaduje sofistikovanou techniku, jako je EM algoritmus?


Algoritmus EM založený na interním seznamu pro odhadování haplotypových distribucí vzácných variant ze sdružených genotypových dat

Sdružování je nákladově efektivní způsob shromažďování dat pro studie genetické asociace, zejména pro vzácné genetické varianty. Je zajímavé odhadnout frekvence haplotypů, které obsahují více informací než statistika jednoho lokusu. Algoritmus očekávání-maximalizace (EM) je přirozeným algoritmem, který je používán, ale je výpočetně náročný. Nedávný návrh na snížení výpočetní zátěže je využití databázových informací k vytvoření seznamu často se vyskytujících haplotypů a omezení haplotypů pocházejících z tohoto seznamu pouze při implementaci algoritmu EM. Existuje však nebezpečí použití nesprávného seznamu a v některých aplikacích nemusí být dostatek databázových informací k vytvoření seznamu externě.

Výsledek

Zkoumáme možnost vytvoření interního seznamu z dostupných dat. Jedním ze způsobů, jak vytvořit takový seznam, je sbalit pozorované celkové frekvence menších alel na „nulu“ nebo „alespoň jednu“, což ukazuje, že má žádoucí účinek zesílení frekvencí haplotypu. Abychom zlepšili pokrytí, navrhujeme způsoby přidávání a odebírání haplotypů ze seznamu a srovnávací metodu pro stanovení prahové hodnoty frekvence pro odstraňování haplotypů. Výsledky simulace ukazují, že odhady EM založené na vhodně rozšířeném a zkráceném seznamu sbalených dat (ATCDL) fungují uspokojivě. Ve dvou scénářích zahrnujících 25 a 32 lokusů odhady EM-ATCDL překonávají odhady EM na základě jiných seznamů i odhadů maximální pravděpodobnosti sbalených dat.

Závěry

Navrhovaný rozšířený a oříznutý seznam CD je užitečný seznam pro algoritmus EM, z něhož lze vycházet při odhadu distribucí haplotypu vzácných variant. Dokáže zpracovat více markerů a větší velikost fondu než stávající metody a výsledné odhady EM-ATCDL jsou efektivnější než odhady EM založené na jiných seznamech.


Pozadí

Chov plodin začal počáteční domestikací divokých předků za účelem vytvoření fenotypů vhodných pro lidské použití [1]. Byly charakterizovány desítky genů souvisejících s domestikací a přispívají k našemu chápání genetického základu domestikace plodin [2, 3]. Sekvence DNA cílené během domestikačních akcí vykazují výrazně sníženou diverzitu nukleotidů v důsledku umělé selekce a prospěšné varianty jsou nyní většinou fixovány v krajových masách a moderní zárodečné plazmě [4]. Zlepšení plodin zahrnuje selekci dalších sad genů a užitečné varianty v těchto sekvencích se také časem nahromadily ve zlepšené zárodečné plazmě [5, 6]. Různé šlechtitelské cíle a adaptace na různá prostředí způsobily značně odlišnou distribuci alel napříč populacemi s jemnějšími účinky na fenotypovou morfologii ve srovnání s variacemi alel souvisejících s domestikací [7]. I když tento bohatý fond potenciálních genetických variant může dále zlepšit budoucí výnos plodin, jejich malé účinky na žádoucí vlastnosti komplikují jejich identifikaci a izolaci při analýze malých populací.

Přibližně tři procenta všech genů kukuřice byla podrobena selekci během domestikace a šlechtění [8, 9]. Začlenění užitečných alel těchto genů do šlechtitelských schémat se obecně realizuje křížením mezi jednotlivci, aby se umožnila akumulace a doladění fenotypových změn, které jsou důsledkem rekombinace DNA a přeskupení kauzálních variant [10]. Většina umělé selekce tedy v podstatě pracovala na přetvoření genových sítí, spíše než na jednotlivých genech [11]. Ačkoli obecně definujeme domestikaci a zlepšování jako odlišné jevy, geny a varianty ovlivňující každý z nich byly – a stále jsou – kooperativně vybírány a přijímány k dosažení zlepšení vlastností. Šlechtitelskému úspěchu by prospělo lepší pochopení tohoto procesu, který je dodnes neuchopitelný.

Zlepšení kvantitativních vlastností, jako je doba květu, vzrůst rostliny, výnos zrna, adaptace na prostředí a odolnost vůči biotickému a abiotickému stresu, závisí na výběru biologických interakcí mezi více geny (polygenní interakce) [12]. Aby se dosáhlo požadovaného cíle pro cílový znak, chovatelé rozvíjejí populace křížením panelu chovných materiálů za účelem vytvoření nových kombinací příznivých alel a diverzifikovaných polygenních interakcí, které lze vybrat pro optimální znaky [13, 14]. Většina genů kódujících polygenní znaky přispívá jemnými efekty k celkové expresi kvantitativních znaků, protože přepracované sítě genových interakcí zahrnují desítky až stovky genů. Z tohoto důvodu byly modely predikce genotypu k fenotypu (G2P) nebo genomová selekce (GS) využívající variace celého genomu účinným řešením pro predikci hybridní výkonnosti pro šlechtění rostlin [15,16,17,18,19].

Kukuřice (Zea mays) byla jednou z prvních plodin, které těžily ze síly heterózy šlechtěním filiální (F1) hybridy vykazující vynikající sílu pro růst rostlin a výnos zrna. Tajemství heterózy bylo zkoumáno více než století, ale základní mechanismus zůstává nedostatečně pochopen [20]. Jednou z hypotéz pro heterózu je model „dominance“, který navrhuje tuto hybridní sílu F1s je výsledkem dominance komplementace mnoha recesivních, mírně škodlivých alel na různých lokusech v rodičovských genomech [21, 22]. Tato hypotéza byla dále potvrzena Yangem a kol., Ve kterých byla identifikována identifikace škodlivých mutací v celém genomu a prokázala, že dominantní komplementace škodlivých alel přispěla k tvorbě heterózy [23]. Druhou hypotézou pro heterózu je overdominance, že heterozygotnost na jednotlivém lokusu způsobuje vyšší fenotyp ve srovnání s oběma homozygotními stavy [24]. Existuje několik genů podporujících overdominanci v plodinách [13, 25, 26]. Vývoj technologií molekulárních markerů a sekvenování nové generace (NGS) umožnil rozsáhlé studie mapování genomu u všech hlavních plodin. Tyto analýzy, založené na segregaci populací velmi často odvozených pouze od dvou rodičů, umožnily rozbor genetické architektury heterózy, většinou se zaměřením na výnos zrna [13, 27,28,29,30,31,32].

Výskyt a síla heterózy se velmi liší v závislosti na původu zárodečné plazmy rodičovských linií, takže genetická diverzita populace vytvořené pouze se dvěma rodiči nebude nikdy dostatečná k identifikaci všech heterotických kvantitativních lokusů (QTL). Další omezení bi-rodičovských populací dále omezují efektivní detekci epistatických QTL. Například každý segregující F2 populace musí být velmi velká, aby byla zajištěna dostatečná statistická síla. Kromě toho musí být jakékoli dvě interagující lokusy zapojené do heterózy segregující ve F2 populace, nebo epistáze nebude detekována. Tato dvě omezení jsou hlavními důvody, proč mnoho předchozích studií heterózy podcenilo roli, kterou hraje epistasis [28, 33].

Zde představujeme nový genetický design, který překonává tato omezení a analyzuje více propojených F1 populace. Byl vytvořen křížením inbredních linií, vyvinutých jako syntetická populace, s inbredními liniemi typickými pro různé heterotické skupiny z celého světa. Tento design může umožnit komplexní disekci heterotických QTL a souvisejících účinků. Identifikace genů určujících heterózu může upřesnit naše chápání mechanismu vzniku heterózy. Tyto nové mechanistické znalosti mohou zase urychlit proces vytváření a fixace nových heterotických vzorců mezi různými zásobníky zárodečné plazmy, snížení genetické zranitelnosti a v konečném důsledku zvýšení výnosu při zlepšování kukuřice.

Sestrojili jsme 30 F1 populací křížením 1428 dříve hlášených inbredních linií ze syntetické populace CUBIC (Complete-dialel plus Unbalanced Breeding-derived Inter-Cross) jako mateřský pool [34] s 30 otcovskými testery z různých heterotických skupin. Provedli jsme asociační studie celého genomu (GWAS) u všech populací, abychom identifikovali geny spojené s heterózou a zvláštnostmi, které se podílejí na zlepšování kukuřice. Výslech 42 840 F1 kombinace odhalily kritické role polygenních interakcí a poskytly rámec pro návrh teoretického modelu sítí regulace genů při práci během květového přechodu. Na základě tohoto modelu jsme použili cílené geny a jejich přidružené účinné varianty k demonstraci úspěšné implementace šlechtění molekulárního designu (MDB), abychom usnadnili výběr optimálních genotypových kombinací pro doladění požadovaných fenotypů. Díky integraci G2P, GWAS a MDB na skutečné chovné populaci představuje naše práce příkladné řešení pro použití rozhodovacích strategií založených na velkých datech pro cílené šlechtění pro zlepšení plodin (obr. 1a).

Genetický design třiceti F1 hybridní populace. A Vývojový diagram znázorňující integraci genotypu do fenotypu (G2P), celogenomové asociační studie (GWAS) a šlechtění podle molekulárního designu (MDB) za účelem dosažení cíleného šlechtění s pomocí velkých dat. b Schematické znázornění návrhu Severní Karolíny-II použitého ke generování 42 840 F1 kombinací křížením 1428 mateřských linií s 30 otcovskými testery. Tréninková sada se skládá z 8 652 hybridů s terénně měřenými fenotypy (tmavě šedé pozadí). Zbývajících 34 188 hybridů tvoří kandidátskou sadu, jejíž fenotypy byly předpovězeny pomocí modelu G2P. C Schéma principové analýzy komponent (PCA) třiceti F1 hybridní populace vykazující silnou populační stratifikaci. d Vliv fenotypové stratifikace přes třicet F1 hybridní populace, jejichž příkladem jsou dny se střapcem (DTT), před (vlevo) a po (vpravo) normalizaci absolutních hodnot vlastností na z-skóre v každém F1 počet obyvatel. E Silný výkon heterózy u Zheng58 a Jing724 F1 hybridy ve srovnání s jejich rodičovskými inbredními liniemi pro tři studované znaky


Výsledek

Pomocí simulací zkoumáme různé návrhy studií, které by mohly nastat pro reálná data, a hodnotíme výkonnost NGSadmix porovnáním odhadovaných proporcí příměsí se skutečnými proporcemi příměsí a také odhadů proporcí příměsí na základě genotypů vyvolaných ze simulovaných sekvenčních dat. Metodu poté aplikujeme na data sekvenování s nízkou hloubkou z projektu 1000 Genomes a porovnáváme odhady s proporcemi příměsí odvozenými z genotypových dat HapMap 3 a také genotypů volaných z sekvenčních dat.

Simulace

Zvažovali jsme dva různé populační scénáře pro naše simulace: tři blízce příbuzné populace předků založené na frekvencích alel HGDP a tři vzdálenější populace založené na frekvencích alel HapMap 3. Pro každou z těchto sad frekvencí alel jsme simulovali čtyři různé studijní návrhy, označené scénáře A, B, C a D. Simulovali jsme sekvenční data podmíněná proporcemi příměsí a četností alel v rodových populacích. Další podrobnosti o simulacích naleznete v Materiály a metody.

Scénář A: Proměnná hloubka:

Inspirováni pozorovanou distribucí průměrné hloubky v datech 1000 Genomes (viz obrázek S1) jsme simulovali 100 000 SNP pro 50 vzorků s různou průměrnou hloubkou na základě frekvencí HGDP, jak je popsáno v Materiály a metody. Skutečné poměry příměsí jsou znázorněny v horním panelu na obrázku 1, za nimiž následují jednotlivé průměrné hloubky sekvenování. Ostatní panely na obrázku 1 ukazují odhadované koeficienty příměsí pomocí NGSadmix, odhadované koeficienty příměsí založené na genotypech maximální pravděpodobnosti (ML) a maximálních zadních genotypech (HW). U filtrovaných genotypů HW (filtrovaných HW) jsme nemohli dosáhnout konvergence a odhady jsou uvedeny na obrázku S6. NGSadmix funguje lépe než analýza založená na volaných genotypech bez ohledu na to, jak byly genotypy nazývány. Zdá se, že HW genotypy nazvané aplikací a prior na základě frekvencí alel fungují lépe než volání genotypů na základě nejvyšší pravděpodobnosti genotypu (genotypy ML).

Abychom kvantifikovali výkonnost mimo vizuální kontrolu, vypočítali jsme střední kvadratickou odchylku (RMSD) odhadovaných poměrů příměsí od skutečných poměrů příměsí (viz skupina sloupců úplně vlevo na obrázku 2). Použití NGSadmix dává RMSD 0,16, zatímco metoda s nejlepším výkonem založená na nazývaných genotypech má RMSD 1,18. Podobně největší odchylka mezi odhadovanými podíly a skutečnými podíly je znázorněna na obrázku S2.

Kořenová střední kvadratická odchylka (RMSD) od skutečných poměrů příměsí pro různé odhadované poměry příměsí. Vlevo simulace scénáře A, B a C pomocí frekvencí HGDP a poté simulace scénáře A, B a C pomocí frekvencí HapMap. Správně, vzorek 1000 genomů s pěti populací za předpokladu K = 3 rodové populace a K = 4 populace předků a poté vzorek scénáře dvou populací 1000 Genomes za předpokladu K = 2 rodové populace. Všimněte si, že RMSD je zobrazen na log-škále.

Stejný scénář byl také simulován na základě frekvencí alel ze tří odlišných populací z HapMap 3. Všechny přístupy fungují lépe, protože populace jsou snadněji rozlišitelné (viz obrázek S5). Je zajímavé, že HW genotypy jsou na tom u vzdálenějších populací hůře než genotypy ML (viz obrázek 2). NGSadmix stále překonává metody založené na tzv. genotypech.

Scénář B: Nízká hloubka:

Při simulaci scénáře s nízkou a stejnou hloubkou 2 × pro všechny jednotlivce volání genotypů nevykazuje velké zkreslení jasně viditelné ve scénáři s proměnnou hloubkou (viz obrázek S3 a obrázek S4). NGSadmix stále funguje lépe s RMSD 0,11, zatímco nejvýkonnější metoda založená na tzv. genotypech má RMSD 0,18 v simulacích založených na HGDP (HGDP Low na obrázku 2). Volající genotypy na základě více vzorků, jako je použití alelových frekvenčních předchozích, obecně generují lepší genotypové volání než individuální volající genotypy (Nielsen a kol. 2011). Pro tuto simulaci však dávají o něco lepší výsledek nazývané genotypy ML založené pouze na pravděpodobnosti jednotlivých genotypů. To platí jak pro blízce příbuzné populace, tak pro vzdáleně příbuzné populace.

Scénář C: Vysoká a nízká hloubka:

Tento scénář se snaží napodobit návrh, kde je referenční panel sekvenován ve vysoké hloubce nebo genotypován pomocí čipů SNP, zatímco někteří jedinci jsou sekvenováni ve velmi nízké hloubce (viz obrázek S7 a obrázek S8). NGSadmix poskytuje přibližně správné proporce příměsí při simulaci vzdálených i blízce příbuzných populací. Při volání genotypů se však odhadované poměry příměsí pro blízce příbuzné populace podobají rozdílu v hloubce sekvenování více než skutečnému původu. Tyto problémy se jasně odrážejí v RMSD a v maximálním rozdílu mezi skutečným a odhadovaným poměrem příměsí (High/Low na obrázku 2 a obrázku S2). U populací HapMap poskytují genotypy ML dobré výsledky ve srovnání s genotypy HW a filtrovanými.

Scénář D: Malé proporce příměsí:

V praxi může být příspěvek jedné populace předků k předkům jednotlivce mnohem nižší než podíly studované výše. V tomto scénáři jsme simulovali jedince s hloubkou sekvenování mezi 0,5 × a 6 × a se širokou škálou poměrů příměsí až 5%, viz horní panel na obrázku S9. NGSadmix identifikuje i nízké úrovně příspěvku předků poměrně přesně pro vzdálené i blízce příbuzné populace (viz obrázek S9 a obrázek S10). Obrázek S9 a obrázek S10 ilustrují, jak může hloubka sekvenování vážně ovlivnit poměry příměsí odhadované z nazývaných genotypů. Abychom dále popsali přesnost odhadovaných poměrů příměsí, simulovali jsme 100 realizací tohoto scénáře. Pro každou simulaci jsme také odhadli podíly příměsí přímo ze skutečných simulovaných genotypů. Obrázek S11 a obrázek S12 ukazují, že i když je určitá přesnost ztracena, NGSadmix si nevede o moc hůře než odhady ze skutečných simulovaných genotypů.Z obrázku S13 vidíme, že NGSadmix obecně překonává odhadované proporce příměsí z nazývaných genotypů bez ohledu na proporce příměsí. Obrázky S14 a S15 ukazují, že distribuce koeficientů odhadovaných z nazývaných genotypů silně závisí na hloubce sekvenování s malými rozdíly mezi proporcemi příměsí.

1000 sekvenčních dat Genomes

Testovali jsme výkon naší metody na sekvenčních datech 1000 Genomes s nízkým pokrytím. Vybrali jsme 100 jedinců z pěti odlišných populací HapMap 3, které se překrývají s daty sekvenování 1000 Genomes s nízkým pokrytím. K vyhodnocení výkonu jsme nejprve použili ADMIXTURE (Alexander a kol. 2009) na veřejně dostupných genotypech HapMap 3. Výsledky za předpokladu, že tři rodové populace jsou uvedeny na obrázku 3 a výsledky pro čtyři populace jsou na obrázku S17. Pro stejná místa jsme vygenerovali pravděpodobnosti genotypu na základě dat sekvenování. Poměry příměsí odhadnuté pomocí NGSadmix jsou uvedeny na druhých panelech na obrázku 3 a obrázku S17. Odhady založené na sekvenčních datech jsou téměř k nerozeznání od odhadů založených na genotypech HapMap 3 s maximálním pozorovaným rozdílem v podílu příměsí 1,5% (značené K = 3 na obrázku S2). Analýza založená na nazývaných genotypech také zachycuje většinu signálu příměsí, ale u genotypů HW vykazuje několik neadmixovaných jedinců velké množství příměsí (viz obrázek S16). Odhady založené na tzv. genotypech mají obecně vyšší RMSD a vyšší maximální odchylku (označené K = 3 na obrázku 2 a obrázku S2). Odhady založené na imputovaných genotypech haplotypu však byly jen o něco horší než NGSadmix. Podobné výsledky jsou pozorovány při předpokladu vyššího počtu populací (obrázek S17).

Odhadované podíly příměsí z dat genotypu HapMap 3 (nahoře) a výsledků NGSadmix (dole) pro data sekvenování s nízkou hloubkou z 1000 genomů.

Testovali jsme také NGSadmix na japonských a čínských Číňanech, protože tyto populace jsou si více blízké a je mnohem obtížnější je odlišit. Odvozená struktura populace nemusí být způsobena dvěma odlišnými homogenními rodovými populacemi, ale může být místo toho výsledkem složitější historie populace. Všechny metody mají v této sadě dat horší výsledky. Jak bylo pozorováno v simulovaných datech, odhadované proporce příměsí korelují s hloubkou sekvenování pro genotypy ML a HW, zatímco proporce příměsí odhadované pomocí NGSadmix a imputovaných genotypů haplotypu poměrně dobře odpovídají těm odvozeným pomocí genotypů HapMap 3 (viz obrázek S18).

Doposud byla analyzována pouze místa, o kterých je známo, že jsou polymorfní. U některých populací nemusí být k dispozici velká sada známých SNP. Proto jsme odvodili SNP ze sekvenačních dat a založili analýzu na těchto SNP. Rozhodli jsme se volat SNP z 50 10-Mb náhodně vybraných oblastí. To vedlo k >gt2 milionům odvozených SNP. Výsledky založené na této analýze jsou vidět na obrázku S19. Všimněte si, že u smíšených jedinců nemůžeme očekávat přesně stejné výsledky ze dvou různých sad SNP, protože alely z jedné populace budou přítomny v dlouhých úsecích podél genomu. Stále však vidíme velmi vysokou korelaci s analýzou z dat čipu SNP. Odhadli jsme pravděpodobnost genotypu pomocí rovnice 1 i SAMtools (H. Li a kol. 2009). Ačkoli poskytli velmi odlišný počet polymorfních míst, poskytli podobné odhady poměru příměsí.

Konvergence a výpočetní rychlost

Konvergence může být někdy problém kvůli velkému počtu parametrů, které se odhadují současně. Proto byl každý scénář spuštěn vícekrát s různými náhodnými výchozími body. Při použití NGSadmix na pravděpodobnosti genotypu se všechny běhy obvykle sbíhají ke stejnému maximu. Při volání genotypů ze sekvenačních dat byla konvergence v některých scénářích spíše problémem a zde jsme museli mnohokrát spustit ADMIXTURE, abychom určili maximum (viz tabulka S1).

Při aplikaci NGSadmix na 100 jedinců z projektu 1000 Genomes s téměř 3 miliony SNP tato metoda trvala v průměru téměř 5 hodin s použitím 10 vláken centrální procesorové jednotky (CPU). Při spouštění ADMIXTURE na genotypech čipů SNP ze stejných dat byla doba běhu v průměru 0,5 hodiny, také s použitím 10 vláken CPU. Pro 100 realizací scénáře D s 340 jednotlivci byl průměrný čas pro NGSadmix pro frekvence HapMap 12,2 min (SD = 1,9), při použití 6 CPU.


Distribuce krevních skupin a genová diverzita ABO a Rh (D) Loci v mexické populaci

Objektivní. Stanovit frekvenci a distribuci ABO a Rh (D) antigenů a navíc zkoumat genovou diverzitu a strukturu mexických populací. Materiály a metody. Krevní skupiny byly testovány u 271 164 subjektů v letech 2014 až 2016. Krevní skupina ABO byla stanovena aglutinací s použitím protilátek anti-A, Anti-B a Anti-D pro Rh faktor. Výsledek. Celková distribuce skupin ABO a Rh (D) ve studované populaci byla následující: O: 61,82 % A: 27,44 % B: 8,93 % a AB: 1,81 %. Ve skupině Rh bylo 95,58 % lidí Rh (D) a 4,42 % Rh (d). Kromě toho byly nalezeny různé distribuce krevních skupin napříč regiony, genetická analýza odhalila, že

alela vykazovala rostoucí trend ze severu do centra, zatímco

alela měla tendenci se zvětšovat od středu k severu. Také jsme u obou našli větší genovou diverzitu loci na severu ve srovnání s centrem, což naznačuje strukturu populace v Mexiku. Závěr. Tato práce by mohla pomoci zdravotnickým institucím určit, kde mohou získat krevní produkty nezbytné pro lékařské zákroky. Tato informace navíc přispívá k poznání genetické struktury mexických populací, což by mohlo mít významné důsledky v různých oblastech biomedicíny.

1. Úvod

Od objevu systému ABO Karlem Landsteinerem v roce 1901 uběhlo více než jedno století, tyto znalosti přispěly k pochopení některých mechanismů na základě dědičnosti a dnes mají stále velký koncepční a klinický zájem [1] také o krevní antigeny souvisí s predispozicí jednotlivců k některým chorobám, jako je rakovina, cukrovka, infekční onemocnění a srdeční choroby [2–4], nebo s ochranou jednotlivců před některými chorobami, jako je malárie a diabetes [5, 6]. K hodnocení etnické rozmanitosti lidských populací byly navíc použity krevní antigeny [7], u nichž byly široce studovány v populační genetice [8, 9].

Krevní skupiny ABO a Rh jsou nejdůležitějšími antigeny, protože jejich inkompatibilita způsobuje hemolýzu [10] a hemolytické onemocnění novorozence v případě skupiny Rh [11]. Krevní antigeny navíc hrají důležitou roli v úspěchu transfuzí a orgánových transplantací [12] je žádoucí kompatibilita skupin ABO mezi dárci a příjemci, aby se zabránilo imunitním reakcím proti aloimplantátu a omezilo se používání imunosupresivních terapií.

Hlavní výzvou je porozumět tomu, jak podporovat tolerantní imunitní reakce proti tkáním aloimplantátu. Byly studovány různé faktory, jako je věk, virová sérologie a pohlaví, aby se identifikoval jejich vztah s odmítnutím aloštěpu. Role etnicity byla navíc málo prozkoumána [13–17]. Z výše uvedeného má molekulární biologie velký význam pro identifikaci genetických variant přítomných v několika etnických skupinách, které by mohly hrát důležitou roli v úspěchu aloštěpů mezi dárci a příjemci [18].

V Mexiku existuje jen málo prací o populační genetice [19–21]. První studie provedli Lisker a kolegové v domorodých a městských populacích studiem několika krevních antigenů [9, 22], studováno však bylo jen málo populací a v současné době v zemi chybí informace o distribuci krevních skupin, což je zásadní získat tyto informace, aby pomohly zdravotnickým institucím efektivně řídit jejich krevní banky, které usnadňují praktiky transplantační medicíny.

Zde uvádíme distribuci antigenů ABO a D v 17 státech země. Kromě toho jsme použili lokusy ABO a D jako genetický znak ke zkoumání genové struktury mexických populací. Výše uvedené poskytne informace, které by podpořily národní programy pro transplantaci krve a orgánů v Mexiku a také zvýšily znalosti mexické genetiky.

2. Materiál a metody

2.1. Studovat design

Průřezová studie byla provedena u pacientů, kteří v letech 2014 až 2016 navštívili kliniky Salud Digna para Todos v 17 státech Mexika. Výběr účastníků byl proveden pomocí nepravděpodobnostního odběru vzorků s informacemi o testu krevní skupiny. Od každého člověka byla před screeningem na jeho demografická data získána klinická historie. Bylo vybráno 271 164 subjektů ve věku od 0 do 90 let obou pohlaví. Etické schválení bylo získáno od Etického a výzkumného výboru Lékařské fakulty Autonomní univerzity Sinaloa.

2.2. Odběr vzorků a stanovení krevních skupin

Od každého pacienta jsme odebrali přibližně 5 ml periferní žilní krve odběrovou zkumavkou BD Vacutainer® s EDTA. Zkumavky byly převráceny 8 až 10krát, aby se dobře promíchaly s antikoagulantem. Vzorky krve byly centrifugovány při 1000 až 1500 otáčkách za minutu po dobu 10 minut. Pro stanovení krevní skupiny byly separovány erytrocyty. Krevní skupina ABO byla stanovena z každého vzorku aglutinací s použitím protilátek anti-A a Anti-B (Immucor Inc., Norcross, GA, USA) Rh faktor byl stanoven aglutinací s použitím protilátky Anti-D (Immucor Inc., Norcross, GA, USA). Všechny testy byly provedeny pomocí analyzátoru krve Galileo Echo ™ (Immucor Inc., Norcross, GA, USA) podle doporučení výrobce.

2.3. Analýza alelické frekvence a genové diverzity

Frekvence alel byly odhadnuty podle Bernsteinovy ​​metody (1925) [23] z fenotypových dat byla vypočtena očekávaná frekvence za předpokladu Hardy-Weinbergovy rovnováhy z fenotypů Rh a ABO, s algoritmem Expected-Maximization (EM) [24]. . Genová diverzita byla analyzována podle Nei [25]. Genetické vzdálenosti Nei [26] byly vypočteny na základě údajů o genových frekvencích lokusů ABO a D a byl vytvořen dendrogram pomocí procedury shlukování sousedů (NJ) se softwarem POPTREEW [27]. Genové frekvence byly použity pro analýzu hlavních složek (PCA).

2.4. Statistická analýza

Demografická a fenotypová data byla analyzována pomocí popisné statistiky. Poměry krevních skupin jsou uvedeny v procentech s 95% CI. Byl proveden test chí-kvadrát pro porovnání rozdílů mezi skupinami a kategoriemi.

hodnoty menší než 0,05 byly považovány za statisticky významné. Pro výpočet 95% CI byla provedena metoda Wilsonova skóre bez korekce kontinuity. Data byla analyzována pomocí softwaru Minitab V17 (Minitab Inc.).

3. Výsledky

3.1. Distribuce krevních skupin podle věku a pohlaví

Distribuce krevních skupin u 271 164 studovaných osob odhalila, že O byl nejčastější (61,82%), následovaný A na 27,44%a B na 8,93%a nakonec skupina AB byla méně častá na 1,81%. Skupina Rh (D) byla navíc nalezena u 95,58% studovaných lidí a 4,42% bylo identifikováno se skupinou Rh (d) (obrázek 1).

Sdružené skupiny ABO a Rh měly následující rozdělení: nejčastější byl typ O Rh (D) (59,26 %), dále A Rh (D) (26,08 %), B Rh (D) (8,53 %), O Rh (d) (2,56 %), AB Rh (D) (1,71 %) a A Rh (d) (1,35 %). Naproti tomu B Rh (d) (0,40%) a AB Rh (d) (0,10%) byly méně časté, což bylo zjištěno u méně než 1%studovaných osob (tabulka 1).

Byla analyzována distribuce spojených krevních antigenů mezi věk a pohlaví a bylo zjištěno, že mají podobné frekvence u lidí v rozmezí od 0 do 90 let (tabulka 1). Je zajímavé, že u některých krevních skupin byly u obou pohlaví pozorovány mírné rozdíly.

Krevní skupiny Rh (D) a AB Rh (D) byly častější u mužů (26,88%, resp. 1,84%) než u žen (25,74%, resp. 1,66%). Mezitím O Rh (D) nejvíce převažovaly u žen (59,78 %) než u mužů (58,04 %) (tabulka 1).

3.2. Geografická distribuce krevních skupin

Krevní skupiny byly studovány v 17 státech, které patří do 6 oblastí Mexika, krevní skupiny O a Rh (D) byly nejčastější ve všech analyzovaných státech. Jejich frekvence se však v celé zemi mění (obrázek 2). Krevní skupina O Rh (D) byla častější v Puebla (73,15 %), Estado de Mexico (69,32 %) a San Luis Potosi (66,18 %) ve srovnání s Sinaloa (52,73 %), Jalisco (54,86 %) a Sonora (54,97%). Krevní skupina A Rh (D) byla navíc častější u Sinaloa (30,52%), Nayarit (28,60%) a Sonora (28,29%), zatímco u Puebla (18,34%), Estado de Mexico (20,48%) a Veracruz ( 21,34%) byl méně rozšířený (obrázek 2 a tabulka 2).

krevních skupin ABO a Rhesus v různých státech Mexika. Koláčové grafy shrnují průměrné podíly ABO v jednotlivých státech sdružené do skupiny Rh (D) a sloupce ukazují podíly ABO v kombinaci s krevní skupinou Rh (d). Celostátní průměr krevní skupiny: 4,42 % pro Rh (d) (šedá barva) a 95,58 % pro Rh (D), včetně 61,82 % pro O (červená barva), 27,44 % pro A (zelená barva), 8,93 % pro B ( modrá barva) a 1,81% pro skupiny AB (oranžová barva). BC = Baja California SON = Sonora SIN = Sinaloa DGO = Durango NAY = Nayarit COAH = Coahuila JAL = Jalisco MICH = Michoacan NL = Nuevo Leon GTO = Guanajuato AGS = Aguascalientes QRO = Queretaro SLP = San Luis Potosi VER = Veracruz de MEX Mexico PUE = Puebla CDMX = Ciudad de Mexico.

B Rh (D) byl častější v Durangu (10,86 %), Aguascalientes (9,90 %) a Nuevo Leon (9,88 %), naopak tato skupina byla méně převládající v Puebla (5,97 %), Estado de Mexico (7,00 %). , a San Luis Potosi (7,12%). O Rh (d) byl častější v Sinaloa (3,73%), Sonora (3,61%) a Durango (3,09%) než Puebla (1,21%), San Luis Potosi (1,29%) a Estado de Mexico (1,36%) . U AB Rh (D) jsme zjistili, že je častější u Durango (2,40%), Jalisco (2,24%) a Michoacan (2,22%) a méně časté u Puebla (0,85%), San Luis Potosi (0,97%), a Estado de Mexico (1,02%).

Krevní skupina A Rh(-) byla častější v Sinaloa (2,41 %), Sonora (2,19 %) a Jalisco (1,77 %) než Puebla (0,39 %), San Luis Potosi (0,32 %) a Veracruz (0,56 %) ), kde to bylo méně časté. Krevní skupina B Rh (d) byla častější v Nayarit (0,63 %), Sinaloa (0,62 %) a Sonora (0,55 %) a méně převládala v Puebla (0,08 %), San Luis Potosi (0,16 %) a Estado de Mexico (0,18%) konečně, skupina AB Rh (d) byla častější u Michoacanu (0,24%), Sonory (0,13%) a Sinaloa (0,12%), chyběla v Nuevo Leon (0,00%) a San Luis Potosi (0,00 %) a byl méně častý v Puebla (0,02 %) a Estado de Mexico (0,02 %) (tabulka 2).

3.3. Genetická analýza ABO a D Loci
3.3.1. Heterozygotnost a Hardy-Weinbergova rovnováha v ABO a D Loci

Analyzovali jsme heterozygotnost ABO a D loci ve studovaném vzorku (tabulka 3). Nejvyšší heterozygotnosti ABO místo byly nalezeny v Sinaloa

, zatímco nejnižší byl nalezen v Puebla, Estado de Mexico a San Luis Potosi

. Podobně pro D místo v Sinaloa, Sonora a Durango byly pozorovány nejvyšší heterozygozity, zatímco nejnižší heterozygozity byly pozorovány v Puebla, San Luis Potosi a Estado de Mexico (tabulka 3).

Podle těchto pozorování byly populace analyzovány, abychom věděli, zda jsou v Hardy-Weinbergově rovnováze (HWE). Pro ABO místoV Jalisco byly pozorovány významné odchylky (χ 2 = 6.03

) a Ciudad de Mexico (χ 2 = 5,42). Naproti tomu jsme zjistili, že místo D byl ve HW rovnováze ve všech analyzovaných populacích (tabulka 3).

3.3.2. Alelická distribuce

Alelové frekvence ABO a D loci byly odhadnuty z pozorovaných fenotypů. Bylo zjištěno, že alela byla častější v Sinaloa, Jalisco a Sonora, zatímco v Puebla, Estado de Mexico a Veracruz byla méně častá (tabulka 3). Allele

byla častější v Durango, Aguascalientes a Jalisco, zatímco v Puebla, Estado de Mexico a San Luis Potosi byla tato alela méně častá (tabulka 3).

byla častější v Puebla, Estado de Mexico a San Luis Potosi, zatímco tato alela byla méně častá v Sinaloa, Jalisco a Sonora (tabulka 3).

U skupiny Rhesus byla alela častější v Puebla, San Luis Potosi a Estado de Mexico. V Sinaloa, Sonora a Jalisco byla tato alela méně častá. Alela byla častější v Sinaloa, Sonora a Jalisco, zatímco Puebla, San Luis Potosi a Estado de Mexico byly státy, ve kterých byla tato alela méně častá (tabulka 3).

ABO a D loci nebyly distribuovány homogenně mezi státy, abychom porozuměli pozorovaným odchylkám, použili jsme Principal Component Analysis (PCA) na základě alelových frekvencí ABO a D loci (Tabulka 3). PC1 a PC2 vysvětlují 97,2% celkové variace distribuce krevních skupin ABO a Rh. PC1 rozlišuje populace s vysokými frekvencemi alel a mezitím PC2 odděluje populace s vysokým podílem a alel podle toho lze definovat čtyři skupiny (obrázek 3).

První skupina zahrnuje státy Coahuila, Queretaro a Veracruz, které mají mírné frekvence alel a (první kvadrant). Druhá zahrnuje Durango, Aguascalientes, Nuevo Leon a Guanajuato, které mají vyšší podíly B a D alely a střední frekvence alely (druhý kvadrant).

Obě skupiny mají stavy s vyššími frekvencemi krevních skupin B Rh (D) a B Rh (d) ve druhé skupině, jsou stavy se středním zastoupením krevní skupiny AB. Geografické seskupení v těchto skupinách nebylo evidentní (obrázek 3).

Je zajímavé, že ve třetí a čtvrté skupině bylo pozorováno geografické shlukování. Třetí skupina zahrnuje státy Puebla, San Luis Potosi, Estado de Mexico a Ciudad de Mexico (třetí kvadrant), které mají vyšší frekvence a alely a nižší frekvence alely a.Tyto státy se nacházejí na východě, severu a jihu středu země (tabulka 3). Čtvrtá skupina má vyšší frekvence a alely a zahrnuje státy Sinaloa, Sonora, Baja California, Michoacan, Jalisco a Nayarit, které patří k severozápadu a západu Mexika (tabulka 3).

K analýze vztahu mezi studovanými populacemi jsme použili postup shlukování sousedství (NJ) založený na Neiových genetických vzdálenostech (DA). Byly identifikovány dva hlavní shluky, první zahrnuje státy Puebla, Estado de Mexico, San Luis Potosi, Ciudad de Mexico, Veracruz, Queretaro a Coahuila (které mají vyšší frekvence alely Tabulka 3). Do druhého byly zahrnuty Sinaloa, Sonora, Jalisco, Michoacan, Nayarit, Baja California a Durango (které mají v případě Duranga vyšší frekvence alel a alel). Do této skupiny byly zahrnuty také státy Aguascalientes, Guanajuato a Nuevo Leon, protože mají vyšší frekvence alely a jsou více příbuzné s Durangem než ostatní státy této skupiny (obrázek 4).

3.3.3. Struktura populace a genová diverzita

Výsledky shlukování PCA a NJ frekvencí alel ABO a D dokládají genovou rozmanitost mezi mexickými populacemi. Formálně měřit genetickou diferenciaci

, shromáždili jsme veškerou studovanou populaci ve 4 hlavních regionech a pro každý jsme provedli analýzu místo a sdružené loci. Skupiny jsou sever (Baja California, Sonora, Sinaloa, Nuevo Leon, Durango a Coahuila), západ (Nayarit, Jalisco a Michoacan), východ (Puebla a Veracruz) a střed (San Luis Potosi, Aguascalientes, Guanajuato, Queretaro, Estado de Mexico a Ciudad de Mexico).

Celková genová diverzita byla vyšší na ABO místo než D místo podobně byla genová diverzita v populacích v ABO vyšší místo než D. místo . Genová diferenciace však byla vyšší u D místo než ABO místo (Tabulka 4).

: genetická rozmanitost v rámci populací

: genetická rozmanitost mezi populacemi

Regionální analýza ukazuje, že nejvyšší genová diverzita a variabilita v rámci populací pro ABO místo byly nalezeny na západě ( ), zatímco nejnižší byly pozorovány na východě ( , ). Pro D místo, nejvyšší diverzita a variabilita genů v populaci byla pozorována na severu (,) a nejnižší byla nalezena na východě (,) (tabulka 4).

Nejvyšší genetická diferenciace pro ABO místo byl nalezen na severu a na západě pro D místo. Překvapivě byla nalezena záporná hodnota parametru genetické diferenciace na východě, což naznačuje, že v obou není žádná diferenciace loci v této oblasti, což je v souladu s pozorovanými nízkými heterozygotnostmi (tabulka 4).

4. Diskuze

Studium krevních skupin je v klinické praxi zásadní vzhledem k inherentnímu vztahu transfuzního lékařství a orgánových transplantací [12]. V Mexiku se míra darování krve v roce 2014 zvýšila z 15,66 na 1000 jedinců na 17,33 na 1000 jedinců v roce 2015 [28]. Výše uvedené je způsobeno zlepšením programů dárcovské krve zavedených v zemi, nicméně v krevních bankách je obtížné získat dostatek krevních jednotek, zejména pro méně časté krevní skupiny.

Pro výše uvedené je nutné zavést efektivní programy mezi zdravotnickými institucemi, aby získaly konkrétní krevní skupiny a produkty podle jejich geografického rozšíření. Informace o podílech krevních skupin ABO a Rh (D) v Mexiku však k uspokojení této potřeby nepostačují. Zde uvádíme distribuci krevních skupin ABO a Rh (D) v několika oblastech země.

Pokud je nám známo, jedná se o první multicentrickou studii krevních skupin ABO a Rh (D) v Mexiku, ve které byla analyzována celková distribuce u obou pohlaví, v širokém věkovém rozmezí a v různých státech země. Mezi lety 2014 a 2016 bylo studováno celkem 271 164 jedinců ze 17 států Mexika. Zjistili jsme, že distribuce skupin ABO byla O (61,82%), A (27,44%), B (8,93%) a AB (1,81% ). Naše pozorování byla podobná předchozím zprávám, ve kterých byla nejčastější skupina O, následovaná skupinami A, B a AB [29–35].

Frekvence antigenů ABO v mexické populaci se liší od frekvencí pozorovaných v jiných latinskoamerických zemích, jako je Argentina, Bolívie, Brazílie a Dominikánská republika [36]. Je zajímavé, že Rh (D) antigen byl v Mexiku častější (95,58%) než to, co je pozorováno v jiných zemích Latinské Ameriky [36]. Pozorovaná frekvence byla mírně podobná frekvencím nalezeným u domorodých populací [37–39], což odráží složité procesy příměsi, které vedly k populacím mexických mesticů [9].

Bylo zjištěno, že frekvence krevních skupin jsou podobné věkovým skupinám, avšak u krevních skupin A Rh (D), AB Rh (D) a O Rh (D) byly pozorovány mírné rozdíly mezi pohlavími. Výše uvedené lze vysvětlit použitou metodou odběru vzorků, která by vedla k nadměrnému zastoupení samic ve vzorku.

Předchozí studie byly provedeny v Mexiku za účelem stanovení místní distribuce krevních skupin ABO a Rh (D). Některé z těchto prací byly provedeny u domorodých lidí [37, 40–42] a většina u mesticů [29–35]. Pro tuto studii byly získány vzorky z metropolitních měst, z nichž většina se skládá z městských jedinců. V různých oblastech země byla nalezena variabilita poměrů krevních antigenů. Frekvence pozorované v Coahuila, Nuevo Leon, Jalisco a Ciudad de Mexico byly podobné těm, které byly dříve hlášeny [30–34], avšak u Durango, Puebla a Guanajuato byly podíly krevních antigenů ve srovnání s našimi výsledky odlišné [29, 31 , 34, 35]. Kromě toho alelové frekvence pro oba loci v předchozích dílech se lišily od těch, které jsou zde uvedeny. Navíc populace studované v těchto zprávách nebyly v Hardy-Weinbergově genetické rovnováze (HWE) v obou loci [30–32, 34, 35] kromě Puebly [29] a Coahuila [31].

Vzorky analyzované v této práci byly v HWE pro VPA místo kromě těch pocházejících z Jalisca a Ciudad de Mexico. Výše uvedené může být důsledkem nenáhodného vzorkování nebo vnitřní migrace (k čemuž dochází v těchto státech podle jejich socioekonomického vývoje), protože velikost vzorku je velká a v těchto populacích nebyly hlášeny jiné rušivé události (tj. příbuzenské křížení a mutace). Je zajímavé, že jsme zjistili, že Rh (D) místo byl v HWE, k potvrzení našich pozorování je však zapotřebí více studií.

Výše uvedené je důležité, protože pokud jsou populace v HWE, znamená to, že pozorované frekvence krevních skupin budou v každé generaci podobné. Tato informace umožní zdravotnickým institucím získat dostatek krevních jednotek, protože je známo místo, kde je častější získání konkrétní krevní skupiny s jistotou, že tyto frekvence budou relativně konstantní, a nebude nutné zkoumat distribuci krve skupiny v těchto populacích znovu hned.

Navíc geografický klín ABO a D loci s pozoruhodně vysokými frekvencemi na severu a ve středu a , respektive bylo zjištěno, že je zapotřebí více studií k vysvětlení možných příčin, které jsou základem těchto distribucí klinů v zemi. Různé faktory, jako jsou migrace, nerandomatické páření a infekční choroby, mimo jiné, by způsobily evoluční omezení tohoto genetického znaku [4, 43, 44], bylo by možné, že oba loci mají určitý selekční tlak, který má za následek jejich současnou distribuci v Mexiku, to však zůstává dosud neprozkoumané.

V této zprávě jsme prokázali regionální rozdíly v distribuci krevních skupin, o kterých se domníváme, že tyto rozdíly by mohly být výsledkem diferenciace mezi regiony podle toho, studovali jsme genetickou strukturu populace pomocí ABO a D loci jako genetické markery. Diferenciace v mexických populacích byla nalezena mezi analyzovanými regiony a na severu a západě byla mezitím pozorována vyšší heterozygotnost a genová diverzita, na východě a jihu centra jsme zjistili nízkou heterozygozitu a genovou diverzitu.

Navzdory široké distribuci alel ABO a D/d, odhad srovnání mezipopulace (a

) také dokládá genetickou diferenciaci mezi populacemi. Je zajímavé poznamenat, že na východě nebyla u obou genetická diferenciace loci což bylo patrné z negativní hodnoty odhadu genetické diferenciace [45]. Výše uvedené by bylo možné díky nejnižší heterozygotnosti zjištěné v Puebla, ve které byly pozorovány nejvyšší frekvence alel a .

Bylo by zajímavé prozkoumat důvod snížení heterozygotnosti obou loci v Pueble. Navíc je nutné odebrat vzorky z jiných populací na východě, abychom potvrdili naše pozorování a rozšířit tuto studii do dalších oblastí Mexika, abychom poznali celostátní distribuci krevních skupin ABO a Rh (D).

Existuje několik prací o genové diverzitě v Mexiku, naše výsledky s ABO a D loci jako genetický znak jsou v souladu s nimi, ve kterých byla zkoumána genetická struktura domorodých a mestských populací s SNP jako genetickými markery [19, 20]. Podobně jako u nás tyto práce uvádějí, že populace na severu mají vyšší heterozygosity s ohledem na ty, které se nacházejí ve středu a na jihu země [20]. Navíc zjistili genetickou stratifikaci v domorodých komunitách [19, 20].

Je zajímavé, že tato substruktura indiánské populace je rekapitulována v genomech mexických mesticů [19], což je v souladu s našimi pozorováními genetické diferenciace v mexických populacích v několika oblastech země. Je důležité vzít v úvahu skutečnost, že Mexičané jsou nedávno založenou městskou populací, složenou z příměsí evropských, afrických a převážně amerindiánů [19, 20], kde je alela téměř fixována [37, 39, 46]. Výše uvedené by mohlo vysvětlit vysoké frekvence alely v Mexiku, zejména v Pueble, kde je indiánský původ převládající [29, 47], což podporuje naše pozorování nízké heterozygozity, což naznačuje nízkou příměs v této populaci.

V současné době je v Mexiku 68 domorodých skupin [48], které mají své vlastní kulturní a ekonomické systémy, které se výrazně liší od mestic populace, tito lidé představují asi 6,4 % veškeré populace [49]. Ruben Lisker provedl první práce mexické genetiky u domorodých populací v 60. letech 20. století [9, 22], ve kterých se pokusil poznat stupeň příměsi i hlavní rodové složky přítomné v těchto populacích. Nedávno byly na molekulární úrovni provedeny některé studie s cílem poznat základní vztahy mezi původními a mestskými [19–21], rekonstruovat historii indiánských populací na kontinentu [50] a jejich vývoj v celé zemi. [21]. Tyto práce navíc zkoumaly možné účinky genetického obsahu v kontextu kliniky [19].

V tomto okamžiku naše práce přispívá k poznání genové rozmanitosti v Mexiku tím, že dokazuje regionální a geografickou diferenciaci v zemi. Také jsme studovali některé populace, které nebyly dříve analyzovány, čímž jsme zvýšili informace o populační genetice v Mexiku.

Zde ukazujeme, že lidé ze západní části (včetně severozápadních populací) mají mezi sebou blízký genetický vztah podobně, populace jižního středu jsou zajímavější spíše s východní částí, východní populace si udržovaly vzdálený genetický vztah s těmi západními. Bylo by zajímavé analyzovat, zda existuje nějaký vliv genové diverzity na klinické znaky.

Předchozí práce prokázaly vliv genetické variace na přesnost hodnocení plicních funkcí [19] bylo hlášeno, že zdraví lidé s genetickými variantami běžnými na východě Mexika měli jiné výsledky testu funkce plic než lidé ze západu [19]. . Výše uvedené naznačuje, že stejná kritéria pro diagnostiku plicního onemocnění nelze použít u obou populací, protože by to vedlo k chybné diagnóze [19]. Jiné práce mají navíc v Mexiku příbuzný genetický původ s náchylností k rakovině prsu [51] a cukrovce [52]. Tyto práce společně ukazují účinky genové diverzity na diagnostické nástroje a riziko vzniku některých onemocnění, které bude nutné v budoucnu vzít v úvahu, aby se zlepšila přesnost biomedicíny. Proto je klíčové vyvinout genomickou medicínu, která bude mít pozitivní dopad na veřejné zdraví Mexika.

V transplantační medicíně studovalo několik prací účinky genetických variant celé řady proteinů včetně lidských leukocytárních antigenů (HLA) na riziko odmítnutí při transplantaci aloštěpu [15–17, 53, 54]. Například v Mexiku některé práce našly pozitivní souvislost mezi specifickými HLA haplotypy a akutním odmítnutím ledvin [15, 17]. Je zajímavé, že tyto imunogenní varianty jsou široce distribuovány mezi domorodými a mesticovými lidmi [47, 55].

Z výše uvedeného by bylo možné si myslet, že genová diverzita by mohla hrát důležitou roli v transplantační medicíně, v takovém případě by geneticky příbuzné populace mohly mít nižší míru odmítnutí orgánů než populace s větší genetickou vzdáleností. Znalost genové diverzity by proto mohla pomoci vybrat vhodné dárce a odhadnout úspěch transplantací orgánů a také účinnost imunosupresivních terapií k prevenci akutních rejekcí, nicméně toto zatím není prozkoumáno.

Tato práce má určitá omezení včetně metody odběru vzorků a nepřímého stanovení frekvencí alel ABO a D, avšak velká velikost vzorku a jednotnost v testu krevních skupin zajišťují získané výsledky, což poskytuje jedinečnou příležitost odhadnout distribuci krevních skupin. v Mexiku. Podobně jsme očekávali, že tato studie pomůže při vytváření regionálních a národních programů pro krevní transfuze a transplantace orgánů podle distribuce krevních antigenů. Naše výsledky o genové diverzitě v 17 mexických státech navíc rozšíří znalosti antropologie země, což umožní porozumět vzniku současné mexické populace a jejich vztahu k různým etnickým skupinám v celé zemi.

5. Závěry

Tato práce poskytne zdravotnickým institucím užitečné informace při vytváření regionálních a národních programů, které urychlí transplantace tkání a krevní transfuze potřebné v klinické praxi. Stejně tak přispěje ke studiu mexické genetiky tím, že ukáže její diferenciaci mezi zeměmi, což by mohlo mít důležité důsledky v různých oblastech biomedicíny, jako je transplantační medicína a imunologie, stejně jako v léčbě a diagnostice několika patologií přítomných v zemi. . Kromě toho se očekává, že tato práce vyvolá hluboký zájem o etnology a antropology související se studiem populační genetiky v Mexiku, stejně jako o lékaře, kteří se zajímají o aplikaci molekulární genetiky v diagnostice a klinické praxi.

Střet zájmů

Autoři neprohlašují žádný střet zájmů.

Poděkování

Autoři děkují pracovníkům klinik Salud Digna za podporu při této práci. Tento výzkum byl podpořen interním rozpočtem Salud Digna para Todos.

Reference

  1. R. Owen, „Karl Landsteiner a první lokus lidského markeru“ Genetika, sv. 155, č.p. 3, str. 995–998, 2000. Zobrazit na: Google Scholar
  2. S. K. Vasan, K. Rostgaard, A. Majeed a kol., „Krevní skupina ABO a riziko tromboembolické a arteriální choroby: studie 1,5 milionu dárců krve,“ Oběh, sv. 133, č.p. 15, s. 1449–1457, 2016. Zobrazit na: Web vydavatele | Google Scholar
  3. S. K. Rummel a R. E. Ellsworth, „Role skupiny histoblood ABO při rakovině“ Budoucí věda OA, sv. 2, č. 2, 2016. Zobrazit na: Web vydavatele | Google Scholar
  4. D. J. Anstee, „Vztah mezi krevními skupinami a nemocí“, Krev, sv. 115, č. 23, s. 4635–4643, 2010. Zobrazit na: Web vydavatele | Google Scholar
  5. A. E. Fry, M. J. Griffiths, S. Auburn a kol., „Běžná variace v ABO glykosyltransferáze je spojena s náchylností k Plasmodium falciparum malárie," Molekulární genetika člověka, sv. 17, č. 4, s. 567–576, 2008. Zobrazit na: Stránky vydavatele | Google Scholar
  6. C. Zhang, Y. Li, L. Wang a kol., „Krevní skupina AB je ochranným faktorem pro gestační diabetes mellitus: prospektivní populační studie v čínském Tianjinu,“ Výzkum a recenze diabetu/metabolismu, sv. 31, č. 6, s. 627–637, 2015. Zobrazit na: Web vydavatele | Google Scholar
  7. L. L. Cavalli-Sforza a M. W. Feldman, „Aplikace molekulárně genetických přístupů ke studiu evoluce člověka“ Genetika přírody, sv. 33, příloha 3, s. 266–275, 2003. Zobrazit na: Stránky vydavatele | Google Scholar
  8. J. Bangham, „Krevní skupiny a lidské skupiny: Sběr a kalibrace genetických dat po druhé světové válce“ Studium historie a filozofie věd Část C: Studium historie a filozofie biologických a biomedicínských věd, sv. 47, s. 74–86, 2014. Zobrazit na: Stránky vydavatele | Google Scholar
  9. E. Suárez-Díaz, „Domorodé populace v Mexiku: Lékařská antropologie v díle Rubena Liskera v 60. letech“ Studie z historie a filozofie vědy Část C Studie z historie a filozofie biologických a biomedicínských věd, sv. 47, s. 108–117, 2014. Zobrazit na: Web vydavatele | Google Scholar
  10. D. P. Simmons a W. J. Savage, „Hemolýza z nekompatibility ABO“, Hematologické/onkologické kliniky Severní Ameriky, sv. 29, č. 3, s. 429–443, 2015. Zobrazit na: Stránky vydavatele | Google Scholar
  11. S. J. Urbaniak a M. A. Greiss, „RhD hemolytické onemocnění plodu a novorozence“, Krevní recenze, sv. 14, č.1, ID článku 90123, s. 44–61, 2000. Zobrazit na: Web vydavatele | Google Scholar
  12. J. D. Roback, B. J. Grossman, T. Harris a C. D. Hillyer, Americká asociace krevních bank: Technická příručka, Americká asociace krevních bank, 2011.
  13. M. S. Reddy, J. Varghese, J. Venkataraman a M. Rela, „Přiřazení dárce k příjemci při transplantaci jater: Význam v klinické praxi“ World Journal of Hepatology, sv. 5, č. 11, s. 603–611, 2013. Zobrazit na: Stránky vydavatele | Google Scholar
  14. S. Feng, N. P. Goodrich, J. L. Bragg-Gresham et al., „Charakteristiky spojené se selháním jaterního štěpu: koncept indexu rizika dárce“, American Journal of Transplantation, sv. 6, č. 4, s. 783–790, 2006. Zobrazit na: Stránky vydavatele | Google Scholar
  15. A. Torres-Machorro, N. Camorlinga-Tagle, C. Rodrguez-Ortiz a kol., „Role hlavního komplexu histokompatibility a etnicity při akutním odmítnutí renálního štěpu“ Transplantační sborník, sv. 42, č. 6, s. 2372–2375, 2010. Zobrazit na: Web vydavatele | Google Scholar
  16. M. P. Hernandez-Fuentes, C. Franklin, I. Rebollo-Mesa et al., „Dlouhodobé a krátkodobé výsledky při renálních alograftech se zesnulými dárci: velká asociační studie genomu pro příjemce a dárce“, American Journal of Transplantation, 2018. Zobrazit na: Stránky vydavatele | Google Scholar
  17. M. C. Riquelme-McLoughlin, J. Granados, V. Acuña-Alonzo a kol., „Haplotypy rozšířeného hlavního histokompatibilního komplexu, původ a akutní odmítnutí transplantovaných ledvin u Mexičanů,“ Revista de Investigación Clínica, sv. 63, č. 4, s. 370–375, 2011. Zobrazit na: Google Scholar
  18. B. Almoguera, A. Shaked a B. J. Keating, „Transplantační genetika: současný stav a vyhlídky“ American Journal of Transplantation, sv. 14, č. 4, s. 764–778, 2014. Zobrazit na: Web vydavatele | Google Scholar
  19. A. Moreno-Estrada, C. R. Gignoux, J. C. Fernández-López a kol., „Genetika Mexika rekapituluje indiánskou substrukturu a ovlivňuje biomedicínské rysy,“ Věda, sv. 344, č. 6189, s. 1280–1285, 2014. Zobrazit na: Stránky vydavatele | Google Scholar
  20. I. Silva-Zolezzi, A. Hidalgo-Miranda, J. Estrada-Gil et al., „Analýza genomové diverzity v populacích mexických mesticů za účelem rozvoje genomické medicíny v Mexiku,“ Proceedings of the National Acadamy of Sciences of the United States of America, sv. 106, č.p. 21, s. 8611–8616, 2009. Zobrazit na: Web vydavatele | Google Scholar
  21. S. Romero-Hidalgo, A. Ochoa-Leyva, A. Garcíarrubio a kol., „Demografická historie a biologicky relevantní genetické variace původních Mexičanů odvozené ze sekvenování celého genomu“ Komunikace přírody, sv. 8, č. 1, 2017. Zobrazit na: Web vydavatele | Google Scholar
  22. A. Barahona, "Lékařská genetika a první studie genetiky populací v Mexiku," Genetika, sv. 204, č. 1, s. 11–19, 2016. Zobrazit na: Web vydavatele | Google Scholar
  23. J. M. Nam a J. J. Gart, „Bernsteinovy ​​metody a metody počítání genů v zobecněných systémech podobných ABO“, Annals of Human Genetics, sv. 39, č. 3, s. 361–373, 1976. Zobrazit na: Stránky vydavatele | Google Scholar | MathSciNet
  24. A. P. Dempster, N. M. Laird a D. B. Rubin, „Maximální pravděpodobnost z neúplných dat prostřednictvím EM algoritmu“, Journal of the Royal Statistical Society: Series B (Statistická metodologie), sv. 39, č. 1, s. 1–38, 1977. Zobrazit na: Google Scholar | MathSciNet
  25. M. Nei, „Analýza genové diverzity v rozdělených populacích“ Proceedings of the National Acadamy of Sciences of the United States of America, sv. 70, č.p. 12, s. 3321–3323, 1973. Zobrazit na: Web vydavatele | Google Scholar
  26. M. Nei, „Odhad průměrné heterozygotnosti a genetické vzdálenosti od malého počtu jedinců“ Genetika, sv. 89, č. 3, s. 583–590, 1978. Zobrazit na: Google Scholar
  27. N. Takezaki, M. Nei a K. Tamura, „POPTREEW: Webová verze POPTREE pro konstrukci populačních stromů z frekvenčních dat alel a výpočet některých dalších veličin“ Molekulární biologie a evoluce, sv. 31, č. 6, s. 1622–1624, 2014. Zobrazit na: Stránky vydavatele | Google Scholar
  28. PAHO, Dodávky krve pro transfuzi v zemích Latinské Ameriky a Karibiku 2014 a 2015, Pan American Health Organization, Washington, DC, USA, 2017.
  29. R. Lisker, R. Pérez‐Briceño, J. Granados a V. Babinsky, „Genové frekvence a odhady příměsí ve státě Puebla, Mexiko“, American Journal of Physical Anthropology, sv. 76, č. 3, s. 331–335, 1988. Zobrazit na: Web vydavatele | Google Scholar
  30. C. Zavala, MA Velazquez-Ferrari, C. Navarrete, J. Rosales-Corona a R. Lisker, „Odhad počtu žen s rizikem izoimunizace na antigen Rho (D) ve vzorku populace, který se zúčastnil Instituto Mexicano del Seguro Social, “ Archivos de Investigacion Medica, sv. 14, č. 2, s. 199–206, 1983. Zobrazit na: Google Scholar
  31. V. B. Rubén Lisker, E. Ramírez, R. Pérez-Briceño a J. Granados, „Genové frekvence a odhady příměsí ve čtyřech mexických městských centrech“ Biologie člověka, sv. 62, č. 6, s. 791–801, 1990. Zobrazit na: Google Scholar
  32. R. Lisker, R. Perez‐Briceño, J. Granados a kol., „Odhady genových frekvencí a příměsí v populaci Mexico City“, American Journal of Physical Anthropology, sv. 71, č. 2, s. 203–207, 1986. Zobrazit na: Web vydavatele | Google Scholar
  33. R. Garza‐Chapa, „Genetická vzdálenost pro krevní skupiny ABO a Rh(D) ve státě Nuevo Leon, Mexiko“, Sociální biologie, sv. 30, č. 1, s. 37–41, 1983. Zobrazit na: Google Scholar
  34. G. C. Raúl, T. C. Rebeca, M. C. F. Ricardo a H. L. G. Carlos, „Los grupos sanguíneos ABO y Rh (D) en poblaciones de la Región Lagunera México (Cálculo de la frecuencia de nekompatibilidad simple y doble en matrimonios y maternofetal),“ Salud Pública de México, sv. 26, č. 2, s. 130–137, 1984. Zobrazit na: Google Scholar
  35. C. Zavala a F. Salamanca, „Matky ohrožené aloimunizací na Rh (D) antigen a dostupnost gama-globulinu v Mexickém institutu sociálního zabezpečení,“ Archivy lékařského výzkumu, sv. 27, č. 3, s. 373–376, 1996. Zobrazit na: Google Scholar
  36. Frekvence krevních skupin podle zemí včetně Rh faktoru, http://www.rhesusnegative.net/themission/bloodtypefrequencies/.
  37. A. S. Wiener, J. P. Zepeda, E. B. Sonn a H. R. Polivka, „Individuální krevní rozdíly u mexických indiánů, se zvláštním zřetelem na krevní skupiny Rh a faktor Hr“, Journal of Experimental Medicine, sv. 81, č.p. 6, s. 559–571, ​​1945. Zobrazit na: Google Scholar
  38. K. Landsteiner, A. S. Wiener a M. G. Albin, „Distribuce Rh faktoru u amerických Indiánů“, Journal of Experimental Medicine, Ne. 1, s. 73–78, 1942. Zobrazit na: Google Scholar
  39. S. Sandoval, C. Henckel a L. Givovich, „Krevní skupiny, podskupiny a Rh faktor indiánů Mapuche z provincie Cautin, Chile“, Krev, sv. 1, č. 6, s. 555–559, 1946. Zobrazit na: Google Scholar
  40. R. Lisker a V. Babinsky, „Admixture odhaduje v devíti mexických indických skupinách a pěti lokalitách východního pobřeží“ Revista de Investigación Clínica, sv. 38, č. 2, s. 145–149, 1986. Zobrazit na: Google Scholar
  41. P. Iturbe-Chiñas, J. Jimenez-Hernandez, D. Peralta-Ortega a J. Toribio-Jiménez, „Frecuencias de grupos sanguíneos ABO, Rh y grado de mestizaje en la Región Montaña, Guerrero, Mexiko,“ Revista Médica del Hospital General de México, sv. 76, č. 4, s. 217–233, 2013. Zobrazit na: Google Scholar
  42. A. Sánchez-Boiso, R.I. Revista de Investigación Clínica, sv. 63, č. 6, s. 614–620, 2011. Zobrazit na: Google Scholar
  43. J. Flegr, "Heterozygotní výhoda pravděpodobně udržuje polymorfismus krevních skupin faktoru rhesus: ekologická regresní studie," PLOS ONE, sv. 11, č. 1, ID článku e0147955, s. 1–12, 2016. Zobrazit na: Web vydavatele | Google Scholar
  44. C. M. Cserti a W. H. Dzik, „Systém krevních skupin ABO a Plasmodium falciparum malárie," Krev, sv. 110, č. 7, s. 2250–2258, 2007. Zobrazit na: Web vydavatele | Google Scholar
  45. B. S. Weir a C. C. Cockerham, „Odhad F-statistiky pro analýzu struktury populace“ Vývoj, sv. 38, č. 6, s. 1358–1370, 1984. Zobrazit na: Web vydavatele | Google Scholar
  46. E. Llop, H. Henríquez, M. Moraga, M. Castro a F. Rothhammer, „Stručná komunikace: Molekulární charakterizace alel O na lokusu ABO u chilských indiánů Aymara a Huilliche,“ American Journal of Physical Anthropology, sv. 131, č.p. 4, s. 535–538, 2006. Zobrazit na: Stránky vydavatele | Google Scholar
  47. R. Barquera, J. Zúñiga, R. Hernández-Díaz a kol., „HLA třídy I a třídy II haplotypů ve smíšených rodinách z několika oblastí Mexika,“ Molekulární imunologie, sv. 45, č. 4, s. 1171–1178, 2008. Zobrazit na: Stránky vydavatele | Google Scholar
  48. Systém kulturních informací, „Pueblos indígenas“, http://sic.gob.mx/datos.php?table=grupo_etnico. Zobrazit na: Google Scholar
  49. CONAPO, „Población indígena“, https://www.gob.mx/cms/uploads/attachment/file/121653/Infografia_INDI_FINAL_08082016.pdf. Zobrazit na: Google Scholar
  50. K. Adhikari, J. C. Chacón-Duque, J. Mendoza-Revilla, M. Fuentes-Guajardo a A. Ruiz-Linares, „Genetická rozmanitost Ameriky“ Výroční přehled genomiky a lidské genetiky, sv. 18, č. 1, s. 277–296, 2017. Zobrazit na: Web vydavatele | Google Scholar
  51. L. Fejerman, E. M. John, S. Huntsman a kol., „Genetický původ a riziko rakoviny prsu v USA Latinas“ Výzkum rakoviny, sv. 68, č. 23, s. 9723–9728, 2008. Zobrazit na: Web vydavatele | Google Scholar
  52. J. C. Lara-Riegos, M. G. Ortiz-López, B. I. Peña-Espinoza et al., „Citlivost diabetu na Mayas: Důkaz pro zapojení polymorfismů do HHEX, HNF4α, KCNJ11, PPARγ, CDKN2A/2B, SLC30A8, CDC123/CAMK1D, TCF7L2, ABCA1 a SLC16A11 geny,“ Gen, sv. 565, č. 1, s. 68–75, 2015. Zobrazit na: Web vydavatele | Google Scholar
  53. M. C. Dessing, J. Kers, J. Damman, G. J. Navis, S. Florquin a J. C. Leemans, „Getetické varianty dárce a příjemce v NLRP3 jsou spojeny s časnou akutní rejekcí po transplantaci ledviny,“ Vědecké zprávy, sv. 6, ID článku 36315, 2016. Zobrazit na: Web vydavatele | Google Scholar
  54. Y.-Z. Ge, R. Wu, T.-Z. Lu et al., „Kombinované účinky polymorfismů TGFB1 +869 T/C a +915 G/C na riziko akutního odmítnutí u příjemců transplantací pevných orgánů: Systematický přehled a metaanalýza,“ PLOS ONE, sv. 9, č. 4, ID článku e93938, 2014. Zobrazit na: Web vydavatele | Google Scholar
  55. A. Arnaiz-Villena, J. Moscoso, J. Granados a kol., „HLA geny v populaci Mayos ze severovýchodního Mexika,“ Současná genomika, sv. 8, č. 7, s. 466–475, 2007. Zobrazit na: Web vydavatele | Google Scholar

Autorská práva

Copyright © 2018 Adri án Canizalez-Rom án et al. Toto je článek s otevřeným přístupem distribuovaný pod licencí Creative Commons Attribution License, která umožňuje neomezené použití, distribuci a reprodukci na jakémkoli médiu za předpokladu, že je původní dílo řádně citováno.


3 VÝSLEDKY

3.1 Chování estimátorů založených na markerech v simulovaných rodokmenech

Obrázek 2 ilustruje vztah mezi odhady na základě markerů a předpovědí příbuzenství na základě rodokmenu pro simulovaná data. Horní řádek ukazuje výsledky pro jeden z 10 rodokmenů vytvořených s 20 zakladateli a monogamním pářením. Spodní řádek zobrazuje výsledky pro jeden z 10 rodokmenů generovaných 750 zakladateli a náhodným párováním. Hustota bodů je znázorněna jako šestiúhelníky různé temnoty: čím tmavší, tím početnější.

Zběžná kontrola obrázku 2 ukazuje, že všechny odhady založené na značkách mají tendenci podceňovat příbuzenství původu, když je počet zakladatelů malý (horní řada obrázku 2), a tři odhady založené na značkách mají různé vlastnosti.

r β (levý sloupec obrázku 2) je odhadem β a těsně sleduje hodnoty rodokmenu r p = θ, s neustálou nesrovnalostí směrem dolů u rodokmenu s 20 zakladateli (panel vlevo nahoře) a téměř dokonale u rodokmenu se 750 zakladateli (vlevo dole). Nesoulad směrem dolů pro r β je kvůli omezení, že průměr všech r β je 0, to lze snadno opravit (uložením stejného omezení na rp a nahradit ho , kde je střední příbuznost všech jedinců v rodokmenu, jak ukazuje Weir a Goudet (2017). Kolem nejběžnějších hodnot rodokmenu příbuzenství (levý sloupec) je určitý rozptyl, který odpovídá nepříbuzným, polovičním a úplným sourozencům, a to je výraznější ve větším rodokmenu (levý dolní panel).

r u odhaduje γ a podceňuje rodokmenovou příbuznost θ (střední sloupec obrázku 2), a to je výraznější u velkých hodnot rodokmenového příbuzenství a u rodokmenů s malým počtem zakladatelů (nahoře) než u rodokmenů s mnoha (dole). Pro kategorii full-sib (r p = 0,25), r u ukazuje extrémní rozptyl a podobný efekt, i když méně výrazný, je pozorován u nevlastních sourozenců (r p = 0,125). U velkého rodokmenu vztah mezi r u a r p pro nízké hodnoty příbuzenství je velmi těsné (spodní střední panel), více než pro r β.

Vztah mezi r w , další odhad γ a r p (pravý sloupec obrázku 2) je hlučný pro malý rodokmen (vpravo nahoře), přičemž běžné třídy příbuznosti rodokmenu jsou velmi rozšířené. r w má také tendenci podceňovat r p, čím více, tím větší je rodokmenská příbuznost. Pro velký rodokmen (vpravo dole) je vztah mnohem těsnější, regresní sklon se blíží 1 a rozptyl je menší než u r β. Extrémní rozptyl pro r p = 0,25 viděno v r u pro malý i velký rodokmen (střední sloupec) je také vidět v r w pro malé rodokmeny (vpravo nahoře), ale zmizí, když je rodokmen velký (vpravo dole).

Obrázek 3 ukazuje korelace r β, r w a r ty s r p (v modré, červené a černé, v tomto pořadí) jako funkce variace v příbuzenství. Páry jedinců z rodokmenů s několika málo zakladateli budou mít větší šanci být příbuzní než páry z větších rodokmenů. Rodokmeny s několika zakladateli tak budou mít větší variabilitu v příbuznosti a budou umístěny na pravé straně grafu, zatímco rodokmeny s mnoha zakladateli budou vlevo. U daného počtu zakladatelů budou monogamní rodokmeny (plné kruhy) vykazovat větší variabilitu příbuznosti než rodokmeny náhodných párů (+ symboly), a budou tedy umístěny napravo.

Korelace mezi r β a r p ukazuje velmi odlišný vzorec od ostatních dvou odhadů založených na markerech: Zvyšuje se s rozptylem v r p se zvyšuje, zatímco korelace r w a r u klesá jako standardní odchylka v r p se zvýší nad ≈ 0,02. Vztah pro korelaci mezi příbuzenstvím založeným na značkách a rodokmenu je velmi těsný r β , přičemž všechny body spadají na stejnou trajektorii. Tato korelace se pohybuje kolem 0,6, když je standardní odchylka v rodokmenové příbuznosti ≈ 0,009, a asymptoty na jedné, protože se zvyšuje standardní odchylka příbuzenského původu.

Vzor pro r w a r u je to téměř naopak. Korelace se nejprve zvyšuje, když je velmi malý rozptyl v rodokmenovém příbuzenství, dosahuje maxima kolem 0,93 pro r w a 0,96 pro r u, když je standardní odchylka v příbuzenském původu mezi 0,02 a 0,03 a poté lineárně klesá, i když s větším rozptylem, jako standardní odchylka v r p se zvýší nad 0,03.

Z toho by se mohlo zdát, že když je standardní odchylka v příbuzenském původu větší než ≈ 0,02 - 0,04, r β je lepším odhadem příbuzenského původu, zatímco když je standardní odchylka v příbuzenském původu menší než 0,03, r máš přednost (r u překonáte r w v celém rozsahu). To je však částečně zavádějící, jak jsme viděli na obrázku 2 r β je ve skutečnosti velmi blízko r p v celém jeho rozsahu r u, přičemž poskytuje přesný odhad pro nízké hodnoty r p, není příliš dobrý v odhadu příbuzenství plných a polovičních sourozenců.

Vzor pozorovaný pro korelaci mezi markerem a rodokmenovou příbuzností pro r w a r jsi záhadný. Vzor pozorovaný pomocí r β dává intuitivní smysl: Pokud neexistuje žádná odchylka v rodokmenovém příbuzenství, pak to nemůže být s ničím korelováno (korelace s konstantou je podle definice 0). Čím větší je variace v rodokmenovém příbuzenství, tím více je třeba vysvětlit, takže odhady příbuzenství založené na markerech by měly více korelovat s hodnotami rodokmenu. K tomuto bodu se vrátíme později.

3.2 Počet lokusů

Na obrázku 3 jsme stanovili počet (proměnných) SNP na 42k. To je poměrně velké číslo, i když v dnešní době nijak výjimečné. Na obrázku 4 se podíváme na vliv počtu markerů a snížíme jej na 20k, 10k, 5k, 1k500 a nakonec 100.

Jak počet markerů klesá, vidíme jak kvantitativní, tak kvalitativní změny. Horní řada na obrázku 4 (20k, 10k a 5k SNP) ukazuje mírně hlučnější verze obrázku 3, ale jinak žádné kvalitativní rozdíly: Pro velké rozdíly v rodokmenovém příbuzenství, r β má vyšší korelaci s r p než r w nebo r u, zatímco pro malé variace, r w a r u více koreluje s r p . Všimněte si, že r w zejména dosahuje plató a začíná klesat, když se variace v r p je velmi nízké (pro 10k a 5k SNP).

Spodní řada na obrázku 4 (1k, 500 a 100 SNP) vypadá jinak. Za prvé, korelace mezi odhady založenými na značkách a predikcemi založenými na rodokmenu jsou mnohem nižší, pod 0,8 pro 1k, 0,6 pro 500 a 0,4 pro 100 SNP. Zadruhé, pro tři odhady příbuzenství založené na markerech se korelace s příbuzenstvím založeným na rodokmenu zvyšuje s tím, jak se zvyšují rozdíly v příbuzenství. Ve všech třech panelech spodní řady je korelace mezi r β a r p je menší než pro r w , což samo o sobě je menší než pro r u.

3.3 Zakladatelé ze dvou populací

V následujícím se zaměříme na r β. Na obrázku 5 (levý panel) vidíme, že když se zakladatelé skládají z jedinců ze dvou diferencovaných populací, vztah mezi odhady příbuzenství z markerů a předpokládanými hodnotami z rodokmenů je hlučný (r w a r u ukažte podobný vzorový údaj, který není zobrazen). Zejména pro rodokmenové příbuzenství 0, 0,125 a 0,25 vidíme velký rozsah odhadů založených na markerech, větší, než když zakladatelé pocházejí z jedné populace (obrázek 2). Důvodem jsou předpovědi původu r p předpokládat, že všichni zakladatelé jsou stejně nesouvisející, zatímco ve skutečnosti nejsou: Páry zakladatelů pocházejících ze stejné populace jsou příbuznější než páry zakladatelů pocházejících z různých populací.

Marker příbuzenství jako funkce rodokmenového příbuzenství, když zakladatelé pocházejí ze dvou populací. Levý panel: Zakladatelé jsou považováni za nesouvisející (r p). Pravý panel: Příbuzenství zakladatelů bylo odhadnuto ze značek ( )

Pokud jsou pro zakladatele k dispozici genetické informace, můžeme vysvětlit heterogenitu příbuzenství mezi nimi pomocí jejich odhadů příbuznosti založených na markerech jako zárodku algoritmu vypočítávajícího příbuznost rodokmenu. To je znázorněno na obrázku 5 (pravý panel). Očkováním matice příbuznosti rodokmenu pomocí odhadů příbuznosti založených na značkách r β pro zakladatele je rozptyl kolem hodnoty rodokmenu mnohem menší.

Stejný princip můžeme použít, když všichni zakladatelé pocházejí z jedné populace. Rozptyl na obrázku 2 je způsoben tím, že zakladatelé jsou považováni za identicky nesouvisející. Pokud použijeme genotypy zakladatelů k odhadu jejich příbuznosti, místo abychom předpokládali, že je 0, získali jsme obrázek 6. Korelace mezi r β a r p je mnohem vyšší ve všech situacích a pro menší počet zadaných SNP (spodní řádek), r β je nejvíce korelován s r p.

3.4 Reálné datové aplikace

3.4.1 Soubor dat sýkor koňadry

Rodokmen sýkory koňadry je mělký, pokrývá nanejvýš tři generace, předpovědi příbuzenství založené na rodokmenu mají málo kategorií a některé z nich mají velmi málo pozorování:

Obrázek 7 zobrazuje houslové grafy odhadů příbuznosti na základě markerů jako funkce predikcí založených na rodokmenu. Tři odhady příbuzenství založené na markerech vykazují v tomto mělkém rodokmenu velmi podobné chování. Režimy jejich rozdělení jsou zarovnány s odpovídajícími hodnotami rodokmenu (vodorovné plné čáry). Pozoruhodný je poměrně vysoký podíl předpokládaných polosibů z rodokmenu (r p = 0,125), kteří jsou identifikováni jako úplní sourozenci s odhady příbuznosti založenými na značkách (r m = 0,25, střední panel ve spodní řadě). Podobný vzorec je patrný u bratranců a nevlastních sourozenců. Tři odhady příbuzenství založené na markerech pro nepříbuzné jedince ukazují unimodální rozdělení se všemi mody na r = 0, ale dlouhé ocasy sahající až 0,4. Je to pravděpodobně způsobeno příbuznými zakladatelů. Například jednotlivci 17 a 557, muži i zakladatelé, mají příbuznost založenou na rodokmenu považovanou za 0, ale jejich odhadovaná . Potomci těchto jedinců budou jejich příbuzenství založená na rodokmenu podceňovat.

3.4.2 Soubor dat ovcí ovcí

Dále se podíváme na soubor dat o ovcích. Výsledky ukazuje obrázek 8. Horní řádek ukazuje vztah mezi předpovědí příbuzenství na základě rodokmenu a odhady na základě markerů, r β, r u a r w zleva doprava. Korelace jsou 0,65, 0,73 a 0,71. Zatímco ve všech třech panelech vidíme tendenci k nárůstu odhadů založených na markerech s predikcemi založenými na rodokmenu, je zde velký rozptyl. Zejména u všech tří odhadů založených na značkách mají některé páry jedinců, u nichž se předpokládá, že nesouvisejí s předpověďmi založenými na původu, poměrně vysoké odhady založené na značkách, a někteří jedinci s předpověďmi založenými na rodokmenu 0,25 (úplní sourozenci nebo rodiče-potomci) ) mají odhady založené na značkách kolem 0.

Druhý řádek obrázku 8 ukazuje vztah mezi předpověďmi založenými na rodokmenu a odhady na základě markerů z genotypů simulovaných podél rodokmenu. Vztah je mnohem těsnější, zejména pro r β a r w , zatímco r u vykazuje podobný rozptyl jako dříve, zejména pro třídu příbuznosti rodokmenu 0,25.

Poslední řádek obrázku 8 porovnává odhady příbuzenství založené na markerech na základě simulací a pozorovaných dat. Pro r β a r w , většina bodů spadá do blízkosti čáry jedna ku jedné a body mimo tuto obálku lze snadno identifikovat (například body, pro které a , nebo ty, pro které zatímco , vlevo dole), poskytující možnost opravit rodokmen. Použití by bylo mnohem obtížnější r u za takovou opravu.

3.4.3 Soubor dat o prasatech

Tento soubor dat je nejúplnější: Všichni jednotlivci (zakladatelé barů) identifikovali oba rodiče. Genotypizováno je téměř 55% z 6 473 jedinců v rodokmenu. První řádek na obrázku 9 ukazuje vztah mezi příbuzností na základě rodokmenu a markerů pro tři odhady založené na markerech. Vztah není tak těsný jako na obrázku 2 a korelace mezi příbuzenstvím založeným na markerech a rodokmenu je 0,55, 0,55 a 0,56 pro r β, r u a r w, respektive pro směrodatnou odchylku odhadů příbuzenství na základě rodokmenu 0,02. Existuje tedy jen málo oddělování tří odhadů příbuznosti na základě markerů z hlediska korelace a r P ukazuje nejmenší rozptyl a vychýlení ze tří odhadů (srovnejte horní levý panel (b) na obrázku 9 s horním středním (u) a pravým (w) panelem).

Odhady příbuzenství založené na markerech (zejména r β) ze simulovaných genetických dat (střední řada na obrázku 9) velmi dobře odpovídá příbuzenským vztahům založeným na rodokmenu. Korelace mezi predikcemi na základě markerů a předpovědí na základě rodokmenu je 0,96, 0,85 a 0,87 pro r β, r u a r w (výsledky jsou téměř identické, pokud použijete pouze 42k Filtrování SNP na frekvenci vedlejších alel (MAF) větší než 0,01 snižuje korelaci pro r β a r w a okrajově ji zvyšuje (0,85 až 0,87) pro r u). Poslední řádek na obrázku 9 ukazuje vztah mezi simulovanými markerovými odhady příbuzenství a pozorovanými markerovými odhady příbuzenství. Klíčový bod, který je třeba vzít z tohoto spodního řádku, je nejlépe vidět z panelu zcela vlevo, kde se oba porovnávají r β : Mezi odhady příbuzenství na základě simulovaných markerů blízko 0 jsme pozorovali dvě skvrny s vysokou hustotou odhadů ze skutečných dat (dvě tmavé skvrny), což naznačuje, že zakladatelé nemusí pocházet z homogenního kmene.

Naočkování odhadů příbuznosti na základě rodokmenu pomocí odhadu příbuznosti na základě markerů pro 81 zakladatelů genotypů významně nezlepší vztah mezi hodnotami založenými na značkách a rodokmenu (data nejsou uvedena).


Variace na společnou STRUKTURU: Nové algoritmy pro cenný model

V tomto komentáři John Novembre diskutuje o nástrojích pro studium struktury populace, včetně nového, rychlého algoritmu fastSTRUCTURE představeného Rajem a kol. v červnovém čísle GENETICS.

Během posledních 14 let se velmi vlivným nástrojem pro studium struktury populace stal model příměsí Pritcharda, Stephense a Donnellyho (model “PSD”, Pritchard a kol. 2000) a jemu přidružený odvozovací software STRUKTURA. Ve své základní podobě tento model výslovně nezohledňuje účinky mutace, driftu, selekce nebo vazby. Nejedná se ani o dynamický model, protože nemá explicitně žádnou časovou složku. Zjednodušeně je to jen Hardy–Weinbergův model se dvěma vráskami: (1) subpopulace, které se liší frekvencí alel, a (2) jedinci, jejichž genetický původ lze smísit, tj.jednotlivec může zdědit alely z více než jedné z více subpopulací podle vektoru pravděpodobnosti ȁkadmetických poměrů. ”

Tento jednoduchý model struktury populace se ukázal jako neuvěřitelně užitečný. Původní papír (také publikovaný v GENETIKA) získal přes 10 000 citací, a pokud vezmeme v úvahu dopad následujících prací, které tento přístup přímo rozpracovávají (Falush a kol. 2003, 2007 Hubisz a kol. 2009) nebo použít související přístupy (např., Dawson a Belkhir 2001 Anderson a Thompson 2002 Corander a kol. 2003 Wilson a Rannala 2003 Huelsenbeck a Andolfatto 2007), souhrnný dopad je skutečně pozoruhodný. Je zajímavé, že stejný základní model hrál nezávislou a důležitou roli pro klasifikaci textu a těžbu, kde je znám jako model latentní Dirichletovy alokace (LDA) (viz Blei a kol. 2003, který sám má více než 8 000 citací). Pro biology široký dopad modelu PSD vyplývá z překvapivě velkého počtu otázek v evoluční biologii a ekologii, ve kterých se jednoduché hodnocení struktury populace ukazuje jako bystrý úkol. Jako příklad zvažte, jak užitečné je identifikovat genetické subpopulace při správě druhu nebo při studiu jeho historické biogeografie. Zvažte také, jak užitečné je ve studii mapování onemocnění umět identifikovat hybridní jedince, odvodit zdroj tkání nejistého původu nebo posoudit stratifikaci populace případ/kontrola. Ve všech těchto aplikacích byl důležitý model PSD a jeho blízcí příbuzní.

I když je model PSD relativně jednoduchý, provedení inference s ním představuje značné výpočetní problémy. Abyste pochopili jádro problému, pamatujte na původní papír PSD, který se snažil odvodit vektor proporcí předků pro každého jednotlivce (vektor qi pro jednotlivce i) za předpokladu, že jednotlivci jsou zcela bez označení s ohledem na původ. To znamená, že jakékoli porozumění frekvencím alel subpopulace a proporcím směsi bude muset být rozlišeno pouze z údajů o genotypu. Pokud by někdo věděl o populačním zdroji každé alely u každého jednotlivce, pak by byl problém přímočarý, ale toto jsou “missing data ” popř. latentní proměnné. Papír PSD přistoupil k problému z Bayesovské perspektivy — jeho cílem bylo odebrat vzorek ze zadní části qi's integrací nejistoty v nepozorovaných frekvencích alel subpopulace a alelických zdrojových proměnných. Tato integrace probíhá ve vysoce dimenzionálním prostoru (s rozměry úměrnými součinu velikosti vzorku, počtu lokusů a počtu alel na lokus), a proto je výpočetně nepraktické provést integraci přesně. Naštěstí Gibbsův vzorkovací přístup umožňuje aproximaci integrálu, a to se používá v algoritmu, který je základem výsledného softwaru STRUCTURE.

Za posledních 10 let došlo k velkému pokroku v rozsahu našich pozorování genetických variací, což bylo pro naše učení požehnáním, ale prokletím pro výpočet. STRUKTURA fungovala dobře pro analýzu kompletních datových souborů až do příchodu velkých polí genotypování SNP se stovkami tisíc SNP v polovině 2000 (přezkoumáno v Novembre a Ramachandran 2011). V takovém měřítku dat je Gibbsův vzorkovač jednoduše příliš pomalý na to, aby jej bylo možné prakticky použít, a mnoho výzkumníků se obrátilo k použití alternativních přístupů, jako je aplikace analýzy hlavních komponent (PCA) na genotypová data (Price a kol. 2006). Existují teoretické důvody, proč použití PCA (a dalších forem faktorové analýzy) může poskytnout pohled na proporce příměsí (Patterson a kol. 2006 McVean 2009 Engelhardt a Stephens 2010), ale model PSD je stále atraktivní jako přístup založený na pravděpodobnostním modelu pro odvozování smíchaných vzorků. Například explicitně zvažuje, jak jsou alely v genotypu binomickým vzorkem ze základních frekvencí alel subpopulace, spíše než s nimi implicitně zacházet jako s kontinuálními proměnnými (jak to dělá PCA), a tak může vhodným způsobem vypočítat míru nejistoty.

Aby se vyřešily problémy s výpočty, které vyvstávají při aplikaci modelu PSD na data SNP, dvě skupiny uznaly, že funkce pravděpodobnosti, která je základem modelu, je přístupná účinným optimalizačním technikám, takže je možné získat maximální pravděpodobnost odhady proporcí předků a frekvence alel. Tang a kol. (2005) vyvinuli EM algoritmus distribuovaný v jejich softwaru FRAPPE a další tým (se kterým jsem pracoval) využil nástroje z teorie konvexní optimalizace k vývoji softwaru ADMIXTURE (Alexander a kol. 2009).

Jednou částečnou nevýhodou přístupů pravděpodobnosti je neschopnost používat Bayesovské priority, které upřednostňují nejvíce “sensible ” odhady parametrů. Biologická intuice například naznačuje, že bychom měli upřednostňovat řešení, ve kterých původ každého jednotlivce pochází spíše z jedné nebo nanejvýš několika populací než z mnoha. Podobně by se dalo upřednostňovat řešení, kde jsou alelové frekvence ve všech subpopulacích navzájem podobné (např.u populací, které jsou slabě diferencované, jako např FSVATÝ < 0,1). Přísná optimalizace pravděpodobnosti v modelu PSD nevytváří taková řešení, pokud není datová sada velká, maximální pravděpodobnost, že bude trpět příznaky nadměrného vybavení (např., chybně odvozující malé podíly původu z mnoha populací za účelem zlepšení přizpůsobení modelu) nebo ze špatně odhadovaných frekvencí alel. Obecně řečeno, v mnoha problémech s vysokodimenzionálními závěry může řešení maximální pravděpodobnosti těžit z kroků regularizace/penalizace, které jsou podobné uložení priorit. Například jako vylepšení ADMIXTURE zavedli Alexander a Lange (2011) funkci penalizované pravděpodobnosti, která napodobuje způsob, jakým může Dirichletův prior vytvářet řídkost v koeficientech příměsí, a zjistili, že podstatně snižuje vychýlení.

V červnovém čísle Genetika, Raj a kol. (2014) představují nové, rychlé algoritmy, které umožňují propracovanou bayesovskou inferenci s modelem PSD. Klíčovou inovací je, že útočí na problém ve variačním Bayesově rámci (pro úvod viz Jordan a kol. 1999). Variační Bayes se vyhýbá obtížným integračním krokům, které jsou obvykle počítány pomocí časově nákladných Gibbsových vzorkovačů nebo technik Markovského řetězce Monte Carlo, strategickým přiblížením k zadnímu. Důležité je, že je zkonstruováno přibližné zadní rozdělení (“variační rozdělení”), se kterým je matematicky jednoduché pracovat (např., navržený tak, že faktorizuje mnoho pojmů). Může být ukázáno, že maximalizací variační distribuční funkce vzhledem k parametrům modelu je maximalizace maximálního limitu mezní pravděpodobnosti, a tedy nalezení parametrů, které dobře odpovídají datům. Konečným výsledkem je, že náročné integrály standardního bayesovského přístupu jsou nahrazeny funkcemi, které jsou snadno vypočítatelné a je třeba je pouze optimalizovat. Na druhé straně lze použít obrovské množství triků z numerické optimalizace (Nocedal a Wright 2006) a odhad parametrů může rychle pokračovat. V literatuře pro těžbu textu byly s úspěchem použity variační metody na modelu LDA (Blei a kol. 2003). Raj a kol. (2014) uvádějí doby běhu pro svůj nový variační algoritmus, fastSTRUCTURE, který konkuruje ADMIXTURE (malé problémy jsou řešeny zhruba 10krát rychleji než STRUCTURE). Kromě toho jsou doby běhu lineární v počtu jednotlivců, markerů a populací, takže se tento přístup dobře rozšíří na větší datové sady. Tato rychlost je na úkor práce s aproximací k pozdějšímu, ale v praxi jsou výsledné parametry podobné těm, které jsou získány při plném Bayesově vyvození.

Dobře známým nepříjemným problémem pro ty, kdo používají PSD model, bylo, jak vhodně zvolit počet subpopulací (K) pro analýzu a/nebo jak jej odvodit přímo z dat. Jak se mění počet parametrů s K„Toto je typ problému s výběrem modelu a k jeho útoku bylo použito několik různých přístupů (např."Pritcharde." a kol. 2000 Evanno a kol. 2005 Alexander a Lange 2011). Raj a kol. (2014) zjistili, že přístup křížové validace, který je nasazen v softwaru ADMIXTURE, nefunguje tak dobře pro výběr K s fastSTRUCTURE, a tak vyvinou dvě metriky ( K ξ ∗ , K ∅ C ∗ ), které mohou pomoci stanovit pravděpodobné rozmezí pro K při použití variačního přístupu. I když tyto metriky nejsou dokonalé, umožňují rozumný závěr K když je soubor dat velký a struktura je silná, ale ve slaběji strukturovaných populacích, závěr K bude i nadále problematické.

Raj a kol. (2014) také zjistili, že nový logistický prior pro alelové frekvence (který nahrazuje standardní model F používaný v dřívějších verzích STRUCTURE) je výhodný při oddělování jemné struktury v datech. Vypracování takových priorit by mohlo umožnit, aby detailnější modelování populační historie bylo vrstveno do modelu PSD. Jednou z možností by bylo zvážit propracované hierarchické priority, jako je stromový prior na populačních frekvencích vyvinutých Pickrellem a Pritchardem (2012). Raj a kol. (2014) ve svých předběžných analýzách zjistili, že tito předchůdci nezlepšili přizpůsobení modelu jejich aplikacím, ale další průzkum v této oblasti by mohl být plodný.

Jako Raj a kol. (2014), model PSD je hrubým modelem složitějších populací. Z tohoto důvodu interpretace výsledků odvozování v rámci tohoto modelu vyžaduje značnou péči a kritické myšlení, abychom se vyhnuli nástrahám (např., Anderson a Dunham 2008). Na výsledky z těchto jednoduchých modelů je třeba pohlížet s vědomím složitých evolučních procesů potenciálně formujících genetické variace v jakékoli datové sadě. V ideálním případě, jak naše pole dozrává, budou stále explicitnější a robustnější modely komplexní populační historie realizovány na základě údajů z genomického měřítka. Je ponižující, že i relativně jednoduché modely vyžadují hodně pečlivé práce a pozornosti k výpočetním detailům, ale nové rámce pro vyvozování, jako je zde použitý variační Bayes, a nové nástroje z numerické optimalizace dávají naději na vzrušující pokrok.


Výsledek

Stůl 1. Tabulka 1. Přehled pacientů zahrnutých v závěrečné analýze.

Milníky studie v kontextu vrcholných ohnisek v Itálii a Španělsku jsou uvedeny na obrázku 1. Údaje o věku, pohlaví, maximální podpoře dýchání v kterémkoli bodě hospitalizace a příslušných souběžných stavech (diabetes typu 2, hypertenze a ischemická choroba srdeční) u pacientů, kteří byli zahrnuti do konečné analýzy, jsou uvedeny v tabulce 1 a v tabulce S. Kvantilovo-kvantilový (Q-Q) graf dvou metaanalýz (hlavní analýza a analýza korigovaná na věk a pohlaví) ukázaly významné asociace na konci distribuce s minimální genomickou inflací (λGC=1,015 pro hlavní analýzu a λGC=1,006 pro analýzu korigovanou na věk a pohlaví) (obr. S2 v doplňkové příloze 1). Provedli jsme také samostatné asociační analýzy pro italské a španělské datové soubory (viz část Doplňkové metody a obr. S3).


Vítejte!

Jedná se o jeden z více než 2 400 kurzů na OCW. Prohlédněte si materiály k tomuto kurzu na stránkách odkazovaných vlevo.

MIT OpenCourseWare je bezplatná a otevřená publikace materiálů z tisíců kurzů MIT, která pokrývá celé kurikulum MIT.

Žádná registrace ani registrace. Volně procházejte a používejte materiály OCW svým vlastním tempem. Neexistuje žádná registrace a žádná data zahájení nebo ukončení.

Znalosti jsou vaší odměnou. Použijte OCW k vedení vlastního celoživotního učení nebo k výuce ostatních. Nenabízíme kredit ani certifikaci pro používání OCW.

Vytvořeno pro sdílení. Stahujte soubory na později. Odeslat přátelům a kolegům. Upravte, remixujte a znovu použijte (nezapomeňte jako zdroj uvést OCW.)


Závěr

Naše studie poprvé navrhuje, aby některé polymorfismy HLA v italské populaci mohly být potenciálně spojeny s různým regionálním výskytem a úmrtností na Covid-19, pravděpodobně aktivující lepší a silnější antivirovou odpověď, přičemž centrální a jižní regiony jsou nejvíce chráněny před epidemie. Tyto důkazy, získané na úrovni obecné populace, je třeba potvrdit v retrospektivních studiích případové kontroly u širokých kohort pacientů s Covid-19 ze všech italských regionů, aby bylo možné definovat polymorfismy HLA jako faktor podílející se na náchylnosti k chorobám. Navíc, protože bioinformatické předpovědi o vazebné afinitě HLA-virových peptidů samotné mají omezený funkční význam, je zásadní pomocí řádných studií in vitro a in vivo identifikovat, zda jsou tyto genetické lokusy HLA účinně spojeny s indukcí ochranného T a Antivirová imunita zprostředkovaná B-buňkami. Výzkumné úsilí zaměřené na zkoumání genetických asociací s imunitní odpovědí na Covid-19 by mohlo být zvláště užitečné jak na epidemiologické, tak na klinické úrovni, aby bylo možné identifikovat pacienty, kteří jsou nejvíce ohrožení rozvojem závažných komplikací, které by proto měly mít přednost před přístupem k očkování, kdy bude být k dispozici a vyhodnotit rozdílnou účinnost vakcinace u subjektů s odlišným genetickým pozadím HLA. Typizace HLA, kterou lze snadno provést pomocí nákladově efektivních metodologií, také spolu s testováním na Covid-19, by proto měla být zvažována a podporována na klinické úrovni a tvůrci politik vytvořením národní sítě, která může shromažďovat vzorky DNA od pacientů. ze všech regionů.


Podívejte se na video: Závislost induktance na frekvenci (Prosinec 2022).