镰状血红蛋白引起的疟疾保护取决于寄生虫基因型

  我们的病例对照研究8的样本收集和设计已由英国牛津的牛津大学热带研究伦理委员会(OXTREC)批准(OXTREC 020-006) 。获得了疟疾患者的父母或监护人的知情同意 ,以及母亲的人口控制。当地批准机构是MRC/冈比亚政府伦理委员会(SCC 1029V2和SCC670/630)和Kemri研究伦理委员会(SCC1192)。   我们使用Illumina测序来生成两个共同反映人类和恶性疟原虫遗传变异的数据集,使用了来自冈比亚和肯尼亚的严重疟疾病例样本,以前报道了人类基因型为5,8 。对我们的测序和数据处理的完整描述是在补充方法中给出的 ,并在扩展数据中进行了总结 。在简短的过程中 ,按照序列数据质量控制和跨平台合并的过程,我们生成了(1)微阵列的数据集和一个人类基因型,以及基因组群P. falciparum Genotypes ,以前与3,346的个人相关的人,以前;(2)直接在4,071个没有密切关系的个体中,直接在sequenom iplex质量阵列平台(Agena Biosciences)5和全基因组的恶性疟原虫基因型的HBS基因型数据集和全基因组拟南芥基因型中键入。在具有高寄生虫血症的样品中 ,将寄生虫DNA从整个DNA进行测序,并使用选择性全基因组扩增(SWGA)在所有样品中放大恶性疟原虫DNA。使用基于GATK的已建立的管道11称为恶性疟原虫基因型,该管道称为单核苷酸多态性和相对于PF3D7参考序列的短插入 - 缺失变体 。该管道通过调用寄生虫变体来处理混合感染 ,就好像样品是二倍体一样。在实践中,这意味着具有大量读取的变体涵盖了参考和替代等位基因,称为杂合基因型。   对于主要文本中提出的分析 ,我们将3,346个带有人类基因型的样本用于我们的初步发现分析,以及4,071个具有直接键入HBS基因型的个体进行所有其他分析 。这两个数据集中的个体基本上重叠(扩展数据图1),但是825个个体的子集直接用于HBS ,但不在发现数据中 ,我们将其用于复制。   为了描述我们的方法,我们首先考虑一种简化的感染模型,在该模型中 ,寄生虫具有单一的(可测量的)基因型,在咬人时获得,这与疾病结果有关 ,也就是说,我们忽略了宿主内部突变,共同感染和相关遗传变异的任何影响。我们认为 ,一个人群容易被感染的蚊子咬伤 。一部分感染继续引起严重疾病。在被咬伤并感染特定寄生虫I = X的个体中,人类等位基因E = E与疾病结果的关联可以通过相对风险来衡量,   在我们使用e = 0的情况下 ,表示所​​选的基线人类基因型,以测量风险。如果关联的强度在寄生虫类型之间进一步变化(例如在选择和选择的感染类型之间),那么这些相对风险将有所不同 ,因此相对风险的比率(RRR)将与1不同 。如果宿主基因型E构成了针对严重疟疾的保护 ,则相对的相比,相比的保护水平相比,相对风险的比率将捕获不同的寄生虫类型的差异。   尽管以上措辞是根据人类基因型的相对风险 ,但可以将RRR等效地表示为给定的寄生虫基因型的相对风险比,而两种人类基因型之间的相比(补充方法)。因此,它在人类和寄生虫等位基因方面是概念上对称的 ,并且在不同人类基因型之间相比,特定的寄生虫类型赋予的致病性水平的变化也同样可以很好地捕获 。   在严重疟疾病例中计算出的特定人类和寄生虫等位基因的OR与相对风险的比率正式相似,但基因型和疾病状况的作用与互换的作用 。我们在补充方法中表明 ,实际上   绕行的术语反映了蚊子咬伤时人类和寄生虫基因型的可能关联。因此,在这种模型和没有混杂因素的情况下,意味着宿主和寄生虫基因型在咬人时并不独立 ,或者宿主与寄生虫基因型之间在确定疾病风险时存在相互作用。前者的可能性可能被认为不太合理,因为它似乎暗示相关的宿主和寄生虫基因型可以在咬人之前或咬人前被蚊子检测到,但我们强调 ,如果没有蚊子传播的寄生虫数据 ,就无法正式测试这一点 。可以在补充方法中找到这些假设的进一步讨论。   我们开发了一个C ++程序(HPT),以有效估计多个人和寄生虫变体之间的优势比(方程(2)),其原理与针对人类病毒和人类细菌GWAS47,47,48,49开发的方法相似。HPTEST实现了一个逻辑回归模型 ,其中将一个文件的基因型包括在同一样本上的结果变量和第二个文件中的基因型作为预测变量中 。还可以包括测得的协变量,该模型使用SNPTEST 50的方法解释了估计的预测器基因型中的不确定性。使用Line搜索方法使用修改后的Newton-Raphson拟合该模型。在我们的主要分析中,我们将寄生虫基因型作为结果应用 ,宿主基因型作为预测因子,假设宿主基因型对log-odds量表的添加效应,并将寄生虫基因型作为二进制结果(排除混合和缺失的基因型调用后) 。   为了减轻有限样本偏差的影响 ,我们实施了通过弱信息log f(2,2)先验分布51对宿主等位基因影响(类似于具有标准偏差1.87的高斯分布;补充方法)的回归。先前将协变量效应分配为log f(0.08,0.08),该效应的覆盖率与均值零且标准偏差为40相似的95%覆盖范围。我们总结了使用贝叶斯因子针对无效宿主等位基因的效果为零的证据强度 。还可以通过将最大后验估计值与零模型下的预期分布进行比较(补充方法)来计算p值。对于我们的主要结果,我们仅包括一个协变量 ,该协变量的指标是该国的确定国家(冈比亚或肯尼亚);下面描述了协变量的其他探索。   在我们的最初发现分析中,我们集中在一组51,552个P.恶性疟原虫变体上,这些变体在我们的发现集中至少25个人中观察到 ,在排除了任何混合或缺失的基因型调用之后 。这些包括:51,453种被称为双质和通过质量过滤器的变体(补充方法中详细介绍;包括含在核心基因组中的要求);pFebl1区域中的另外98个双重变体(位于核心基因组之外 ,但似乎可靠地呼应);以及PFEBA175“ F”段的指标,我们根据序列覆盖率调用,如补充方法和补充图6所述 。我们包括PFEBL1和PFEBA175变化 ,因为这些基因编码了侵袭性红细胞性疟原虫的已知或推测受体的受体或推测的受体。   我们集中于选择如下的一组人类变体:我们包括了先前报道的变体列表中的94种常染色体变体,这些变体具有与严重疟疾的相关性最多的证据,其中包括在HBB ,ABO,ATP2B4和Glycophorin locus的确认关联。我们还包括三个糖蛋白结构变体13和132个HLA等位基因(2位数为62位,在4位分辨率下为70) ,它们的精度合理(确定为次要等位基因频率> 5%,至少在我们数据集中的两个人群中至少有0.8) 。我们针对上述所有51,552个P.恶性疟原虫测试了这些变体。我们还包括了确定血型抗原的基因2 kb之内的所有常见,投影良好的人类变异(定义为雨果血液组抗原族的一个基因的2 kb以内的变体5%的次要等位基因频率为5% ,并且在我们的两个数据中的两种群体中至少有0.8个群体中的一个含量为0.8;这在我们的数据中包括39 nipos and 39 suiles and 3 nimel and insim and 3 nimel and insim;我们对这些变体进行了测试。我们总共测试了发现数据集中的19,830,288个不同的人寄生虫变体对(图1A) 。   我们将所有相关的变体对(定义为具有BF(V,W)> 100的对(V,W) ,其中BF(V ,W)是该变体对的关联测试贝叶斯因子),使用迭代算法如下。对于每个相关的对(V,W) ,我们发现了最小的封闭区域(RV,RW),以使任何其他相关的对均与(RV ,RW)放置或距离(RV,RW)在宿主或寄生虫基因组中的10 kb超过10 kb,重复直至将所有相关对分配给区域。对于每个关联区域对 ,我们随后记录了区域边界和铅变体(定义为最高贝叶斯因子的区域变体对),并使用NCBI Refgene54和plasmodb V4455基因注释 。由于我们测试了所选的变体对列表,如上所述 ,在某些情况下,这些区域包含单个人或寄生虫变体。补充表1总结了这些区域的变体对,BF> 1,000。   我们将关联测试p值与NO关联的零模型下的期望进行了比较 ,无论是在去除与HBS的比较之前和之后 ,使用分位数定量图(补充图2; HBS均由“ A ”等位基因编码为RS334,CHR11:5,248,248,232 T-> A) 。解释QQ图上各个点的一种简单方法是将每个p值与相关顺序统计量的预期分布进行比较(补充图2中的灰色区域描绘);对于最低的P值,这类似于考虑Bonferroni校正。但是 ,我们警告说,由这种方法确定的阈值取决于进行的一组测试。一种更具辩护的方法是询问需要哪种p值阈值,以产生信心 ,即特定的变体是真正相关的 。这取决于关联的先前概率和统计能力以及关系 。   对于任何p值阈值t(补充方法)50。左侧的术语是对给定阈值以下的p值观察到真正关联的几率。因此,相应的概率等于一个减去正假发现率56 。(3)的解释需要了解相关的关联几率,又需要权力 ,这又取决于真实的效应大小分布和变体的潜在频率。   在观察到的数据(补充方法)上有条件的类似方法会导致涉及贝叶斯因子而不是功率项和T的类似公式。如果真正相关的变体效应大小的分布类似于log f(2,2)分布,我们使用来计算贝叶斯因素,并且如果变体对具有相似的概率 ,则在固定范围的概率上可能会在固定的范围上提供近似的概率 。   我们说明了可能的计算,如下所示。51,552 P.恶性疟原虫的变体代表大约20,000 1 Kb的恶性疟原虫基因组区域,考虑到LD衰减率11 ,可能被认为是近似独立的。同样 ,人类基因组也可以被认为是大约200万个大约独立区域的组成 。如果我们认为可能有少数数字(最多十个)可能相关联,这决定了先前的赔率,即40亿分之一。因此 ,需要大约1010的贝叶斯因子来产生大量的后部缔合几率,而贝叶斯因子较高的数量级将提供令人信服的证据(后验概率> 95%)。在补充图4和补充方法中,我们详细介绍了应用于p值的类似计算 。对于对或≈4的较大效应大小 ,这表明对1×10-10至1×10-12的p值可能为关联提供了令人信服的证据,具体取决于等位基因的频率,但较弱的效果将需要较低的阈值 ,并且很容易检测到。   可以认为,我们在这里考虑的人类变异和基因是与寄生虫相关的先前合理性最高的人之一,因此 ,上述先验选择可以被认为是保守的。但是,即使在提高了200万分之一的阶段的情况下,在我们的研究中测试的变体对中有10个关联) ,我们的结果也没有确定与HBS -PFSA关联其他相关性的任何关联 ,并具有非常强烈的证据 。但是,由于特定的先前合理性,特定的变体可能会进一步引起人们的关注;在补充方法中 ,我们提供了有关BF> 105的推定关联以及涉及人类基因组中已知疟疾保护突变的相关性的进一步详细信息 。   对于每个人类变异v,我们进一步总结了证据,即使用平均贝叶斯因子与寄生虫基因组的变化相关 ,计算为在所有寄生虫变异中测试的贝叶斯因子BF(V,W)的平均值,在v。根据限制性的假设 ,在大多数parasite的假设下,parasite的变异与w的范围相关,可以与bayes的变化相关。通常 ,通常提供了一种务实的方式来结合所有测试变体的证据 。我们类似地定义了针对v。bfavg测试的所有人类变体的每个寄生虫变体的定义,图1a中的人和寄生虫变体绘制了绘制。   如上所述,可以直接解释这些平均贝叶斯因子因素 ,其方式与单个贝叶斯因子类似 。为了说明 ,如果如上所述,我们假设在恶性疟原虫基因组的20,000 1 Kb区域中,大约有10个可能与经过测试的人的人类遗传变异有关 ,则需要平均贝叶斯因子> 10,000,以表明> 80%的关联后几率。这仅是我们数据中的PFSA变体实现的(图1A)。可以根据适当的方式调整此计算,以考虑有关单个变体的特定信息 。   除了HBS-PFSA关联外 ,我们还观察到许多其他变体对的相关证据。这些包括人类基因GCNT2和PFMSP4的变异与BF = 2.8×106之间的关联,HLA变异与BF的多个寄生虫变异之间的关联(图1A,补充表1)。可以在补充方法中找到对这些SNP上下文的更全面描述 。我们的解释是 ,这些关联的统计证据本身不足以使这些信号引人注目,而没有其他证据。   为了评估观察到的HBS和恶性疟原虫之间的关联是否可能是由混杂因素驱动的,我们根据直接键入HBS的基因型进行了其他成对关联测试 ,如下所示,并在两个群体中分开工作。结果显示在扩展数据中图3 。首先,我们重复了包括个人重叠数据集的个人的成对关联测试 ,并在其余的825个个体中分别重叠 。对于发现样本 ,一组人口特定的主要成分(PC)以前是计算出的8,我们将其作为协变量(包括20个PC)。其次,在所有具有直接键入HBS数据的4,071个人中 ,我们重复了包括测量的协变量作为其他预测因子的测试。具体而言,我们考虑了:(1)确定时的个体年龄(以年度测量;范围为0-12;被视为分类协变量),性别 ,报告的族裔和入学年份(范围1995- 2010年,被视为分类协变量);(2)技术协变量,包括测序方法(SWGA或整个DNA)的指标 ,恶性疟原虫基因组覆盖范围的平均深度,根据对齐的读数计算出的平均插入尺寸以及混合呼叫的百分比;(3)确定样品的严重疟疾的临床形式的指标(“ SM亚型”;脑疟疾,严重的疟疾贫血或其他) 。   为了评估寄生虫种群可能影响结果的可能性 ,我们还包括在寄生虫种群中计算的PC,如下所示。我们分别在每个人群中工作,我们从比51,552个分析的变体(冈比亚分别为51,547个SNP和肯尼亚的48,821 SNP)的双等位基因频率的子集至少1%。我们通过从此列表中随机迭代选择变体进行了变化 ,并排除了所有其他超过1 kb(在冈比亚留下12,036个SNP ,在肯尼亚留下了11,902个SNP) 。我们使用QCTool使用此SNP列表来计算PC。在特定基因组区域中,一些顶级PC的SNP负载升高。这在肯尼亚尤其引人注目,其中包括在6和7染色体上围绕AAT1和CRT区域周围广泛报道的LD区域 ,以及与HBS相关的2和11位点 。因此,我们还考虑了在排除6和7中排除SNP(分别排除了9,933和9,812个SNP)后计算的单独的PC,分别排除了染色体2和11(10,521和10,421个SNP)或在排除了100 kB区域或将SNPS snps snps的100 kB区域(11,521和10,421 SNP)(11,521和10,421个SNP)(11,11,86)(11,86666666666666)(排除在外)和11.866666666666666666。对于每组PC ,我们重复了包括20个PC作为固定协变量的关联测试。   对于每个个体的每个子集,每个与HBS相关的变体和上述每一组协变量,我们绘制了估计的效应大小和95%的后间隔 ,并注释了样品总数,携带非参考等位基因的数量在给定变异中,以及携带杂质的或纯元或纯元基因的基因组基因类别(3)(3) 。相应的基因型计数可以在补充表3中找到。为了评估混合基因型调用 ,我们还绘制了每个位点的参考和非参考等位基因的读数比。这可以在扩展数据中找到图4 。   观察意味着严重疾病个体中宿主和寄生虫基因型之间的非独立性,但不能确定发生这种情况的机制 。假设我们在补充方法中表明,该方法等同于繁殖模型 ,其中宿主和寄生虫基因型分别和多样化影响疾病风险(方程(S6)和(S7) ,补充方法)。总的来说,与该模型的一般偏差可能以多种方式出现,包括通过宿主的选择 ,确定疾病耐受性的相互作用效应以及与疾病诊断有关的潜在效果,而不是特定的疾病(类似于伯克森的范式paradox57)。我们的研究仅提供有限的数据来区分这些可能的机制 。对于主要文本中描述的HBS关联,我们在补充方法中指出 ,很少有证据表明PFSA+变体本身与疾病风险增加有关,几乎没有证据表明PFSA+变体与其他宿主保护性变体相关,这表明观察到的相互作用是HBS特定的。在简单情况下 ,这种关联的出现进一步表明,这种作用与表现为严重疾病的感染并不特别相关。   我们从先前发表的32名儿童的RNA-Seq数据中称为基因型,并从MALI16的简单疟疾(NCBI Bioproject PrjNA685106)确定 。我们使用与3D7参考基因组对齐的读取的BAM文件作为先前生成的16。所有数据均来自总RNA的50 bp配对端RNA-seq。对于每个PFSA铅变体 ,我们计算了与参考,备用或其他等位基因对齐的读取数量,忽略了映射质量低于20的读数 。这些读数在补充表6中列出了PFSA突变。我们将基因型视为混合的(并在补充表2中排除在关联分析中) ,如果观察到覆盖两个等位基因的读数中的10%;否则 ,我们分配了特定的基因型。在PFSA3上,我们还为第二高相关SNP(CHR11:1,057,437 T> C)制定了基因型,因为我们注意到一个样品(AS15)在此和CHR11:CHR11:1,085,035 t> A变体之间具有不同的基因型 。   公式(3)表示严重病例中的优势比 ,因为在感染时在寄生虫基因型上有条件的给定人类等位基因的相对风险之比。密切相关的解释涉及观察到的(疾病时间)寄生虫类型的严重疟疾的相对风险,   计算表明,在严重情况下 ,或在严重的情况下也等于比率。可以通过比较感染基因型Y和整个人群之间的宿主基因型的频率来计算相对风险(方程(4)) 。在补充方法中,我们扩展了这一点,以表明可以使用多项式逻辑回归进行估计 ,并以寄生虫类型分层为结果水平,以及人类基因型和任何作为预测因素的协变量 。我们在图2中应用了这种方法来估计,在该方法的三个PFSA基因座的组合基因型上 ,以采样国家为条件。   我们通过计算与每个位置对齐(“覆盖范围”)的读取计数,并将其与我们数据集中的所有biallelic站点分布进行比较,评估了CHR2:631,190 ,CHR2:814,288和CHR2:814,288和CHR2:1,058,035基因座的测序性能。在这三个地点的一般覆盖范围很高 。我们注意到 ,在SWGA测序数据中,Chr2:814,288的覆盖率特别高(例如,> 90%的样品在跨双质体变体基因组中具有覆盖范围的最高80%) ,但在CHR11:1,1058,035 Locus的WGS样品中的覆盖率较低。由于DNA量的变化,DNA扩增和测序过程的变化,因此预期基因座和样品之间的覆盖率变化 ,但我们没有观察到这些基因座的不同PFSA基因型之间的覆盖范围差异。为了进一步建立一致性的准确性,我们还检查了对齐指标 。在所有分析样本中,每个位置的读取中有99%以上的读取均带有参考或已识别的非参考等位基因 ,其中99%以上的读取具有至少50个映射质量(代表自信的读取对齐)。这些结果表明,序列读取在这些位点提供了通常准确的基因型调用。   我们开发了一个C ++程序(LDBIRD),以有效地计算所有对恶性假单胞菌变体之间的LD 。LDBIRD计算每个变体的频率 ,并计算每对具有足够高频率的变体的基因型之间的相关性。然后,它生成一个相关值的直方图,并报告了平方相关的变体对高于指定级别的成对。我们分别将LDBIRD应用于冈比亚和肯尼亚严重疟疾病例的恶性疟原虫数据 。我们限制了对给定种群中至少有5%的频率的双重变体之间的比较 ,并且在两种变体中至少有75%的样品在两种变体中都在将混合基因型呼叫视为缺失后 ,并输出所有对R2的混合基因型调用,至少将R2输出至少0.01。为了避免HBS关联信号对LD的混淆,我们还在排除携带HBS等位基因的个体之后还重复了此分析(后者结果在图4和补充表4中显示)。   为了总结染色体之间的LD结果 ,我们将信号分组为以下区域 。首先,我们观察到大多数变体对具有| r | < 0.15 and hence r2 >0.05通常是染色体间LD的基本上偏远程度(图4) 。因此,我们专注于R2> 0.05的变体对(V1 ,V2)。对于每个这样的对(V1,V2),我们分配了一对LD区域(R1 ,R2),其属性R1和R2捕获了具有高R2的所有其他附近变体。具体而言,R1和R2分别定义为包含V1和V2的最小区域 ,因此(R1,R2)内的10 kb中没有其他变体对具有R2> 0.05 。为了计算R1和R2,我们实施了一种迭代算法 ,该算法依次扩展了初始对 ,直到找不到附近带有高R2的附近对。对于每个LD区域对,我们记录了区域边界和最相关的变体。补充表5给出了R2> 0.05的区域对的完整列表;PFSA区域和PFCRT – PFAAT1的最高LD对如图4所示 。   To investigate whether the observed between-locus LD might arise due to population structure effects or due to other artefacts captured by measured covariates in our data, we used HPTEST to fit a logistic regression model of association with the genotypes at one Pfsa locus as outcome and the genotypes at a second Pfsa locus as predictor, repeating for each pair of Pfsa regions, in each population separately.我们适合该模型,包括一组协变量 ,如下所示:(1)无协变量;(2)20张寄生虫PC;(3)技术协变量,包括测序和序列深度类型的指标(如图3所示,如图3所示);(4)入学年 ,或(5)上述所有合并。对于每组协变量,我们比较了估计的优势比,表明关联强度与未调整的优势比。In Kenya, across covariate sets, the minimum and unadjusted estimates were 128.0 and 128.0 (Pfsa1+ vs Pfsa2+; minimum with no covariates), 218.0 vs 219.4 (Pfsa1+ vs Pfsa3+; minimum when including technical covariates) and 40.2 vs 47.2 (Pfsa2+ vsPFSA3+包括寄生虫PC时 。在冈比亚 ,最低和未调整的估计值为7.0和7.7(PFSA1+和PFSA3+,包括寄生虫PC时最小值)。因此,这些结果表明 ,观察到的LD并未通过这些协变量捕获的样本的种群结构或样本的其他特征来大大解释。   为了确定乌干达Palo Alto(FUP/H)分离株的基因型(扩展数据图7-8),我们下载了Illumina序列读取序列Read Archive的数据(SRR530503,SRR629055和SRR629078) ,由Broad Institute生成) 。所有读数均为101个基对配对端。我们使用BWA MEM将读取与PF3D7_V3基因组保持一致 ,并检查了读取堆积物以确定与HBS相关突变的基因型。这些数据清楚地表明,FUP/H携带PFSA1-3铅SNP的替代等位基因,以及ChR:1,057,437 T> C(基于携带非参考等位基因的读数中的98%) 。   我们分析了三个先前报道的实验的数据 ,这些实验测量了红细胞入侵后不同时间阶段中3D7中基因的转录(加入PRJEB201558和PRJEB3153559) 。使用与先前所述的类似管道处理数据16。简而言之,使用Star v2.7.3a与串联的人GRCH38 / PF3D7基因组对齐,由Gencode V38人和PlasmodB V52 PF3D7基因注释告知。然后提取与PF3D7对齐的读取 ,并使用鲑鱼V1.5.1估算转录本丰度(TPM) 。PFSA区域中基因的估计TPM值,以及先前计算的Saelens等人16的TPM值,在扩展数据中显示了图7。   我们从PF3D7参考序列中提取了以CHR2:631,190 ,CHR2:814,288和CHR2:1,058,035位点为中心的101 bp和1001 bp侧翼序列。然后,我们使用MiniMAP260将这些序列与来自恶性疟原虫分离株和实验室菌株的先前生成的一组基因组组件对齐(补充表7),从而允许多个可能的映射位置 。每个侧翼序列都与所有包含基因组中相应染色体的单个位置排列在一起 ,但除了序列的序列为11个基因座的序列与ML01样品中的两个位置对齐。该样本被排除在先前的分析中38,因为它代表了多种感染。我们在下面对此进行进一步评论 。   为了进一步检查序列身份,我们使用MAFFT生成了与每个基因座中心的1001 BP序列相对应的多序列比对(MSA)。在Chr11:1,058,035 SNP上 ,四个分离株(来自GABON的GA01 ,来自塞内加尔的SN01,塞内加尔CD01和ML01)带有非引用“ A ”等位基因;其中两个(GA01和CD01)还在CHR2:631,190 SNP和一个(CD01)的非参考等位基因携带非参考等位基因,在所有三个SNP上都带有非参考等位基因。然而 ,对齐的扩展为包括10,001 bp段,表明这四个样品在CHR11基因座上还具有结构重排 。具体而言,GA01 ,SN01,CD01和ML01基因组包括约1 kb的插入,在CHR11:1,058,035的右侧约为900 bp ,也约为左右约2,400 bp的左右,在Chr11:1,058,035的左侧约2,400 bp。为了研究这一点,我们在整个区域生成了K-MER共享K = 50的“点 ”图(补充图3 ,扩展数据图9),揭示了一个复杂的重排,携带已删除和重复的段。重复的序列包括一个段(近似坐标 ,PF3D7中的1,054,000–1,055,000) ,其中包含PF3D7参考中的基因SNRPF(“小核核糖核蛋白F,推定”) 。断点的检查未显示该区域中任何其他预测的基因拷贝数变化,包括PF3D7_1127000 。   如上所述 ,11号染色体区域与ML01中的第二个重叠群排列(CONTIG CHR0_142,补充表7)。该重叠群似乎具有在相关SNP右侧的一个约4 kb段的串联重复(大约对应于PF3D7中的11:1,060,100-100–1,064,000;补充图3)。该细分市场包含许多基因,其中包括Dutpase ,这些基因已被研究为潜在的药物靶向61 。我们将第二个重叠群解释为由于该样品中的多重感染而引起的,并且给出了混合样品基因组组装固有的挑战,尚不清楚该重复是代表组装伪像还是第二个真实的区域结构变体。   有关研究设计的更多信息可在与本文有关的自然研究报告摘要中获得。

本文来自作者[admin]投稿,不代表永利号立场,如若转载,请注明出处:http://www.siyonli.com/zlan/202506-2059.html

(8)

文章推荐

  • 上海高铁站外可坐地铁吗 上海两男子在地铁上互殴

    上海高铁站外可坐地铁吗上海虹桥站(ShanghaiHongqiaoRailwayStation),位于中国上海市闵行区,为特等站,属中国铁路上海局集团有限公司,于2008年7月20日开工建设,2010年7月1日投入使用。上海虹桥站北端引接京沪高速铁路、沪汉蓉高速铁路,南端与沪昆高速铁路、沪杭甬

    2025年04月14日
    54308
  • 通过电离层向前散射非常高频通信中的一个令人不安的因素

      感谢您访问Nature.com。您使用的是浏览器版本对CSS的支持有限。获得  最佳体验,我们建议您使用更多最新的浏览器(或关闭兼容模式  InternetExplorer)。同时,为了确保继续支持,我们正在展示网站,没有样式  和JavaScript。

    2025年06月19日
    13307
  • 来自C2分解的细胞成分的生物合成:假单胞菌的甘氨酸代谢

      感谢您访问Nature.com。您使用的是浏览器版本对CSS的支持有限。获得  最佳体验,我们建议您使用更多最新的浏览器(或关闭兼容模式  InternetExplorer)。同时,为了确保继续支持,我们正在展示网站,没有样式  和JavaScript。

    2025年06月19日
    10315
  • 从水果发出的成熟效应

      由于成熟水果的散发会加速未成熟的水果的成熟,因此通常不希望将许多种类成熟速率的果实一起储存在一起,因为早期成熟品种可能会有不同的成熟速度。在更长的饲养类型中引起不良成熟过程的不良加速。因此,值得注意的是,R.M.Smock1发现,刺激的效果是最大的,苹果从高潮之上产生,而后临时苹果本身几乎不

    2025年06月20日
    10300
  • 专业技能选择(专业技能方向名称)

    初中生毕业选择什么技能好就业?1、新能源汽车检测与维修近几年,新能源汽车的发展,带动很多人都将目光投向这一行业,初中毕业生来学新能源专业,毕业可以很好的找到一份不错的工作,还可以获得技能文凭。2、对于初中毕业的学生而言,学习汽修技术是一个不错的选择。当前中国汽车产业正处于快速发展阶段,对于汽修人

    2025年06月20日
    12313
  • tera装备获取途径(tera70级装备)

    tera50到60飞镰装备有哪些?pvp装备的话是战士套装,胜利战士套装,暴虐战士套装。图1:瞬跃【镰刃突袭】向前抛出飞镰插入地面,拉动锁链向前飞行。最远可抛出18米,从该技能可以看出飞镰惊人的行动力。图2:镰刃突袭【暗夜降临】爆发黑暗之力。飞镰要求账号下有大于或等于40级的角色时才能进行创建,创

    2025年06月20日
    9319
  • 从大猩猩基因组序列中对人类进化的见解

      我们使用EnsemblEpoPipeLine6(补充表3.2),在五向全基因组对齐中包括了与人类,黑猩猩(PanTroglodytes),Orang-Utan(Pangoabelii)和猕猴(MacacaMulatta)的Kamilah组装。滤除黑猩猩大会和具有许多路线差距的区域的低质

    2025年06月20日
    9322
  • Aldabra环礁的生态学

      皇家学会于2月22日公开,关注Aldabra岛可以用作空中舞台和发送站。Aldabra的岛屿生态系统对生物学家引起了极大的兴趣。作者在1966年访问了该岛,斯托达特博士将于今年夏天与皇家学会探险队一起返回Aldabra。

    2025年06月21日
    9303
  • 【张娅哪个学校英语老师,张娅老师了解一下】

    大冲关张娅是谁合肥168中学有一位名叫张娅的英语教师,她以其专业的教学能力和幽默的教学风格深受学生喜爱。在安徽电视台的《向前冲》节目中,张娅以敏捷的反应和机智的表现赢得了观众的喜爱,成为了节目中最受欢迎的选手之一。张娅不仅在教学上表现出色,她在参加《向前冲》节目时的精彩表现也让人印象深刻。张娅老师

    2025年06月21日
    11317
  • 【气囊游丝安装方法视频,简述气囊游丝拆卸步骤】

    长城m4气囊游丝的安装方法1、长城M4气囊游丝的安装方法如下:确保车辆安全:在对长城M4的气囊游丝进行更换前,确保车辆处于安全、稳定的状态,并选择合适的工作空间进行操作。调整方向盘至中立位置:先将方向盘调整至中立位置,这是安装气囊游丝的重要前提,以确保安装后的气囊游丝能正常工作。2、将方向盘摆正,

    2025年06月21日
    9320
  • 无线电的极化和分类

      感谢您访问Nature.com。您使用的是浏览器版本对CSS的支持有限。获得  最佳体验,我们建议您使用更多最新的浏览器(或关闭兼容模式  InternetExplorer)。同时,为了确保继续支持,我们正在展示网站,没有样式  和JavaScript。

    2025年06月21日
    7323
  • 单日增百例怀远发多份省外协查函的简单介绍

    10月7日蚌埠怀远县新增1例核酸阳性人员怀远县新冠肺炎疫情防控应急指挥部通告2022年10月7日,怀远县在对宁洛高速四方湖服务区工作人员开展每日常态化核酸检测时,发现1例阳性感染者。同时,我县陆续接到外省协查函,有外地阳性人员在宁洛高速四方湖服务区有活动轨迹。严重。央广网合肥10月10日消息202

    2025年06月24日
    9313

发表回复

本站作者才能评论

评论列表(3条)

  • admin的头像
    admin 2025年06月21日

    我是永利号的签约作者“admin”

  • admin
    admin 2025年06月21日

    本文概览:  我们的病例对照研究8的样本收集和设计已由英国牛津的牛津大学热带研究伦理委员会(OXTREC)批准(OXTREC 020-006)。获得了疟疾患者的父母或监护人的知情同意,以...

  • admin
    用户062111 2025年06月21日

    文章不错《镰状血红蛋白引起的疟疾保护取决于寄生虫基因型》内容很有帮助