本文来自作者[admin]投稿,不代表永利号立场,如若转载,请注明出处:http://www.siyonli.com/jyfx/202506-1162.html
根据法律法规和针对每种情况特定的原产地点的法律法规和道德准则,对所有分析的人进行了采样 。我们确认获得了适当的权限执行所述分析。
To identify candidates for Plasmodium capture, we used the Heuristic Operations for Pathogen Screening pipeline to screen more than 10,000 shotgun-sequencing datasets previously produced by the Max Planck Institute (MPI) of Geoanthropology (formerly the MPI for the Science of Human History) and/or the MPI for Evolutionary Anthropology against a custom database containing Plasmodium species of interest as well as potential contaminantTaxa63(补充方法1和补充表9和10)。为了减少由交叉映射引起的假阳性物种分配 ,对古代shot弹枪数据进行了预处理,以排除读取与人类基因组的一致性,从随后的分析中。使用LeeHom(v.1.1.5 -Eb382b3或V.1.1.1.5 -BA378B6)进行适配器修剪和合并,并使用标志-AncientDNA进行绘制 ,并使用BWA Aln(v.0.7.12)绘制读数,以下参数:-n 0.01,-o 2和-o 2和-o 2和-o 2和-o 2和-o 2和-o 2和-o 2和-o 2和-o 2和-o 。SAMTools(v.1.3)用于索引和过滤未上限的序列 ,并使用Prinseq(-lc_method dust,-lc_threshold 7; https://github.com/github.com/spabinger/prinseq_parallow; refs refs refs refs of prinseq(-lc_method dust,-lc_ttps://lc_method dust ,-lc_thresod dust,-lc_thresod dust;使用元基因组分析仪(MEGAN)对准工具(Malt,V.0.5.2)进行读取对齐和分类式包装 ,该工具使用以下参数进行执行:blastn模式:blastn模式,半球体对齐,最小的支持值 ,LCA算法的最小算法为1(-sup 1),最大值1(-ssup 1),1(-ssup 1)的最大值100(-sime a)100(-mq of 100)的最大值(-mq of 100(-mq)的最大值(-mq),一 / query a query of 100(-mq -mq-m q of for laCA of 100 fore a ipterime corige of a force of Algorith Mode)comemectiments and。(-top 1)和LCA算法(-MPI)使用的最低身份百分比设置为90(参考文献68)。我们评估了分配给疟原虫属的读数的编辑距离和损坏率 。使用启发式操作进行病原体筛查管道63。筛选之后 ,很大一部分文库分配了一个或多个读数,分配给了恶性疟原虫,Vivax和/或疟疾疟原虫。然而 , 使用Megan对候选对准的视觉分析证实,当对齐与疟原虫属的质量属于疟原虫时,许多读取表现出很高的编辑距离 ,在大概保守的区域和/或低序列复杂性69中堆叠 。为了进一步减少我们的候选列表,我们需要至少一个指定的读取对齐,而没有与感兴趣的疟原虫物种不匹配 ,并且使用基本的本地校准搜索工具(BLAST)Web界面进一步评估读取,以评估序列特异性(https./blast.ncbi.ncbi.nlm.nlm.nih.gov/blast.cgi)。
为了增加古代文库中疟原虫DNA的百分比,我们产生了针对线粒体和核基因组疟原虫的两个新的内解决DNA诱饵集。由于难以控制核和细胞器基因组之间的拷贝数变化 ,因此设计和实施了每个基因组室的诱饵70 。对于每个探针组,我们编制了靶质质属属的列表。并从国家生物技术中心(NCBI)下载了相关参考序列(补充表11)。仅在核捕获设计中使用组装的染色体 。参考选择后,将每个捕获阵列的基因组组合在一起,并使用带有默认参数的DustMasker掩盖了低复杂区域(v.1.0.0 ,来自Blast Package 2.9.0)71。使用8 bp接头序列生成52碱基对(BP)探针的串联序列;我们使用1 bp和6 bp的瓷砖密度分别用于线粒体和核探针集,分别为72。最后,使用自定义脚本(PopeGenerator v.0.89 ,由A.H.撰写)进行探针序列进行复杂性过滤和重复去除,分别为线粒体和核捕获的探针进行了32,634和2,897,533探针。经过多次质量检查(补充方法2),我们订购了100万个特征Agilent Sureselect DNA捕获阵列的线粒体(n = 1)和核(n = 3)探针集 ,复制探针以充分利用空间 。如其他地方所述,将诱饵从阵列表面裂解,以生成两个内溶液捕获试剂。
宏基因组筛选后 ,我们发现了来自26个考古遗址的36个古老个体,这些遗址显示了疟原虫DNA保存的证据(补充表1)。以前,至少有一个以前在德国耶拿(Jena)的地球人类学(以前是人类历史科学的MPI)的专用清洁室设施中对古代DNA进行了取样12) 。大多数样品是从牙齿中获得的(n = 27) ,尽管我们还分析了颞骨的质量和2个钙化组织样品的7个样品(补充表12)。对于秘鲁Laguna delosCóndores地点的单个LDC020,对秘鲁的Laguna deloscóndores地点进行了采样,以进行随后的分析。
对于牙齿样品,从纸浆室内的内部获得牙本粉末(https://doi.org/10.17504/protocols.io.bqebmtan) 。在Jena和Tübingen加工的样品进行了各种净化策略 ,包括紫外线照射,喷砂和/或漂白剂处理,然后通过钻孔从牙釉质 - 底线和粉末中从牙釉质 - 底线和粉末中切除牙齿。如上所述 ,在俄克拉荷马大学进行了CHO001的抽样。如先前所述的次要修改(https://doi.org/10.17504/protocols.io.bqd8ms9w),对石化骨头进行处理 。在从切割面上钻取之前,将Cor001纵向切片 ,然后使用Sandblaster处理TAQ018,然后再从Otic Capsule73进行采样。最后,使用定制方法对两个由钙化组织组成的样本(GAT004和TOR008)进行采样。对于GAT004 ,除去一小块钙化材料,在EDTA中洗涤15分钟,以减少污染 ,然后在标准提取缓冲液中孵育过夜(0.45 m EDTA,0.25 mg ml -1蛋白酶K,pH 8) 。通过从钙化结节的外部进行钻孔来对TOR008进行采样。
总共从上述37个骨骼样品中产生了40个DNA提取物(补充表12)。对于来自25个独特个体的26个样本,将DNA在地球人类学MPI的专用清洁室设施中提取 ,或使用大约40-100 mg粉末状牙本质的考古科学研究所提取,并遵循经过修改的基于硅胶的协议的修改版本74(https://doii.org/10.org/10.17504)。对于11个样本,在地球人类学的MPI上进行了提取的脱钙化和变性步骤 ,然后在德国莱比锡收集,冷冻并运送到MPI进行进化人类学,以进行进一步的人类学 。最后 ,对于其余三个样品,如前所述,在MPI的专用清洁室设施中进行了裂解液制剂 ,但如前所述,除了将0.05%的Tween-20-20添加到提取缓冲液中74,75。使用自动液体处理系统(Bravo ngs工作站B,Agilent Technologies) ,使用二氧化硅涂覆的磁珠和结合缓冲液D将DNA从150 µL裂解物中纯化,最终洗脱体积为30 µl(参考75)。在DNA提取过程中,带有没有样品材料的萃取空白 。
接下来,在为恢复古代DNA的单一和/或双链文库制备方案之后 ,生成了45个古老的DNA文库(补充表12)。在先前发表的协议76,77(https://doii.org/10.17504/prototocols.io.bmh6k39eefleds of Geoantopology或Geoantopology或Archaeological Sciences研究所),在Geoanthtologology的MPI或考古科学研究所或考古科学研究所在MPI或考古科学研究所编制了三个未经UDG治疗和五个未经UDG的和五个udg-Half治疗的DNA图书馆。https://doi.org/10.17504/protocols.io.bakricv6) 。将所有双链索引库纯化,使用定量PCR进行定量 ,并使用IS5/IS6引物和Herculase II融合DNA聚合酶(Agilent)进行扩增,以最终浓度约为200-400 ng µl-1。使用先前描述的单链部分UDG DNA库制备协议78,79的自动版本,从30 µL提取物中制备了另外35个DNA库。在图书馆准备过程中 ,将大肠杆菌尿嘧啶-DNA-糖基化酶和大肠杆菌核酸内切酶VIII添加到去磷酸化的主混合物中,以去除分子内部发现的尿嘧啶 。使用两种定量PCR分析确定图书馆的产量和图书馆制备效率79。使用单链DNA库制备方案的自动版本未经UDG处理,从30 µL提取物中制备了其余两个库。使用Accuprime PFX DNA聚合酶对所有库进行放大并用成对的样品特异性指数进行标记 ,并使用SPRI Technology纯化了放大的库79,80 。从样品DNA提取物和提取空白中制备了库,并添加了进一步的阴性对照(库空白)。最后, 所有样品和对照文库均富含疟原虫属。线粒体和/或核DNA使用在Bravo NGS Workstation B72上进行的两个连续的溶解杂交捕获。在具有75 bp单端测序化学(1×76+8+8循环)的HISEQ4000上对捕获的文库进行测序 ,或者在具有75 bp配对的测序化学(2×76+8+8+8个周期)的NextSeq500上进行了测序 。使用1,240K SNP捕获阵列72,81,82捕获了来自Mechelen和Laguna delosCóndores的St. Rombout墓地和Laguna delosCóndores的另外41个图书馆,该图书馆被广泛用于人类古代DNA的基因组研究中(补充方法3)。
预处理线粒体和核捕获实验的测序数据使用NF核/急切/急切(V.2.4.5)进行分析,并具有双重和单链文库,由于反向适配器序列的差异 ,分别处理了。适应性释放(v.2.3.2)用于修剪,并在必要时阅读合并84 。在保留5'读末端(-preserve5p)的同时,除去了模棱两可和低质量的基础(低于20的质量阈值)。我们保留了30 bp及以上的读数 ,并要求最小适配器重叠为1 bp,以进行修剪。对于在NextSeq500上排序的库,使用NF核/急切标志-Complexity_filter_poly_g启用了使用FASTP(v.0.20.1)的Polyg Trimming;我们还从UDG-HALF处理的库中的5'和3'端从5'和3'末端修剪了2 bp 。合并了车道 ,并使用FASTQC(https://www.bioinformatics.babraham.ac.ac.uk/projects/fastqc/)评估测序数据的质量。最后,我们使用该工具amdirt来识别和下载公共可用的古代疟原虫。shotgun-sequester-sequence read存档中的数据集(ERR3649966,err3649967 ,err3650017,err3650065,err3650068 ,err3650068,err3650072和err3651363)30,86 。这些预处理的序列源自1944年左右在西班牙的EBRO三角洲产生的几个血液载流。先前的分析发现,载玻片含有来自恶性疟原虫和Vivax30,34,35的DNA。为了确定存在的物种,我们将预处理的捕获数据绘制为串联参考 ,包括来自目标人类感染疟原虫属的线粒体或核基因组序列 。(补充方法4和5)。
在捕获质量控制(补充方法4)之后,我们绘制了来自P. falciparum-,P. vivax-和P. malariae阳性库中的预处理读取 ,分别为适当的线粒体参考(LR605957.1,LT635627.1和LT594637.1,分别为LR605957.1 ,分别为)。对于共同感染的个体,我们仅包括竞争性地绘制到各个物种的读取,以避免使用假阳性SNP调用。使用松散(-n 0.01 ,-l 16)和严格(-n 0.1,-l 32)映射参数分别使用BWA ALN(V.0.7.17-R1188)进行映射,分别为非UDG和UDG-HALF库映射参数 。使用Samtools(V.1.12)过滤对齐 ,映射质量阈值为37,并使用带有默认参数的PICARD MARKDUPLICATES删除重复项(http://broadinstitute.githinstitute.github.io/picard/picard/)66。使用NF核/急切(v.2.4.6)在单个级别合并了来自多个库的对齐,并使用PICARD ADDORREPLACEREADGROUPS处理BAM文件,用于下游兼容性83。使用默认参数的GATK UnifiedGenotyper(v.3.5)进行基因分型 ,并使用输出模式“ EMIT_ALL_SITES ” 87 。将古老的基因型与公共现代的线粒体数据(补充表13和补充方法6)相结合,我们使用Multivcfanalyzer(V.0.85.2)生成了SNP对齐,需要最小的3倍覆盖范围3×以用于基本呼叫 ,并将其排除在有问题的区域888888(补充方法4)。对于单链非UDG处理的库(补充表12),我们使用GenOSL执行了损害感知的基因分型,考虑到分别向前和反向mapping读数的潜在受损基础分别为89(https://github.com/aidaanva/genosl)。使用自定义脚本 ,我们排除了基因组覆盖率不到90%的基因组,并使用工具mdf.r(https://github.com/aidaanva/mdf)进行了完整的删除过滤 。删除了任何不变网站后, 我们以Nexus格式输出精选的SNP一致性和区域人口分配。为了可视化线粒体基因组的相关性模式 ,我们使用POPART(http://popart.otago.ac.ac.nz)构建了中间连接网络。
对于通过核捕获质量控制的图书馆(补充方法5),我们提取了竞争性的对齐方式,并将其映射到了Vivax和/或Falciparum P. falciparum核染色体支架上 ,并使用BedTools90(v.2.25.0)将其转换为FastQ格式 。我们合理地认为,此前过滤步骤将减少由多物种共同感染中跨物种映射引起的潜在假阳性呼叫的数量。正捕获库映射到恶性疟原虫PF3D7的14个核染色体支架(参考文献91,92)(GCA_000002765.3)和/或/或/或P. vivax pvp01(参考文献93)(GCA_900093555.1)至于线粒体捕获数据,使用BWA ALN(v.0.7.17)绘制了损坏的单链单链和双链UDG-HALF库,该库具有严格的参数(-n 0.1 ,-l 32),并使用宽松的参数参数映射,并使用宽松的参数映射。在使用SamTools(V.1.12)进行对齐过滤(-Q 37)之后 ,我们使用默认参数的Picard Markduplicates删除了重复项66(http://broadinstitute.githinstitute.github.io/picard/) 。为了防止在未经UDG处理的库中造成古代-DNA损伤引起的基因分型错误,我们使用了从Bamutil(V.1.0.15)(V.1.0.15)到Aligned Reads94的5'和3'端的Trimbam实用程序。合并了来自同一个体的脱振,预处理的BAM ,并使用inupCaller的NF/急需实现(v.1.5.2,https://github.com/stschiff/sesedencecetools)使用NF-Core/急切的实现与默认参数(-run_genotyping piper__tiorping,-genotyping ,-genotyping,-genotyping,-genotyping_tiorping ,v.1.5.2,v.1.5.2,https://github.com/stschiff/sesedencetools)。对于恶性疟原虫和疟原虫阳性样品,我们称基因型为873,060和872,564个高质量的SNP位置在现代数据集中确定 ,作为疟疾P. falciparum p. falciparum社区项目的一部分和疟疾P. Vivax P. p. vivax p. vivax p. vivax p. vivax nopemnopp。vivaxp. vivax nopem nopem p. vivax p. vivax nopiator variiation项目 。修剪现代数据集(补充方法7)之后, 我们删除了小等位基因在不到两种菌株中存在的位置,导致106,179和419,387个地点分别在现代的恶性疟原虫和疟原虫种群中分离出来。古代和现代数据集与适当外群(补充方法8)的基因型合并 ,以进行后续人口遗传分析。
对于Vivax和恶性疟原虫种群遗传分析,我们分别合并了来自906个现代和23种古代菌株和1,227个现代和9个古代菌株的数据(补充方法7) 。对于每种物种,我们使用SmartPCA(V.16000 ,LSQProject Yes,Shrinkmode是,是 ,Outliermode 2,Usenorm No),计算特征向量 ,基于高覆盖现代的现代基因型,并将古代数据投射到这些变量的这些轴上955,9696。为了确定我们古老的数据集的适当的SNP覆盖范围截止,我们减少了现代菌株,以模拟低覆盖的古代样品并评估了它们在PCA中的性能(补充方法9)。在这些实验的基础上 ,我们认为5,000个分离的SNP是可靠地区分与不同种群的菌株的适当阈值 。尽管我们在PCA分析中包括了覆盖率低至500个分离SNP的古老菌株,但我们指出,在PCA空间中的精确定位应在此覆盖范围内谨慎解释。
接下来 ,我们使用基于模型的方法97使用了无监督的混合物(V.1.3.0)来评估现代恶性疟原虫和维瓦克斯的种群结构。将基因型数据转换为二进制格式后,我们使用plink(v.1.90; http://pngu.mgh.harvard.edu/purcell/plink/plink/)过滤较小的等位基因频率的变体,低于1%(-make-maf ,-maf,-maf)和使用CORERELINADS ALENHOLD speatp specirelation spepliants and a 25 specor specor specor yestration-a( - indepwise 200 25 0.4)98 。我们总共保留了108,438和20,107个SNP,分别为Vivax和P. falciparum保留。对于每个物种 ,我们对2到15之间的每个值进行了五次无监督混合的重复运行。我们使用开源脚本(由T.C.L 。撰写; https://github.com/tclamnidis/admixtureplotter)编制了混合输出和可视化结果。在评估了CV误差以确定每种物种K的最佳值之后,我们进行了监督混合物,以对古老的恶性疟原虫和Vivax菌株建模为现代种群的混合物 ,使每个组件最大化97。对于Vivax而言,我们将以下六个人口用作资源:东南亚东部,埃塞俄比亚,拉丁美洲 ,大洋洲,西亚,西亚和东南亚。对于恶性疟原虫而言 ,我们使用以下八个现代人群对古代菌株进行了建模:东非,西非,南美 ,南亚,东南亚西部,东南亚东部 ,印度尼西亚和巴布亚新几内亚 。对于每个物种,我们进行了200次重复的重复,以评估在低覆盖的古代数据集(-b)上混合建模的可靠性。在观察到古代欧洲恶性疟原虫菌株被建模为使用这种方法的复杂混合物之后 ,我们使用EBRO1944作为额外的来源人群重复了监督的混合分析。
对于恶性疟原虫和Vivax,我们都使用了来自AdmixTools(V.7.0.2)套件的QP3POP和QPDSTAT,以定量检验有关现代和古代疟原虫种群相关性的特定假设99 。对于这两个物种,我们评估了F3形式的外部F3统计数据(Test1 ,test2; Outgroup),其中Test1和Test2包括所有现代人群和高覆盖的古代菌株。对于恶性疟原虫而言,我们使用西非人口作为外来群体来探索非非洲现代和古代人口之间的亲和力。对于Vivax ,我们选择了类似于Vivax的群体外群来增加SNP计数并提高我们的统计能力以区分人口相关性 。为了测试与现代拉丁美洲(LAM)种群的古代疟原虫菌株的支柱,我们运用了F4形式的F4统计数据(p。vivaxlike,古代;测试 ,LAM),测试指的是LAM以外的其他现代人群。为了测试现代非洲和南美(Sam)P 。falciparum之间的支柱,我们计算了F4形式的F4统计数据(p。praefalciparum ,Test; Sam,Africa),非洲包括西非(WAF) ,东非(EAF)(EAF)(EAF)和中非(CAF)和测试,包括非裔现代群体和非熟食的人群和高级人群。
接下来,我们使用Mega-CC(V.10.0.2)分别为现代和古老的P. falciparum和P. vivax建造了邻居的树木 。对于每种物种,我们排除了少于5,000个分离SNP基因分型的古代菌株。我们分别使用类似于Vivax的P. p. p. praefalciparum作为杜瓦克斯和恶性疟原虫分析的外群。After converting our eigenstrat-format SNP data to multifasta alignments (EigenToFasta.py, https://github.com/meganemichel/plasmodium_project_scripts), we built neighbour-joining trees using the following parameters: pairwise deletion mode, 100 bootstrap replicates, Jukes Cantor substitution model, and rate variation following a gamma distribution with参数1.00。使用生命的互动树(v.6.7.6)101对所产生的系统发育进行了可视化 。
对于疟疾阳性部位的古代个体的子集 ,我们进行了人口遗传分析,如补充方法10中所述。
有关研究设计的更多信息可在与本文有关的自然投资组合报告摘要中获得。
赞 (11)
评论列表(3条)
我是永利号的签约作者“admin”
本文概览: 根据法律法规和针对每种情况特定的原产地点的法律法规和道德准则,对所有分析的人进行了采样。我们确认获得了适当的权限执行所述分析。 To identify candi...
文章不错《古代疟原虫基因组阐明了人类疟疾史》内容很有帮助