机器指导的细胞型顺式调节元件的设计

  为了启用有关数据预处理,模型体系结构和培训的参数的系统评估 ,我们开发了Pytorch中有限自动机器学习的工具(https://github.com/sjgosai/boda2)。我们使用CNN基于DNA序列实施了对回归的支持。我们与Google Cloud上的顶点AI平台一起部署了基于此库的容器化应用程序,以使用贝叶斯优化来调整所有超参数 。   为了构建火车/验证/测试数据集以训练麦芽岩,我们从多个项目中汇总了在K562 ,HEPG2和SK-N-SH单元中测试的序列的log2 [FC]输出(OL索引参考文件中显示在补充表1中)。大多数项目的重点是测试人类遗传变异的等位基因效应,其余项目仅测试人类基因组的参考序列。总共汇总了798,064次独特的寡寡寡做,源自十个独立的实验(来自三个不同的项目:UKBB(OL27 ,OL28,OL29,OL31 ,OL30,OL31,OL32 ,OL32 ,OL33),GTEX(OL41,OL42 ,OL42),OL15),OL15) 。我们研究中使用的大多数序列(783,978)旨在评估与可遗传的复杂性状相关的常见人遗传变异。大多数序列(706,054)包括测试参考和替代等位基因 ,通常是一个以200 bp的侧翼序列为中心的单核苷酸取代。其他序列(77,924)评估了两个独立变体的四个成对组合 。根据遗传映射选择了变体,大多数变体是因果等位基因的连锁不平衡伴侣,因此可能对细胞或有机物性状没有有意义的影响。其余序列(14,086)起源于OL15 ,我们从中选择了已知的DHSS和H3K27AC序列。丢弃了任何细胞类型的质粒计数少于20或没有RNA计数的寡核体 。如果在一个以上的UKBB库中存在寡醇,则其log2 [FC]值在库中平均。如果在GTEX或OL15中也发现了UKBB的寡核能,则仅收集了UKBB读数 ,而其他核电量被丢弃了。如果在OL15中还发现了GTEX中的寡核酸(但未在UKBB中),则只收集了GTEX读数,并且丢弃了OL15读数 。丢弃了来自OL15的非天然序列 。此外 ,具有6 s.d.的log2 [fc]的寡聚物在全球均值以下被丢弃 (少于10个寡寡)。将序列从报道矢量主链中的恒定序列填充 ,形成600 bp序列,然后转换为一个hot阵列(即,a:= [1,0,0,0] ,c:= [0,1,0,0,0],g:= [0,0,1,1,0],t:= [0,0,0,1,0] ,t:= [0,0,0,0,0,0,0,1],n:n:= [0,0,0,0,0,0,0,0,0,0,0,0,0,0来自染色体19、21和X的寡素是从参数训练环中排出的,作为验证集指南超参数调整。来自染色体7和13的寡素是通过参数训练和高参数调谐回路扣除的 ,作为报告性能的测试集 。其余染色体的寡素用于训练环中。含有替代等位基因的寡核体被分配给与参考等位基因寡素相同的染色体。通过将(600 bp)序列的反向补体包括在训练中,并复制其在任何单元类型中大于0.5的log2 [fc],进行数据增强 。我们还汇总了在A549(OL27 ,OL28,OL29,OL29 ,OL31 ,OL31,OL32,OL33)和HCT116(OL41 ,OL41,OL42)细胞中测试的318,247和442,482序列的Log2 [FC]输出。   为了在玛尔诺伊人的训练循环之外进行分析,以利用火车/验证/测试集 ,我们汇总了上面提到的相同的798,064个独特的寡核能,最初仅过滤出寡寡,在跨UKBB库中平均log2 [fc]之前 ,RNA计数为零(无质粒计数过滤器)。然后,具有Log2 [FC]标准误差大于1个单元格类型中的寡核体(从性能指标中省略了1个单元格)(对于在UKBB库中具有多个实例的寡核体,省库中最高的log2 [FC]标准误差的寡量省略了1个) 。对于特定于基因座的基准测试 ,我们根据与上述相同的计数滤波步骤汇总了将GATA1基因座(OL43)平铺的log2 [Fc]。我们通过平均每个寡素的MPRA活性与基本对重叠,从而产生了人均基碱活性测量。我们删除了与散点图和相关计算中UKBB和GTEX库中重叠的基因组坐标 。   最终的Malinois模型由三个功能段组成:(1)三个具有分批归一化和最大值池的卷积层;(2)完整连接的线性层,以整合扁平后先前隐藏状态的位置和特征信息;(3)一堆分支线性层 ,使每个输出特征都是四个独立变换的函数。由于前两个段是从Basset Architection 4中复制的 ,因此Malinois接受对应于单热编码的DNA序列的4×600个阵列的批次,因此对200-核苷酸MPRA寡聚的预测是通过填充在两侧的序列序列的恒定序列的持续序列的序列序列的预测。这种严格的输入尺寸要求可确保在模型的第1节和第2节之间过渡时,隐藏状态是适当形状的 。此外 ,这种填充策略使我们能够使用反向补充数据增强,并意识到有关在记者主链中的转录起始位点的200-核苷酸MPRA插入物的方向 。尽管在这项研究中未进行测试,但用自适应池或填充代替最终严格的最大池层层 ,将允许在维护体系结构的所有其他组件的同时,在输入尺寸要求方面具有灵活性。在训练启动时,当段1和2适当配置时 ,使用Pytorch实施的pytorch实施的预审预测的重量初始化了权重。   我们使用Google Cloud Platform(GCP)上的顶点AI API培训了Malinois 。这启用了所有可调参数控制数据预处理,模型体系结构和模型培训的优化。为此,首先 ,我们使用带有以下规格的GCP VM安装CODA,生成了一个Docker容器(gcr.io/sabeti-code/bode/production:0.0.11):Pytorch CPU/GPU/GPU操作系统,A2-HIGHGPU-1GGPU机器类型和1 nvia tees tees tees and a100 nvia tla t tla t tla t t t t tees tya t t tees pytorch cpu/gpu cpu/gpu cpu/gpu cpu cpu/gpu cpu cpu/gpu。容器入口点设置为用于模型训练的Python脚本(BODA2/SRC/MAIN.PY) 。使用此容器 ,我们使用默认算法部署了高参数调谐作业来优化指示的超参数(补充表9)。我们包括使用Vertex AI SDK(BODA2/TUTORIALS/VERTEX_SDK_SDK_LAUNCH.IPYNB)部署超参数调整作业的笔记本。我们使用按照下一节中所述计算的预测来对验证集进行基准测试候选者 ,从而最终确定了Malinois的模型选择 。所有测试集基准测试都是回顾性的,并且没有影响研究中的决策。使用在A549或HCT116细胞中测试的序列的子集拟合了两个其他模型,该模型使用与Malinois相同的高参数配置。   在比较Malinois对经验MPRA的预测时 ,我们将任何重复的log2 [FC]标准误差大于1个单元格中的标准误差丢弃任何寡核武器(有关更多详细信息,请参见上面的部分数据预处理) 。玛利诺人对(填充)前进和反向补体序列的预测平均为单个预测。   用模拟退火(最小化能量)指导序列设计的目标函数是目标细胞类型中的MINGAP(Malinois Log2 [FC]预测减去最大脱靶细胞类型Log2 [FC]预测)。与算法快速SEQPROP和ADALEAD(分别最小化或最大化)一起使用的目标函数是Bent-Mingap,定义如下 。令y+为目标细胞类型上的Malinois log2 [FC]预测 ,y- y-在给定序列的非目标细胞类型上的log2 [fc]预测(因此mingap = y+ - y-) 。我们构建了一个弯曲函数g(x)= x-e-x+1以进行预处理预测,以使目标函数变为弯曲 - mingap = g(y+) - g(y-)。我们将g(x)应用于预测,以激励脱靶细胞类型中具有低表达的更大mingap。对于三种生成算法 ,为了防止在序列上与训练数据高度分歧时,在深度学习方法中常见的病理极端活性预测,我们将预测限制为有限的间隔(默认值:[-2 ,6])时,当生成序列时 。   快速SEQPROP5被选为一种基于代表性的基于梯度的局部优化方法,该方法利用深度学习模型的结构进行贪婪搜索 ,同时保留将真实的一式壁炉编码输入传递给模型的能力。我们按照先前的工作实现了该算法 ,但是我们删除了实例归一化层中可学习的仿射变换,并从每个优化步骤中的分类核苷酸概率分布中绘制了许多单热编码样品,以更加自信地估计可学习的输入序列的可学习的梯度。输入参数是随机初始初始化的(从正常分布中绘制) ,并使用ADAM优化算法的Pytorch实现,学习率为0.5,以及余弦退火调度程序 ,其最低学习率在300培训步骤中为10-6 。在每个训练步骤中,损耗函数值是从该步骤中从分类核苷酸概率分布中得出的20个序列样品的负平均弯曲膜。一旦优化完成,将实例归一化应用于学习的输入 ,并从获得的分布中采样20个序列,除非值小于3.6,否则收集具有最高预测弯曲的弯曲的序列。   Adalead6是另一种贪婪的搜索算法 ,被选为具有代表性的进化优化算法,以易于实现,并在DNA序列优化中获得了成功 。我们按照与原始论文相关的GitHub存储库中编写的该算法实现了该算法。在每次运行中 ,使用bent-mingap作为健身(客观)函数 ,使用MU = 1,recomb_rate = 0.1,阈值= 0.25 ,rho = 2优化了20个随机初始化的序列。一旦最终确定了优化,除非MINGAP小于2,否则仅收集具有最高预测的弯曲键的序列 。我们选择每次运行仅收集一个序列 ,以最大程度地利用从所有运行中收集的全局批次中的多样性。   基于数十年来成功应用到广泛的域进行非convex优化的数十年历史的历史,选择了模拟的退火7作为代表性的概率优化算法。模拟退火从具有不同局部优势的区域之间的跳跃开始,偶尔接受在算法早期采样温度较高时会恶化目标的建议 。在后来的阶段 ,算法转向贪婪的山坡攀爬,因为低采样温度仅允许提高可接受目标的建议 。我们基于Markov Chain Monte Carlo模拟的大都市 - 主持算法实施了模拟退火。通过突变三个随机碱基,在每个步骤中对称生成建议。我们使用负MINGAP(不弯曲)来模拟理论系统的能量景观 。在优化期间 ,使用单调降低的功能降低了温度项,而无限总和:   为了产生具有高目标特异性活性的序列,我们使用负MINGAP(无弯曲)来模拟系统的能量。   为了设计一批序列 ,以惩罚批次中给定基序的富集 ,我们介绍了损失函数的附加术语。为了惩罚长度L的单个基序,我们构建基序位置 - 重量矩阵(PWM;也称为特定位置的评分矩阵或对数概率),并使用它来为批处理中的所有可能的子序列xj评分 。令SJ = PWM(XJ)为子序列XJ ,n批次中的序列数和T分数阈值的基序得分。然后,我们将主题罚款定义为   j在所有可能的子序列中迭代,包括其反向补充。换句话说 ,我们将所有主题得分总和超过得分阈值,然后除以批次的大小 。当惩罚m主题时,我们引入的术语非常接近平均图案惩罚 ,只是我们引入了每个主题惩罚的加权因素,以强调针对较低指数的主题的惩罚(或者在下面的情况下,以根据将其包含在主题池的命令中优先级为优先级)。如果我们让sj(i)= pwm(i)(xj)是子序列XJ的图案I的主题评分 ,而t(i)t(i)主题的得分阈值,则鉴于主题池的总额度{pwm(1),... ,pwm(m)}被定义为   其中术语(m -i+1)1/3是加权因子增加索引i的基序惩罚的值。   我们将这种基序表达式用于迭代设计序列 ,但要受到越来越多的基序 。我们称这些迭代惩罚轨道。单个惩罚轨道从生成一批500(非含量)序列开始,然后通过python包装函数分析了基元富集(长度为8至15的前10个基序(长度为8至15的前10个基序))。我们从分析和设计第二批250个序列(我们称之为回合1个惩罚序列)中收集顶部基序PWM(1),从而惩罚池池{pwm(1)} 。然后 ,我们提取富含回合1个惩罚序列的顶部基序PWM(2),并设计了第三批250个序列(圆2刑罚序列)惩罚基库池{pwm(1),pwm(2)} 。我们继续此过程 ,直到我们生成250个圆形罚款序列,惩罚图案池{PWM(1),PWM(2) ,...,PWM(5)}。   我们为所有三种单元格类型生成了每个目标细胞类型的四个惩罚轨道。我们将每个图案的得分阈值定义为其共识序列的基序得分的百分比 。使用的百分比为K562目标序列为0,HEPG2和SK-N-SH-taget序列为0.25。K562细胞不同选择背后的原因是 ,我们发现优化过程可以通过使用基序的次优实例来更容易地避免GATA的惩罚,因此我们对我们有更严格的惩罚。使用加权因子的动机是,我们假设序列设计优化更加强烈地吸引了在早期惩罚回合的富集分析中捕获的主题 ,因此我们希望继续强调从早期提取的基序的惩罚 。   在补充注释2中 ,通过将所有通过PATSER得分阈值的主题匹配分数(如在Biopython83中定义),然后除以最大可能的基序得分(基序共享序列的匹配分数)来计算每个序列中基序的基序得分(y轴)。   我们计算了CODA MPRA库中序列以及其他各种参考序列的序列的4-mer和7-mer含量,包括200-MERS上游的Refgene注释转录起始站点 ,洗牌的CODA序列和随机200-Mers。我们通过基于设计方法,目标细胞系和惩罚水平将序列分成组,并使用Scikit-Learn(v.1.2.2)将曼哈顿与K-Nearest邻居距离的平均距离(K = 4)计算为200-mers的距离(K = 4) 。我们使用UMAP-Learn(V.0.5.2)Python软件包实现的统一歧管近似和投影将基于4-mer含量的二维空间嵌入二维空间。   我们使用NCBI Elasticblast进行了同源搜索 ,以确定合成序列是否与核苷酸收集中的任何序列具有可测量的同源性。我们使用了BLASTN算法,DC-Megablast任务和单词大小为11,并维护所有其他设置的默认值 。   为了使用从编码中统一处理的数据集进行跨实验方法广泛复制的CRE ,我们首先从三个细胞系(K562,HEPG2和SK-N-SH)中选择了DNase峰。为了进一步选择活性CRE,我们将与来自同一细胞类型的H3K27AC峰相交的DHS峰取代。对于每种细胞类型 ,我们通过要求DHS+ H3K27AC+峰在其他两种细胞类型中识别出细胞类型特异性峰 。对于这些DHS-H3K27AC峰,在每种细胞类型中,我们在目标细胞类型的峰坐标中对K562 ,HEPG2和SK-N-SH DHS信号进行了评分 。然后 ,我们选择了前4,000个峰,其靶标单元类型的DHS信号与最大靶向单元格细胞类型的DHS信号的比率最高,这反映了我们与其他CRE一起使用Log2-space MPRA活动最大化的努力。   为了通过Malinois提名细胞类型的自然序列 ,我们使用50 bp的步幅将整个人类基因组铺成200 bp窗口,并为每个窗口序列产生预测。通过评估上述目标函数(BENT-MINGAP)获得每个序列的细胞类型特异性,并为每种细胞类型选择了前4,000个表现最好的序列 。   与DHS-Natural相比 ,玛利诺 - 天然序列捕获了基因组的独特成分,在我们的DHS-Natural集合中重叠的Malinois-Natural序列有2.7%,而在任何先前注释的CRES之外 ,有65.8%的序列。从编码屏幕Portal12中下载了用于启动子序列,类似增强器的近端增强子序列,类似增强器的远端增强子样序列和仅CTCF的CCRE床文件 ,并使用自定义脚本将与DHS-Natural和Malinois-Natal床文件相交,以与DHS-Natural和Malinois-Natal床文件相交。使用BedTools(V.2.30.0)84和PybedTools(V.0.9.0)85进行十字路口,并带有以下命令“ Malinois/dhs-natural_bed.Intersect(concode_ccre_bed ,wa = true ,u = true,u = true,u = true)”和交叉点 。为了确定重叠的DHS-Natural和Malinois-Natural序列的基因组特征 ,将同一床文件用作来自Homer Suite(v.4.11)86的AnnotatePeaks.pl的输入,并带有以下命令'annotatePeaks.pl'andotatePeaks.pl输入hg38-annstats annstats annstats annstats annstats.txt> annotatepeakspeaksout.txt’。通过使用BedTools MakeWindows命令将基因组分为200 BP间隔来生成整个基因组(HG38)的注释(HG38)。为每种细胞类型(K562,HEPG2 ,SK-N-SH)和序列选择方法(DHS-Natural,Malinois-Natural)生​​成注释 。   我们使用输入归因方法集成梯度58计算了拟议文库中每个序列的核苷酸贡献得分。采样的集成梯度(SIG)考虑了从背景分布到分布的分布,几乎可以肯定的是 ,从背景分布到分布的对数概要空间中的预期梯度几乎可以肯定。在线性路径的每个点中,序列概率分布(也称为位置概率矩阵(PPM))是通过沿核苷酸轴施加SoftMax函数来从对数概率空间参数中获得的,并从该分布中采样了一批序列 ,以将其取出 。然后,我们利用直线估计器通过采样操作来反向propagate来计算对数概率空间中参数的批次预测的梯度。将路径中的每个点平均批处理梯度,并像该方法的原始公式一样近似梯度积分。在我们的情况下 ,从感兴趣的输入中的基线输入的减法涉及对数概率空间中的参数 。这种集成梯度的适应提供了两个有用的功能 。首先 ,将被馈送到模型的序列输入始终以一式式形式形式,避免了对模型被训练的单纯形顶点的输入评估,从而更容易地导致病理预测。其次 ,原始方法依赖于选择适当的单基线输入来比较感兴趣的输入,这可能并不总是很简单,而我们的改编将序列的背景分布作为基线。有利地 ,当选择统一背景(0.25、0.25 、0.25、0.25)时,对数概率空间中的参数遍历了线路路径的遍历将成为零矩阵, 这消除了从感兴趣的输入中减去基线的需求 。然后 ,我们可以更轻松地在所有位置中为所有令牌提取集成梯度(通过省略单热输入掩盖梯度),我们发现这是TF-Modisco的假设分数。   为了测试用SIG获得的贡献分数的值,我们使用贡献块(定义为下面定义)对库序列进行了一项在库序列中进行的硅化消融研究 ,以随机化序列的片段。该研究的目的是研究对应于正面或负贡献块或外部块外部位置的序列中随机位置的预测log2 [fc]效应 。该研究的结果总结在补充注释4中。总的来说,与负有贡献相关的序列的随机分布导致靶标或脱靶细胞类型的预测活性增加,而与正面贡献相关的序列则完全破坏了目标细胞类型的活性 ,并且在不抑制了(已经抑制了(已经抑制过)的(已经抑制了(已经抑制)非含量的)活性。为了在任何给定的序列中呼叫贡献块 ,我们采用了200个贡献分数,并使用一维高斯滤波器(scipy.ndimage.gaussian_filter1d)建立了平滑的贡献信号,SIGMA为1.15 。每当4个连续位置的平滑信号高于0.015的阈值时 ,我们就定义了一个正贡献块,而对于4个连续位置或更多位置,每当它低于0.015时 ,则为负。外部位置是未分配给贡献块的职位。对于每个目标单元格类型组(25,000个序列),为所有三个预测任务执行了贡献块调用和消融 。例如,以K562目标序列为例 ,进行了三个不同的消融和调用集:(1)使用K562细胞中评估K562活性效果(目标细胞类型)的K562单元中的贡献分数进行块调用;(2)使用HEPG2细胞中的贡献分数进行块调用,以评估HEPG2活性效果(靶向细胞类型);(3)和使用SK-N-SH细胞中的贡献分数进行封锁调用,评估SK-N-SH活动效果(脱靶细胞类型)。这导致了总共九组呼叫和消融。在评估干扰外部贡献块的位置的效果时 ,我们将外部覆盖范围(不在块中的位置数量)进行了采样,以将正面和负贡献块的覆盖范围分布的上半部分匹配,并尽可能地将其匹配 。例如 ,对于SK-N-SH-TARGET组 ,这种分配匹配是不可能的,因为在全球范围内,可用的样品总数不够大 。对于K562和HEPG2细胞中消融的靶细胞类型 ,目标细胞类型也是如此,这可能是可以预期的,因为仅积极贡献块具有较大的覆盖范围。我们执行了此外部采样 ,以在各个类别之间具有可比的消融大小,也是因为破坏了覆盖范围较低的外部块外部位置(导致很高的外部覆盖范围)会在大多数序列中断时将太多的噪声引入序列中。我们设定了至少五个位置,以被外部覆盖范围破坏 。   螺旋桨点图(图2E(顶行))是我们自己设备的二维图方案 ,旨在阐明三维点的跨维度不均匀性。在此坐标系中,一个点距原点的径向距离对应于最大值和最小值之间的差。它与最大值相对应的轴的异常角度量化了最小值和最大值范围内中值的位置 。也就是说,角度与两个差异之间的比例成正比:(1)中值和最小值的差异;(2)最大值和最小值的差。该比例代表与对应于中位数相对应的最大值的轴偏离轴的60°角部分。较高的偏斜角(最大为60°)表明中位值更接近最大值 ,而较低角度(最小值为0°)的偏差表示中位值更接近最小值 。   这也可以根据mingap(最大 - 中值)和maxgap(最小值 - 最小值)来配制。在我们的坐标系中,最大值对应于径向距离。差异(1- mingap/maxGap)对应于60°角的分数,偏离与中位数相对应的最大值相对应的轴 。mingap:maxgap比率控制一个点朝着主轴引起了多少距离 ,并远离轴之间的区域。比率为0表示MINGAP为零 ,因此中值等于最大值,因此该点将完全在两个轴之间。如果比率为1,则意味着中值和最小值相等 ,因此,该点将完全落在与最大值相对应的轴上 。请注意,对于这种观点 ,可以与目标和脱靶细胞类型活动一起使用,我们假设最大的细胞类型活动是预期的目标细胞类型 。这意味着,当计算通过图2E中特异性阈值的序列时 ,某些序列将其目标细胞类型重新分配至细胞类型的最大活性,而DHS-Natural序列是从重新分配中受益最大的组。总共652个序列通过使其目标细胞类型重新分配到MaxGap> 1和Mingap/MaxGap> 0.5的宽大特异性阈值(DHS-Natural,565; Malinois-Natural ,39; Adalead,39; Adalead,39; Adalead ,12; 12; 12; 12;模拟退化 ,5; fast Seqprop,0; fast Seqprop,0; fast fast fast; fast fast seq par diral dials dials dials dials dials dials dials dials diars seq prop ,4)。但是,只有16个序列通过使其目标细胞类型重新分配的MaxGap> 4和Mingap/MaxGap> 0.5的严格特异性阈值(DHS-Natural,15; Malinois-Natural ,0; Adalead,1; Adalead,1;模拟退火 ,0; 0; fast Seqprop,0; fast Seqprop,0; fast fast seq prop punitied seq seq seq seq seq seq seq seq seq seq seq seq seq seq seq seq seq seq seq seq seq seq seq seq seq seq seq sequpiended himed ,0),0) 。   作为坐标计算的一个示例,以(5 ,3 ,1)为例。该点的径向距离为5-1 = 4,并且与(3-1)/(5-1)/(5-1)×(60°)= 30°的第一维轴的偏斜角(沿第二维轴的方向)。就mingap:最大比率而言,从第一维的轴(最大值的维度)朝向第二维轴的偏斜角将为(1 - (5-3)/(5-1))(60°))(60°)= 30° 。观察表格(x+4 ,x+2,x)的所有点,对于x的任何实际值 ,将具有与点相同的坐标(5,3,1)。   螺旋桨计数图(图2E(底行))显示了螺旋桨点图每个给定区域中落下的点的百分比。蓝绿色 ,黄色和红色区域捕获序列,其中中值比最小值更接近最小值 。蓝绿色,黄色和红色区域代表mingap:最大值比大于0.5的序列。   将图2E中的两个合成基团随机取采样 ,每个序列恰好具有12,000个序列,并避免与两个天然基团的图相比避免过度绘制。补充图9显示了通过设计方法分解的完整螺旋桨图 。   从图中省略了任何细胞类型中具有重复log2 [FC]标准误差大于1的标准误差。   我们使用TF-Modisco Lite 59,60来提取序列基序,以通过通过SIG获得的贡献分数预测麦芽菌的功能。如上所述 ,SIG自然提供假设的贡献得分(由TF-Modisco定义)在选择统一的随机背景时 ,只需简单地执行使用输入序列单热矩阵而进行整体过程减去掩盖的等效范围 。然后,可以根据TF-Modisco的要求,使用输入序列单速矩阵掩盖最终贡献分数 。我们计算了三个预测任务中的每个任务中的每一个的假设贡献分数 ,并以100,000个seqlet和200个窗口大小为tf-modisco lite(使用1,000,000个seqlets获得了同等的结果)。我们使用Modiscolite.Aggregator.similarpatternscollapser汇总了预测任务跨预测任务的模式。TF-Modisco Lite结果作为正模式和负模式 。   为了将生活在假设归因得分空间中的TF-Modisco正面模式转换为PWM,我们将模式得分除以最大位置得分总和,而乘以10。为了获得PPM ,我们将SoftMax函数应用于每个位置向量。我们的某些TF-Modisco负面模式是负面模式(负贡献)和积极贡献(积极贡献)的组合 。因此,为了将TF-Modisco负模式转换为PWM,我们首先逆转了负部分的标志方向性(如居住在贡献得分空间中的模式得分 ,而不是假设的模式得分所告知),并通过乘以1.2来补偿其幅度(因为我们的负分数在幅度上是较小的,这可能是由于培训数据的较小的 ,而培训数据的分布可能会较小。然后,我们继续进行积极模式。   由于TF-Modisco除了捕获孤立的未模拟基序外,还能够捕获具有基序组合的模式 ,我们启发了启发的核心未驱动图案 ,这些模式在不同程度上占了所有在TF-Modisco合并结果中观察到的组合 。为了手动定义核心图案的起点和停止,我们依靠使用TomTom87,信息内容轮廓和视觉检查对自己进行全图模式PWM。核心图案ID源自从中提取的原始模式的ID。为了将模式转换为PWM和PPM ,我们应用了与上述相同的操作 。使用TOMTOM与数据库Jaspar Core(2022)61和Hocomoco Human(V11 Full)62分配了与人类已知的TF结合基序的匹配。   除了用TF-Modisco提取序列基序外,我们还使用Streme进行了基元富集分析。首先,要评估通过贡献分数衡量的给定曲线基序与其预测的功能之间的一致性 ,我们对对应于所有序列段的假设贡献分数进行了加权平衡,这些序列被确定为与主题匹配的所有序列段(通过FIMO与默认参数相匹配,使用默认参数 ,使用主题的评分,并比较了一定的评分(一组),并比较了一项任务a 。信息包含矩阵 。我们将加权平均假设分数称为贡献得分投影。TF-Modisco已经捕获了与他们的贡献得分投影有着强烈一致的所有积极贡献分数的所有图案 ,这表明TF-Modisco的正面模式结果非常全面。但是,我们发现少数具有负贡献分数的Streme序列与他们的贡献得分投影有很强的一致性,因此我们决定将它们纳入核心主题列表 。请注意 ,这些基序的贡献得分为中等幅度。我们推测 ,TF-Modisco可能无法检测到它们的原因是因为在Seqlets中分配的贡献通常与这些基序相对应的贡献经常低于负分数分布的阈值,因此很难将它们与噪声或微不足道的分数区分开。使用100万个seqlet运行TF-Modisco并没有改变结果 。我们检索了11个具有很强一致性的这种曲线基序,其贡献得分投影未被TF-Modisco捕获 ,其中9个被聚集在一起,分为3组,几乎相同的贡献得分投影(在左或右最高1或2个位置)。这为我们提供了贡献得分投影形式的五种曲线负模式 ,这些模式包含在核心基序列表中。它们转换为PWM和PPM表格遵循与TF-Modisco模式相同的过程 。使用TOMTOM与数据库Jaspar Core(2022)61和Hocomoco Human(V11 Full)62分配了与人类已知的TF结合基序的匹配。   为了找到CODA序列文库中存在的核心基序的实例,我们利用序列的假设贡献得分将序列段与假设构成得分形式的核心基序匹配。首先,我们在所有序列的假设贡献得分中填充了零 ,从而产生了3×75,000×4×210的尺寸的矩阵 。其次,对于长度为l的核心图案,我们计算了所有Pearson相关系数在每个可能的分子序列贡献之间的pearson相关系数和长度的贡献量(均可构图)构图755,000×45,000×45,000×45,000×45,000×45,000×45,000 ryt scorifition cormitif。在正向和反向补体方向上得分。对于每个细胞类型维度 ,我们随机采样500,000个皮尔逊相关系数(由单个核心基序引起)以获得值min(0.75,μ+4σ),以用作系数阈值 ,其中μ和σ分别代表均值分布的平均值和s.d. 。假设贡献得分在其系数阈值以上的所有子序列都作为给定核心基序的基序 。我们为所有细胞类型的所有核心基序重复了此过程。   我们将单个基序嵌入随机序列中 ,以测量其独立预测的效果与完全随机序列相比。对于每个图案,我们在中间和随机背景([0.25,0.25 ,0.25,0.25])构建了一个由图案的PPM组成的200×4 ppm 。我们从中取样了5,000个序列,并将其喂入麦芽菌 ,以在每种细胞类型中获得预测。我们还从各地的200×4 ppm的均匀背景(中间没有基序)中抽样了5,000个序列,并将其送到玛尔诺伊人作为基线。   我们试图评估破坏序列库中所有单个图案的所有实例的预测效果 。对于每个基序,我们收集了至少具有此类基序的一个实例的特定序列 ,用随机段(从均匀的背景采样)代替了所有实例,并将其喂入Malinois,以在每种单元格类型中获得预测。我们进行了五次 ,平均每个中断序列的五个预测,并从批处理的原始预测活动中减去以获得预测的破坏效果。例如,说一个序列在20-32的位置中具有给定基序的一个实例 。我们在这些位置插入了一个随机序列段 ,并得到了序列中断的预测。我们进行了五次 ,因此在20-32位置在位置上有五个不同的随机段(具有五个不同的预测),并平均五个预测(以轻度地将随机段替换的潜在影响边缘化)。干扰效果将是该平均预测减去序列的原始预测活动 。我们汇总了图案存在的破坏效果(如本节中的基础惩罚的最后一段中所定义的)。为了找到核心基序的实例,我们使用了上述基于贡献的基础基序扫描。为了找到原始的TF-Modisco模式的实例 ,我们使用了FIMO(带有默认参数),因为我们的基于贡献分数的主题扫描可能无法处理间隙模式以及FIMO 。将模式PPM提交给FIMO时,我们将两端的模式修剪为模式 ,以使模式的开始/停止是至少具有0.15位的信息内容的第一个/最后一个位置 。   为了获得主题的总体贡献,我们在三个预测任务中通过主题命中方法提供的所有图案实例中包含的贡献得分总和的加权平均值。使用与上述皮尔逊相关系数相对应的基序得分对平均值进行加权。基序(激活器或阻遏物)的总体调节方向性是由跨细胞类型的加权平均值的平均值给出的 。对于所有图案,总体监管方向性与原始TF-Modisco指定是正面或负模式的一致。   我们说 ,每当一个序列至少一个每个基序的实例时,一对基景会同时发生。根据基序对的共发生百分比,我们的意思是在给定基序对共发生的给定组中的序列百分比 。   我们使用NMF(基于零件的data74表示)来模拟序列库中基序之间的语义关系(Scikit-Learn V.1.2.2 ,用NNDSVDAR,Frobenius损失初始化)。首先,我们在每个序列中对基础匹配进行计数与基于贡献分数的基线扫描为88所述 ,其中行表示库中的序列 ,列中的序列对应于基序。然后可以将样品矩阵X分解为系数和特征矩阵 。这些k维表示在自然语言处理中被称为“主题 ”和基因表达分析中的“程序” 89,90。这些程序捕获了在语义上相似的CRE中出现的TF基序的频率,并且CRE本身被建模为程序的组成。我们使用Bi-cross-validation91测试了将序列分解为k [8,28]程序,并在k = 12时鉴定了重建误差中的“肘”(数据未显示) 。在绘制系数矩阵比较分析时 ,我们将系数矩阵标准化,使得总和为1。我们使用特征矩阵中的Motif权重来计算每个程序的加权平均值(请参阅上面的“基序贡献 ”部分)来量化每个分解程序的功能(请参阅上面的“基序贡献”部分)。将图案贡献剪辑至3上限,以减轻极端异常值的影响 。   图4G中序列的饱和诱变研究(补充表10)包括凭经验测试序列的所有可能600种变体的活性(每个位置3个变体 ,200个位置) 。我们遵循与此饱和诱变库中SK-N-SH细胞中先前MPRA的相同方案。我们将每个变体的效果可视化为每个变体序列活性的原始序列活性的减法,从而导致图4H中的棒棒糖。平均变体效应在徽标序列字母的高度中表示,但在相反的方向上表示 。   CODA MPRA库是根据先前描述的协议8构建的。简而言之 ,将寡核酸合成为230 bp序列,其中含有200 bp的基因组序列和两端的15 bp的适配器序列。用引物MPRA_V3_F和MPRA_V3_20I_R放大了Oligo库,以添加独特的20 bp barcodes以及吉布森汇编的手臂中的骨架矢量 。将寡核苷酸库组装到PMPRAV3:∆luc:∆xbaI(addgene质粒 ,109035)中,并通过电穿孔扩展到大肠杆菌中。在十种扩展的培养物中,有7种使用Qiagen质粒加MIDI套件纯化 ,以达到每个寡核苷酸的200-300个菌落形成单元(条形码)。使用2×150 bp的化学方法在Illumina Novaseq系统上对扩展的质粒文库进行了测序 ,以获取寡核-barcode配对 。图书馆接受了ASISI限制消化和GFP,并使用Primers MpRA_V3_GFP_FP_FUSION_F和MPRA_V3_GFP_FP_FPOP_FUSION_R插入了200 blbly的序列,从而使gibson的序列插入了200 bp ,从而使gibss的序列插入了200 bp,从而在gpprav3:minp-gfp:minp-gfp(Addgene质粒,109036)中放大了最小的启动子GFP。启动子和20 bp条形码落入GFP的3'UTR中。最后 ,图书馆在大肠杆菌中扩展,并使用Qiagen质粒加Giga套件进行纯化 。   所有细胞培养和转染条件遵循先前建立的方案27。对于三种细胞类型,即K562 ,SK-N-SH和HEPG2,我们使用霓虹灯转染系统100μl试剂盒收集了200万个细胞进行转染,该试剂盒具有5μg或10μg的MPRA库 ,每1000万个细胞。转染后24小时收集细胞,用PBS冲洗并通过离心收集 。在添加RLT缓冲液(RNeasy Maxi套件),二硫代醇和均质化后 ,将细胞颗粒在-80°C下冷冻直至进一步加工 。对于每种细胞类型 ,在不同的日子进行了三个生物学重复。所有细胞系都是从ATCC中获取的,使用基因分型和基因表达特征进行了认证,并经常测试了杰克逊实验室的分子诊断实验室对支原体和其他常见污染物进行测试。   使用Qiagen rneasy Maxi试剂盒从冷冻细胞匀浆中提取RNA 。DNase处理后 ,使用三种GFP特异性生物素化引物的混合物使用Sera mag珠(Thermo Fisher Scientific)捕获GFP转录本。在第二轮DNase处理后,使用Superscript III(Life Technologies)合成cDNA,并使用定量PCR(QPCR)对GFP mRNA丰度进行定量 ,以确定每种复制开始线性扩增的循环。根据QPCR结果将复制稀释至大致相同的浓度,并使用引物的第一轮PCR(8或9个周期)MPRA_ILLUMINA_GFP_F_V2和ILMN_P5_1STPCR_V2用于扩增与GFP MRNA序列相关的与GFP mRNA序列相关的Barcodes 。第二轮PCR(6个周期)用于在重复方面添加Illumina测序适配器。使用1×20 bp化学,在Illumina Novaseq系统上测序了所得的Illumina索引MPRA条形码库。   为了模拟硅中的表观遗传和基因表达特征 ,我们从小鼠参考基因组(MM10)的11:3101137–3493091中收集了核苷酸序列(MM10) 。使用lacz:p2a:gfp开放阅读框的H11靶向向量的预期插入序列。作为对照,将预期的CRE插入位点模拟为N。我们模拟了所有可能的CRE插入,与我们的库中的200个Mers替换寡核-N序列 ,模拟了与我们的细胞类型特异性MPRA相对应的所有可能的CRE插入 。我们通过修改在线上可用的笔记本(https://colab.research.google.com/github/github/deepmind/deepmind/deepmind/deepmind_research/blob/blob/master/master/master/enformer/enformer/enformer/enformer-usage.ipynb),使用Enformer推断了所有这些序列的表观遗传签名。为了估计各种组织中CRE诱导的转录激活,我们收集了128个核苷酸分辨率DHS ,H3K27AC ,ATAC和CAGE数据集重叠了预期的插入(35个箱)。为了计算每个组织的骨料效应,我们计算了插入时每个特征的最大信号,然后计算出特定于特异性的Yeo-Johnson功率转换 。然后根据组织对应关系(补充表8)选择归一化特征 ,并平均估计十个不同组织中的CRE活性 。我们使用每个CRE的这十个测量值计算了脾脏,肝脏和大脑的MINGAP值。   根据经验MPRA测量,贡献评分 ,基序匹配,序列含量和预测的表观遗传特征的审查,优先考虑序列。我们寻找的序列在目标的MPRA测量和脱靶细胞类型之间显示出很高的分离 。我们还希望捕获基匹配匹配的组合的变化 ,并使用贡献分数在视觉上检查基序匹配和其他潜在的重要序列内容和基序组织。最后,我们在预测的表观遗传学特异性中选择了至少中等组织特异性的序列。   为了构建合成的CRE EGFP报告基因,IDT(Geneblock)合成了与合成CRES相对应的双链寡核苷酸(200 bp) 。通过PCR和引物在包括质粒矢量E1B-GFP-TOL2(addgene质粒 ,37845)75的PCR上放大合成CRE,并在最小启动子(E1B)的上游克隆,以生成合成器EGFP质粒egfp-ettenter-egfp ptol2-syntenter-ptol2-syntentem-ptol2-synnticef)HIFI DNA组装根据制造商的说明(新英格兰Biolabs)。我们还创建了“空矢量” ,除了缺少200 bp插入物外 ,它们与尾声媒介相同。通过Sanger测序验证报告基因质粒序列 。为了瞬时表达斑马鱼中的合成CRE报道器,根据既定方法92,将质粒与TOL2转座酶mRNA共同注射到一个单细胞阶段的斑马鱼胚胎中。每个构建体注射至少15个性别的单细胞斑马鱼胚胎。使用解剖(Olympus)或共聚焦荧光(Leica sp8)显微镜在指定的天(施肥后2或4天)成像注射的胚胎 。注射的胚胎不是随机的 ,研究人员也没有蒙蔽。所有斑马鱼程序均由耶鲁大学机构动物护理委员会(2022-20274)批准。   使用lacz:p2a:GFP开放阅读框的H11靶向载体使用包含2 ng模板,1μL的KOD Xtreme Hot start DNA聚合酶(Sigma-Aldrich,71975) ,25μL25μL的Xtreme Buffer和0.5μm前进和反向Privers Primers(H11__BXB_BXB_BXB_BXB_BXB_BXB,pgl_minp_gfp_r;补充表11)循环以下条件:94°C持续2分钟;98°C的20个循环持续10 s,56°C 30 s和68°C持续13分钟;然后68°C持续5分钟 。用0.5μl的DPNI(NEB ,R0176S)在37°C下处理30分钟,使用1×体积的Ampure XP(Beckman Coulter,A63881)处理30分钟 ,并用水洗脱 。通过IDT(geneblock)合成与吉布森臂合成增强剂相对应的双链寡核苷酸,并使用5μl5μL烟雾hifi hifi hifi hifi hifi hifi hafsasbly主混合(neb,e2621s) ,36 ng for vector and 10 ng forsy of Syns of Syns of Syns of Synse of Syness of Syness of Syness of Syness commimim Mix(NEB ,E2621s),将其组装到靶向载体中。50°C。转基因小鼠是根据Ensert协议创建的76 。20ngμl -1 cas9蛋白(IDT,1074181)的混合物 ,50ngμl -1单导导RNA(SGRNA_H11LACZ;补充表11),25ngμl -1供体质粒,10 mm Tris ,Tris,pH 7.5,pH 7.5 ,pH 7.5和0.1 mm EDTA被置入proneceed fbv Zycy fbv。每组以3 L的预定样本量进行测试,并且所有样品的基因型和性别如何,对所有样品进行了染色。收集胚胎并相对于其基因型盲目染色 。在胚胎第14.5天的整个胚胎或出生后5周分离的大脑在4°C下固定在补充2%多聚甲醛 ,0.2%戊二醛和0.2%igepal ca-630的PBS中。用PBS洗涤后,将胚胎在37°C的PBS中染色过夜,并在PBS中补充了0.5 mg ml-1 X-gal(Sigma-Aldrich ,B4252) ,5 mM Hexacyanoferrate(hexacyanoferrate()三水合物,5毫米钾含硫酸钾,六酰胺甲甲苯甲甲苯; 2 mM MGCL2和0.2%igepal CA-630。使用用于胚胎的Leica M165系统或用于大脑的Leica M125系统拍摄 。所有小鼠均固定在包含五只或更少小鼠的复制笔中 ,在18-23°C的12 h – 12 h浅色周期下,湿度为40–60%。所有小鼠程序均根据《美国国家卫生研究院指南》的实验动物指南进行,并得到杰克逊实验室的机构动物护理和使用委员会的批准(18038)。   LACZ染色后 ,将小鼠大脑用振动型(Leica VT100s)切片,并在冰冷的PBS中收集了自由浮动的70 µm厚的矢状切片 。然后将切片在1×PBS中冲洗5分钟,并在由0.3%Triton X-100组成的封闭溶液中孵育30分钟 ,在小鼠阻滞剂上(矢量实验室,MKB-2213-1),10%正常山羊血清(ABCAM ,ABCAM,AB7481)和5%BSA的温度搅拌,在1×ppbs的温度下 ,在小鼠阻断试剂上(MKB-2213-1)上孵育30分钟。然后 ,用振动筛上的4°C的封闭溶液中的原代抗体混合在隔夜的封闭溶液中进行免疫染色。将切片在1×PBS中冲洗3次,每次5分钟,然后与相应的荧光偶联二抗孵育2小时 。用继发抗体处理后 ,将切片用PBS进一步冲洗三次,然后用DAPI染色(Thermo Fisher Scientific,62248) 。将切片安装在用延长的金抗剂试剂(细胞信号技术 ,9071)上安装到载玻片上。在染色过程中使用以下主要抗体:小鼠抗Neun(ABCAM,AB104224),鸡肉抗GFAP(Origene Technologies ,TA309150),兔抗IBA1(ABCAM,ABCAM ,AB178846)。Secondary antibodies used were as follows: goat anti-mouse Alexa Fluor 488 (Thermo Fisher Scientific, AB_ 2534069), goat anti-chicken Alexa Fluor 568 (Thermo Fisher Scientific, AB_ 2534098), goat anti-rabbit Alexa Fluor 568 (Abcam, ab175471).所有初级和二级抗体均以1:500稀释液使用 。使用Thunder Imager(Leica Microsystems)系统使用×10/0.8 Na Dry透镜进行全脑矢状切片镶嵌图像的图像采集。将荧光成像与明亮的现场成像结合使用,以可视化LACZ染色。系统地应用计算组织清除以减少背景噪声(Leica获取软件) 。获得镶嵌扫描后,感兴趣区域的更高磁化图像(ROI) 在配备有二极管 ,AR气体和HE/NE可调波长激光器的Stellaris 8(Leica Microsystems)上获取 ,分别使用×40/1.2 Na和×63/1.4 NA机油目标进行定量和代表性图像。针孔的大小设置为1 A.U.并用405、488 、561和633 nm激光依次将样品照亮。使用633 nm laser93,使用共平均3摄氏度,使用平均线平均为3的HYD探测器 ,使用共焦lacz染色可视化六微米Z-stack图像,使用平均线3的HYD探测器,使用平均线3的HYD探测器可视化荧光LACZ染色 。对于显示的代表性图像 ,使用默认的2像素半径和20个阈值删除了明亮的离群值。然后以1个sigma半径为1施加高斯模糊。   使用斐济软件(NIH)中的默认算法,获得的马赛克明亮场图像进行了自动阈值 。使用从浅表皮层绘制的ROI到Callosum的ROI,实现了LACZ信号强度的定量。从艾伦脑图集获得了皮层的深度信息。在不同的皮质区域采用多个ROI ,以验证信号的分布 。代表性图像是从体感和视觉皮层中获取的ROI 。为了进行细胞量化和重叠分析,为了量化细胞种群,使用斐济软件 ,进行了用共聚焦显微镜获取的图像的最大强度投影,并使用50的滚动球radius施加背景。在ROI中,信号与噪声比均匀 ,单个阈值算法产生了可再现的结果。然后使用分析粒子函数对细胞进行定量 。通过改变粒径 ,可以实现神经元,星形胶质细胞和小胶质细胞的准确定量。为了计算LACZ表达与细胞类型特异性标记之间的重叠,将每个二进制的LACZ图像与相应的二元神经元 ,星形胶质细胞和小胶质细胞ROI乘,并使用分析粒子函数对残留信号进行定量。总共分析了每只小鼠的五个矢状切片,并将共有n = 3只小鼠用于对照和LACZ阳性大脑 。   在产后5周收集了CODA设计的SK-N-SH特异性CRE和空载体的转基因小鼠的三个重复。肝脏 ,脾脏和右大脑的右半被浸泡在4°C的RNA(Thermo Fisher Scientific)过夜,并在Qiazol中均匀,然后使用RNeasy Mini Kit(QIAGEN)进行总RNA隔离 ,并在柱上DNase治疗中进行。根据制造商的协议,使用NEBNEXT ULTRA II RNA库预备套件从1 µg总RNA生成RNA-Seq库,并根据制造商的协议 ,从1 µg的总RNA和Nebnext Poly(Neb)和Nebnext Poly(a)mRNA磁性隔离模块(NEB)生成 。使用具有以下条件的i7和i5引物对库进行索引:98°C 30 s;98°C的10个循环持续10 s,65°C 75 s;然后65°C持续5分钟。使用0.9倍的AMPURE XP纯化索引样品,在20 µL的EB中洗脱 ,在杰克逊实验室的Illumina Novaseq X+仪器上使用2×150 bp的化学作用进行测序。使用Star94(v.2.5.2b)将测序读数映射到具有LACZ-GFP序列的修饰小鼠基因组(GRCM38/MM10)上 。使用PICARD MAXDUPLICATES(MIT ,v.3.1.1)删除重复项后,使用farmiturecount(v.2.0.6,选项:-p -b -q 20 -t 16 -s 2 -s 2 -countreadpairs)对映射读取进行计数。使用DESEQ2(V.1.32.0)95来归一化读数并计算Log2 [FC] ,标准误差和WALD-TEST P值。   有关研究设计的更多信息可在与本文有关的自然投资组合报告摘要中获得 。

本文来自作者[admin]投稿,不代表永利号立场,如若转载,请注明出处:http://www.siyonli.com/zlan/202506-1373.html

(8)

文章推荐

  • 办理网店需要营业执照吗 开网店需要办理营业执照吗

    办理网店需要营业执照吗根据《中华人民共和国企业法人登记管理条例》和《中华人民共和国个体工商户登记管理办法》,从事网络经营需要办理营业执照。如果您要在网上开设网店进行经营活动,需要先注册公司或者个体工商户,然后向工商部门申请办理营业执照。营业执照是企业法人和个体工商户开展经营活动合法的凭证,办理营业执

    2025年04月03日
    30312
  • 爱悄然离线是什么意思 就在昨天爱悄然离线是什么歌

    爱悄然离线是什么意思意思是这份感情在慢慢的远离自己,让自己看到这些事情的时候变得非常的痛苦,不知道该如何去做,才能够将这份感情在自己的生活中更好的留下,其实在这个世界之中,每个人的心中都有自己属于对生活的一种回答,各种各样的事情让他看到了对这个世界的一种不同的方式。就在昨天爱悄然离线是什么歌1、《爱

    2025年04月07日
    55311
  • 陨石软骨的组成分类方案

      提出了针对原始软骨陨石的主要组成部分-软骨的分类方案。该方案提供了有关原始太阳星云中最初产生的各种软骨的洞察力,以及对它们对陨石父母身体的影响的影响。它也可能有助于理解软件中构图多样性的起源。

    2025年06月18日
    11308
  • 一种基于过程的方法来理解和管理触发的地震性

      人们对人类活动触发的地震性越来越关注,在这种地震中,压力的略有增加会使构造负载的断层失败。此类活动的例子包括采矿,水的蓄水,地热场的刺激,碳氢化合物和水的提取以及将水,二氧化碳和甲烷注入地下储层中。在没有足够的信息来理解和控制触发地震的过程的情况下,当局建立了基于经验监管的经验监测框架,成功2,

    2025年06月18日
    14321
  • 没有氧气效应和遗传确定的修复过程

      感谢您访问Nature.com。您使用的是浏览器版本对CSS的支持有限。获得  最佳体验,我们建议您使用更多最新的浏览器(或关闭兼容模式  InternetExplorer)。同时,为了确保继续支持,我们正在展示网站,没有样式  和JavaScript。

    2025年06月19日
    9302
  • S n疲劳曲线中的不连续性的重要性

      感谢您访问Nature.com。您使用的是浏览器版本对CSS的支持有限。获得  最佳体验,我们建议您使用更多最新的浏览器(或关闭兼容模式  InternetExplorer)。同时,为了确保继续支持,我们正在展示网站,没有样式  和JavaScript。

    2025年06月19日
    11320
  • 【肺结核疫情分类,肺结核疫情分类有哪些】

    我国肺结核疫情的特点有哪些?我国的肺结核疫情特点:高感染率,高患病率,高耐药率,死亡人数多,地区患病率差异大,中青年患病多。故本题选D。当前我国的结核病疫情特点如下。(1)高感染率年结核分枝杆菌感染率为0.72%。全国有近半的人口,约5亿,曾受到结核分枝杆菌感染,城市人群的感染率高于农村。.

    2025年06月20日
    9309
  • 东风本田xrv最新款(东风本田xrv款报价及图片)

    本田xrv和缤智的区别1、本田XRV和缤智各有千秋,具体选择需根据个人偏好和需求。以下是两者的主要区别:价格方面:缤智的2020款220TURBOCVT旗舰版官方指导价为168万元。本田XRV的2021款220TURBOCVT旗舰版官方指导价为159万元。价格上,缤智略高于本田XR

    2025年06月22日
    9301
  • 【31省新增25例确诊其中本土9例,31省新增本土确诊24例】

    31省区市新增确诊病例32例1、昨日31省区市新增确诊病例共计32例。具体情况如下:本土病例:共计28例。其中,北京新增25例,河北新增2例,辽宁新增1例。境外输入病例:共计4例。其中,广东新增3例,甘肃新增1例。此外,无新增死亡病例,新增疑似病例2例,且均为本土病例,均在北京。2、是的,国家卫健

    2025年06月22日
    10308
  • 兰州大学艺术学院怎么样/兰州大学艺术学院怎么样知乎

    音乐艺术生文化分300左右的大学年音乐艺考分数线估计在300左右。2022音乐生艺考分数线如下:(1)音乐学类(音乐学)专业统考成绩:总分不低于200分,视唱练耳单科成绩不低于00分,声乐演唱、乐器演奏和乐理单科成绩不低于30.00分。美术生文化分400左右的大学重点艺术高校(艺术类)南京艺术

    2025年06月23日
    9307
  • 哈尔滨疫情最新消息官方/哈尔滨疫情最新动态

    哈尔滨去绥棱县要隔离吗哈尔滨去绥棱县不需要隔离。以下是具体说明:政策依据:根据国务院发布的疫情新十条,公共场所不再实施隔离措施,也不再要求查看核酸证明和健康码。自由出行:在当前的政策下,人们可以自由出行,包括从哈尔滨前往绥棱县。更新时间:以上信息截止于12月5日,并基于当时的疫情防控政策。如需了解

    2025年06月24日
    9303
  • 路虎多钱/路虎价格表大全

    一辆路虎车多少钱1、根据一些路虎揽胜车主的分享,该车型的年保养费用通常占到车价的10%,而维修费用则可能超过10万元。对于顶配版的路虎揽胜,起始价格通常在300万人民币以上,即便是基础配置版本,价格也在100万人民币以上。因此,能够负担得起路虎揽胜的人,通常在经济上拥有相当的实力。2、款路虎揽运落

    2025年06月25日
    0306

发表回复

本站作者才能评论

评论列表(3条)

  • admin的头像
    admin 2025年06月20日

    我是永利号的签约作者“admin”

  • admin
    admin 2025年06月20日

    本文概览:  为了启用有关数据预处理,模型体系结构和培训的参数的系统评估,我们开发了Pytorch中有限自动机器学习的工具(https://github.com/sjgosai/boda...

  • admin
    用户062005 2025年06月20日

    文章不错《机器指导的细胞型顺式调节元件的设计》内容很有帮助