AI模型在经过递归生成的数据进行培训时崩溃

  在本节中,我们评估了模型崩溃对语言模型的影响 。我们在补充材料中涵盖了更多可解释的机器学习模型(VAE和GMM) 。代码在参考文献中公开可用。13。   模型崩溃在机器学习模型的各个家族中都是普遍的 。但是 ,如果通常从头开始对GMM和VAE等小型型号进行训练 ,LLMS则不同。它们从头开始训练非常昂贵,以至于通常使用预先训练的模型(例如Bert4,Roberta5或GPT-2)(参考文献2)初始化它们 ,这些模型在大型文本语料库中进行了培训。然后,它们对各种下游任务进行微调14 。   在这里,我们探索语言模型与其他模型生成的数据进行顺序微调时会发生什么。我们可以轻松地复制本文中涵盖的所有实验 ,并在非修补设置中使用较大的语言模型来证明模型崩溃。鉴于培训单个中等大型模型是美国终生二氧化碳价值的两倍(参考文献15),我们选择不进行这样的实验,而是专注于更现实的概念验证 。请注意 ,即使本文中描述的语言实验也花了数周的时间。我们评估了训练语言模型的最常见环境,这是一个微调设置,每个训练周期都从具有最新数据的预训练模型开始。这里的数据来自另一个微调的预训练模型 。由于训练仅限于生产与原始预训练模型接近的模型 ,并且模型产生的数据点通常会产生很小的梯度,因此这里的期望可能是模型只能在微调后适度改变。我们微调了Meta通过拥抱Face提供的OPT-125M因果语言模型。   我们在Wikitext2 DataSet16上微调它 。对于训练有素的模型,我们使用五向光束搜索 。我们阻止训练序列为64个令牌。然后 ,对于训练集中的每个令牌序列 ,我们要求模型预测下一个64个令牌。我们浏览所有原始的培训数据集,并产生相同大小的人工数据集 。因为我们浏览了所有原始数据集并预测所有块,所以如果模型有0个错误 ,则将产生原始的Wikitext2数据集。每一代的培训始于原始培训数据的生成。每个实验进行五次运行,结果显示为五个单独的运行,具有不同的随机种子 。用真实的Wikitext2数据微调的原始模型从115的零射击基线获得了34个平均困惑 ,也就是说,它成功地学习了任务。最后,为了尽可能现实 ,我们使用原始任务上最佳的模型,使用原始Wikitext2验证集评估,作为后代的基本模型 ,这意味着 - 在实践中,可以更加明显地观察到的模型崩溃。在这里,我们考虑两个不同的设置:   这两种训练制度都导致模型中的性能降低 ,但是我们确实发现使用生成数据学习是可能的 ,并且模型可以成功地学习(某些)基础任务 。特别是,从图1及其在补充材料中的3D版本中,我们看到模型崩溃发生了 ,因为在世代相传的样品的密度开始积累。反过来,这几代人可能会类似地崩溃到三角洲函数。   重要的是要注意,观察到的行为与“理论直觉 ”部分中建立的一般直觉一致 。确切地说 ,在所有实验中,世代学习仅在有限的(通常很少)的世代上进行,而“理论直觉 ”部分的主张大多以世代的限制为Infinity。但是 ,从补充材料中的VAE和GMM的实验中可以看出,收敛到三角洲功能和这种收敛的特定速率与所考虑的问题的细节高度相关,即使在少量步骤之后 ,也可能发生完全崩溃。理论上在补充材料中进一步说明了这一点,其中即使经过几代人,也可能会出现与原始模型的差异 。   图1B ,左侧的C显示了由不同世代生成的单个数据点困惑的直方图 ,这是由使用Real Wikitext2训练数据开发的第一个模型评估的 。在这里,在几代人中,模型倾向于产生更多原始模型会产生较高可能性的序列。观察到的效果类似于补充材料中VAE和GMM所述的效果 ,其中(几代人)模型开始生成原始模型较高概率产生的样品。同时,我们发现生成的数据具有更长的尾巴,这表明原始模型永远不会产生某些数据 ,这些数据是由于使用生成数据而累积的错误 。   由模型崩溃影响的OPT-125M模型的文本输出的示例 - 代替了几代人的降级,为此,每个新一代都经过上一代生产的数据培训。   我们发现 ,在实验中,语言模型生成的数据最终包含大量重复短语,如示例1所示。在几乎所有文本生成模型17,18中都观察到了重复问题17,18 ,并且为了将其排除为模型崩溃的原因,我们进一步鼓励模型明确地提供非重复序列的数值实验 。我们发现,这会导致模型产生较低的分数连续性以避免使用重复序列 ,从而导致随后的模型的性能更糟。模型的困惑度在整个世代转向了更可能的令牌序列 ,该序列是使用对原始真实数据分布训练的模型进行了测量的。补充材料中提供了进一步的插图 。特别是,对LLM实验执行此操作会导致与原始相比的困惑两倍。模型仍然容易受到模型崩溃的影响,即使不是更多。   所描述的过程表明 ,语言模型的微调不能遏制模型崩溃的效果,而被微调的模型也很脆弱 。我们发现,在几代人中 ,模型倾向于从原始数据中产生更可能的序列,并开始引入自己的不可能的序列,即错误。

本文来自作者[admin]投稿,不代表永利号立场,如若转载,请注明出处:http://www.siyonli.com/zlan/202506-1099.html

(10)

文章推荐

  • 男朋友不老实怎么回事 男朋友晚上睡觉手一直不老实

    男朋友不老实怎么回事男朋友不老实,有可能对你不忠实,也有可能有什么事隐瞒着你,也有可能是他这个人天生就油嘴滑舌的,不老实,所以一定要绝对要查清原因。如果她对你不真实,你要查一下他是不是背后和别的女人有交往。如果他有什么事情隐瞒着你,你要查清这个事的原因,如果是他家庭的原因,你要帮助他理解他,如果是他

    2025年04月07日
    225318
  • 百胜图和铂富咖啡机哪个好 铂富咖啡机售后维修

    百胜图和铂富咖啡机哪个好百胜图咖啡机是一款高端的全自动咖啡机,它具有智能研磨、自动萃取、自动清洗等功能,可以快速地制作出高品质的咖啡。此外,百胜图咖啡机还配备了多种预设菜单和温度控制等功能,可以根据不同的口味和需求进行调节。铂富咖啡机是一款半自动咖啡机,它需要手动控制咖啡粉的研磨和萃取过程,因此需要

    2025年04月07日
    48319
  • 黄绮珊难忘今宵到底是唱了几句 黄绮珊领唱的难忘今宵

    黄绮珊难忘今宵到底是唱了几句今年春晚黄绮珊领唱《难忘今宵》仅仅领唱了两句:“难忘今宵,难忘今宵”,为什么会引来那么大的争议呢?李谷一老师唱的《难忘今宵》虽然温柔,但是歌声中饱含希望和憧憬,也唱出了国泰民安的幸福感,而黄...黄绮珊领唱的难忘今宵1、“开口脆”现场!黄绮珊春晚版《难忘今宵》直接封神当黄

    2025年04月10日
    69321
  • 调查抗菌药物的身体分布的特定方法

      感谢您访问Nature.com。您使用的是浏览器版本对CSS的支持有限。获得  最佳体验,我们建议您使用更多最新的浏览器(或关闭兼容模式  InternetExplorer)。同时,为了确保继续支持,我们正在展示网站,没有样式  和JavaScript。

    2025年06月18日
    10323
  • 【死亡游戏跑,死亡游戏玩法介绍】

    天勾贾巴尔是不是李小龙的徒弟1、在电影《死亡游戏》的拍摄中,李小龙与贾巴尔的合作堪称经典。虽然李小龙在截拳道上是贾巴尔的老师,但在贾巴尔心中,李小龙更像是一个值得信赖的朋友。这种独特的师徒关系,使得电影中的动作场面更加精彩。李小龙对贾巴尔的影响远远超出了武术领域。在截拳道的指导之外,李小龙还分享了

    2025年06月20日
    7304
  • 人造E.L.F./V.L.F。排放和辐射带

      e.l.fhttps://www.nature.com/articles/v.l.f的形态学研究。ArielIII和IV卫星上的排放表明,北美工业化区域产生的人造电磁排放,即电力线谐波以及V.L.F.在磁层中的内部和外部辐射带之间形成了电子插槽(2<l<3),涵盖涵盖南大西洋异

    2025年06月20日
    7322
  • 吸引网站的自动播放YouTube画廊

      今天,我们将谈论ElfsightYouTubeGallery应用程序,即直接在网站上嵌入自动播放YouTube视频的首选解决方案。这个功能强大的插件不仅可以通过展示相关的视频内容来增强用户参与度,还支持各种内容源,包括频道,播放列表和各个视频。无论您是要展示教程,评论还是促销内容,自动播放功

    2025年06月21日
    9316
  • poe帝王试炼攻略(帝王试炼怎么过)

    流放之路游侠分侠客锐眼追猎者什么意思一般情况下是追猎者也就是俗称的药侠厉害的。药侠的确是当前版本的bug,早晚得砍。不过,药不能停很烦的,很累,若是玩弓,可以直接考虑锐眼版本的。天生带连锁带+1投射物,省下来连锁宝石的位置换上增伤的宝石,高阶多重投射(gmp)也可换低阶多重投射(lmp)来减少伤害

    2025年06月22日
    7319
  • 巾疫情的简单介绍

    关于疫情如何防护1、在疫情期间,做好防护措施至关重要,以下是一些关键的防护措施:保持个人卫生习惯勤洗手:使用肥皂或洗手液并用流动水洗手,特别是在双手接触呼吸道分泌物后应立即洗手。用一次性纸巾或干净毛巾擦手。保持呼吸道卫生:咳嗽或打喷嚏时,用纸巾、毛巾等遮住口鼻,咳嗽或打喷嚏后洗手,避免用手触

    2025年06月25日
    4300
  • 【大连已有2个高风险地区,大连已有2个高风险地区怎么办】

    现在大连是高危区域吗?1、不是。大连只有一个高风险区~甘井子区大连湾街道,而大连周水子国际机场不属于大连湾街道,所以不属于高风险区。大连周水子机场虽然在甘井子区不过机场所在地区属于低风险地区。出港必须持有检测证明才可以。目前没有任何相关部门有任何关于大连湾街道从高风险区降到中风险区的消息。2、当前

    2025年06月25日
    0308
  • 菠萝蜜的种子发的芽长什么样 菠萝菠萝蜜菠萝蜜芽

    菠萝蜜的种子发的芽长什么样菠萝蜜苗的茎干细长,基部木质化,呈现黄褐色,梢部较嫩,呈现青绿色,且叶片宽大,呈长卵形,先端渐尖,表面光滑无毛,并且菠萝蜜苗的梢部长有嫩芽,颜色翠绿,呈现锥形。菠萝蜜原产自印度西高止山,目前在我国广东、海南、福建等南方城市均有栽培,世界范围内,尼泊尔、印度锡金、马来西亚、不

    2025年04月08日
    48323
  • 大连理工学院怎么样(大连理工学院是本科吗)

    大连理工大学城市学院到底怎么样大连理工大学城市学院是一所靠谱的学院。以下是几个方面的详细解释:教育部批准成立:大连理工大学城市学院是经过教育部批准成立的独立学院,具有合法的办学资质。继承优良传统:作为大连理工大学的附属学院,它继承了大连理工大学的优良传统和教学经验,注重培养学生的创新能力和实践能力

    2025年06月25日
    2302

发表回复

本站作者才能评论

评论列表(3条)

  • admin的头像
    admin 2025年06月18日

    我是永利号的签约作者“admin”

  • admin
    admin 2025年06月18日

    本文概览:  在本节中,我们评估了模型崩溃对语言模型的影响。我们在补充材料中涵盖了更多可解释的机器学习模型(VAE和GMM)。代码在参考文献中公开可用。13。   模型崩溃在机器学...

  • admin
    用户061810 2025年06月18日

    文章不错《AI模型在经过递归生成的数据进行培训时崩溃》内容很有帮助