• 官方首页
  • 注册欧意
  • 平台快讯
  • 比特币行情
  • 区块链新闻

Nous Research 提出高效计算法 YaRN,可扩展大模型上下文窗口

2024-6-16 10:43

据品玩 9 月 5 日报道,Nous Research 联手 EleutherAI 实验室以及瑞士日内瓦大学的研究者发表论文,公布了一项名为 YaRN 的方法,可扩展大模型上下文窗口。论文显示,和传统方法相比,YaRN 需要更少的标记和训练步骤。利用这种方法,LLaMA 模型可以有效地利用和外推到比其原始预训练所允许的上下文长度更长的上下文,同时超过了过去窗口扩展的最新技术水平。据 GitHub 页面显示,使用 YaRN 进行微调的 LLaMA 2 7B/13B 上下文窗口分别可达到 64k 和 128k。

原文链接

最新发布

  • 第六届家居品牌大会,爱空间上榜“2021-2022中国家居十大优选品牌”
  • Liquity:五月社区奖励申领提交已经开放
  • 美国多家银行倒闭,联准会重启印钞机!大量印钞的后果是什么?
  • Architect Partners: Robinhood收购Bitstamp可以减弱美SEC强监管影响
  • Web3会员社交平台Only1推出10,000美元的奖金池

热点资讯

  • 区块链新闻
  • 平台快讯
  • 比特币行情

标签

欧意,随时随地交易


立刻注册

关于我们