微信关注,获取更多

临界维度

指数词

揭秘RoPE位置编码的外推秘密:如何让大型语言模型突破上下文窗口限制

在人工智能领域,大型语言模型一直处于研究和应用的前沿。这些模型可以执行各种自然语言处理任务,如文本生成、翻译、问答等,但它们通常受到一个重要限制:上下文窗口的大小。在过去,这个窗口大小一直是 …
指数词

大模型上下文窗口长度突破10万?新研究揭示RoPE位置编码的秘密

大家好,今天我要向大家介绍一项令人振奋的研究,这项研究来自复旦大学和上海人工智能实验室,他们找到了一种方法,可以让大型语言模型的上下文窗口长度从原本的1.6万tokens延长到100万tokens!这个研究的 …
赞 (0)阅读(197)