清华大学引领AI研究新纪元:开放ChatGLM系列模型权重

文章导语:清华大学NLP团队共同开放了ChatGLM-6B 和 ChatGLM2-6B模型的权重,预示着人工智能研究新纪元的来临。

清华大学引领AI研究新纪元:开放ChatGLM系列模型权重

一、AI研究的新里程碑:ChatGLM-6B与ChatGLM2-6B

清华大学NLP团队与智谱AI及清华KEG实验室共同宣布,他们的ChatGLM-6B和ChatGLM2-6B模型现已完全开放权重,允许学术研究和商业使用。这两个模型在人工智能研究领域具有重要意义。

ChatGLM-6B模型是基于General Language Model(GLM)架构的中英双语对话模型,拥有62亿参数。该模型具备问答和对话功能,展现了其在人工智能领域的应用潜力。

二、ChatGLM2-6B:升级与创新

ChatGLM2-6B模型在初代模型的基础上,引入了更多新特性。它采用了GLM的混合目标函数,经过1.4T中英标识符的预训练和人类偏好对齐训练,性能得到了显著提升。上下文长度从2K扩展到了32K,推理速度提升了42%,在INT4量化下,6GB显存可以支持更长的对话长度。这些优化让其在长对话处理和推理速度方面具有了更大的优势。

三、开启AI研究新纪元

这两个模型的开放将为学术界和商业领域的研究者提供更多机会,推动人工智能的创新与应用。他们的发布标志着清华大学在人工智能领域的重要突破,开启了全球AI研究和应用探索的新篇章。

我们期待,在未来,基于ChatGLM-6B和ChatGLM2-6B模型的研究成果和应用场景将持续出现,不断推动人工智能技术的发展进程。

声明:本站所有文章,如无特殊说明或标注,均为本站(王大神)原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

给TA打赏
共{{data.count}}人
人已打赏
指数词

502报错的困惑:WordPress后台故障排查与解决

2023-7-18 8:11:38

指数词

创业真相:赚钱其实只是两三年的事

2023-7-19 17:36:29

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索