大型语言模型

为什么GPT-4在预测公司未来盈利增长方面比人类分析师更出色？

在最近的一项研究中，芝加哥大学的研究人员发现，GPT-4在预测公司未来盈利增长方面展现出超越人类分析师的能力。这一发现令人惊讶，因为GPT-4只依赖公司的财务报表，而无需其他额外信息。本文将探讨这项研 …

赞 (0)大神网 - 王大神2024-05-28阅读(54)标签：GPT-4 / 人工智能 / 大型语言模型 / 盈利预测 / 财务分析

谷歌Infini-Transformer模型：有效管理无限上下文挑战与未来方向

本文介绍谷歌最新的Infini-Transformer模型，该模型通过Infini-attention机制扩展传统Transformer处理无限长输入的能力。文章探讨了技术细节、性能比较及未来应用方向。引言从2017年的开创性论文《Attent …

赞 (0)大神网 - 王大神2024-05-05阅读(54)标签：Infini-attention机制 / Infini-Transformer / Transformer架构优化 / 大型语言模型 / 长上下文模型

指数词

英伟达发布NVIDIA H100：AI时代的震撼力量

英伟达，作为全球领先的图形处理器（GPU）制造商，一直在推动人工智能和计算领域的创新。最新的消息令人振奋，他们宣布推出了全新的专用加速卡，NVIDIA H100，这将在AI领域掀起一场革命。在这篇文章中，我 …

赞 (0)大神网 - 王大神2023-12-28阅读(183)标签：GPU加速卡 / NVIDIA H100 / 人工智能 / 大型语言模型 / 深度学习

指数词

GPT-4性能问题曝光：OpenAI承认并计划修复

2023年12月11日，OpenAI的GPT-4模型成为热门话题，但不是因为其卓越的性能，而是因为用户普遍反映模型变得“懒散”，不愿提供答案。这一问题引起了广泛关注和批评，OpenAI在社交平台上承认了这一问题，并表示 …

赞 (0)大神网 - 王大神2023-12-11阅读(182)标签：GPT-4 / openai / 修复计划 / 大型语言模型 / 性能问题

指数词

微软计划推出超越OpenAI的新大型语言模型：AI竞争的下一步

在当今快速发展的人工智能领域，竞争激烈，各大科技巨头都在争夺AI市场的领导地位。最近，微软的高管Eric Boyd透露了微软在生成式AI领域的计划，引发了广泛的关注。让我们一起深入了解微软的新动向以及AI领 …

赞 (0)大神网 - 王大神2023-12-09阅读(242)标签：openai / 大型语言模型 / 微软 / 生成式AI / 负责任AI

指数词

ChatGPT参数量曝光：20B真相何在？

1

曾经，ChatGPT是个神秘的存在，像是装在宝箱里的珍宝，无人知晓其真正的内在。然而，昨天晚上，一篇EMNLP论文和其中的截图，突然揭开了ChatGPT的神秘面纱，这个曾经的宝箱变得千疮百孔。微软的一篇名为《C …

赞 (0)大神网 - 王大神2023-11-01阅读(210)标签：ChatGPT / 参数量 / 大型语言模型 / 知乎热榜 / 腾讯云

开源

ReMax算法：简单、高效、有效的大型语言模型对齐方法

在现代科技的浪潮中，大型语言模型（Large Language Models，LLMs）如GPT-3、GPT-4等已经成为自然语言处理和人工智能领域的璀璨明星。它们能够自动生成文本、回答问题、进行翻译，乃至于模拟人类的对话，这 …

赞 (0)大神网 - 王大神2023-10-20阅读(279)标签：ReMax算法 / 大型语言模型 / 对齐方法 / 强化学习 / 自然语言处理

指数词

大型语言模型的涌现能力：现实还是海市蜃楼？

在当今数字时代，大型语言模型如GPT-3已经成为了技术界的明星，它们可以生成高质量的文本、回答各种问题，甚至进行创作。这些模型的涌现能力被认为是人工智能的里程碑，但是，是否一切都如此神奇，或者这只 …

赞 (0)大神网 - 王大神2023-10-20阅读(165)标签：偏见 / 大型语言模型 / 应用扩展 / 数据驱动 / 涌现能力

开源

发现最佳AI聊天体验：ChatALL 项目介绍

1

你是否曾经体验过使用大型语言模型（LLMs）创建的AI聊天机器人？这些机器人确实令人惊叹，但它们的行为可能会随机变化，不同的机器人在不同的任务上表现出色。如果你想要最佳的聊天体验，那就不要逐个尝试 …

赞 (0)大神网 - 王大神2023-10-20阅读(357)标签：AI机器人 / ChatALL / 大型语言模型 / 聊天体验 / 隐私保护

教程

如何充分利用大型语言模型

在数字时代，人工智能的崛起给我们带来了前所未有的可能性。而在这个无处不在的AI时代，大型语言模型如GPT-3则成为了实现许多创意和任务的得力助手。无论是在编程、创作、还是解答问题上，大型语言模型都能 …

赞 (0)大神网 - 王大神2023-10-14阅读(119)标签：代码能力 / 大型语言模型 / 完成提示 / 指令提示 / 模型控制 / 演示提示 / 细调提示

指数词

如何提高大型语言模型的事实性：FRESHPROMPT方法

在今天的数字时代，大型语言模型（LLM）如GPT-3.5和GPT-4已经成为了多功能的开放域聊天机器人。它们在多种任务中表现出色，但在某些情况下，它们的回答可能会受到“幻觉”和过时信息的影响，降低了可信度，尤 …

赞 (0)大神网 - 王大神2023-10-10阅读(135)标签：FRESHPROMPT / 事实性 / 信息更新 / 大型语言模型 / 搜索引擎增强

指数词

颠覆性影响：AI Agents的崭新时代

在当今科技潮流中，人工智能的崛起已经不再是新鲜事物。然而，AI领域的不断演进和创新依然让人惊叹。最近，OpenAI联合创始人Andrej Karpathy的一次开发者活动讲话以及Lilian Weng的长文引发了广泛的讨论。 …

赞 (0)大神网 - 王大神2023-10-05阅读(171)标签：AI Agents / 人工智能代理 / 任务解决器 / 大型语言模型 / 自主代理

教程

chatgpt提示prompt工程：探索思维链以提高复杂推理能力

在当今人工智能领域，我们经常听说大型语言模型（LLM）的强大，但它们如何实现复杂推理呢？思维链（Chain of Thought）是一个有趣而强大的概念，它可以帮助LLM进行复杂推理。本文将深入探讨思维链是什么， …

赞 (0)大神网 - 王大神2023-10-05阅读(202)标签：中间步骤 / 复杂推理 / 大型语言模型 / 思维链提示 / 推理能力

开源

打造虚拟软件公司：ChatDev带你进入智能代理的新世界

Bob是一个酷爱编程的人，一直以来，他梦想能有一种技术，让软件开发的流程更智能、更高效。一天，Bob在一次偶然的机会中，发现了ChatDev这个项目。他好奇心作祟，开始研究。接下来的旅程，让他大开眼界，就 …

赞 (0)大神网 - 王大神2023-09-25阅读(514)标签：ChatDev / 大型语言模型 / 软件开发 / 集体智能 / 高度可定制

指数词

如何理解大型语言模型的逆转诅咒

如何理解大型语言模型的逆转诅咒你好，亲爱的读者！今天，我们要探讨一个令人着迷的话题，那就是大型语言模型的逆转诅咒。或许你曾经想过，当你告诉一个模型“乔治·华盛顿是美国第一任总统”时，它是否能够 …

赞 (0)大神网 - 王大神2023-09-24阅读(351)标签：人工智能 / 大型语言模型 / 推理能力 / 泛化能力 / 逆转诅咒