73. AGI范式大转移：和广密预言草莓、OpenAI o1和self-play RL｜全球大模型季报4 - Listen -

73. AGI范式大转移：和广密预言草莓、OpenAI o1和self-play RL｜全球大模型季报4

Listen now

Description

今天这集是我和广密【全球大模型季报】第4集。这期2024年Q3季报，提前和大家见面。我们正进入的9月会是AGI的一个大月，OpenAI造势已久且绝密的项目“草莓（Strawberry）”将在不久后揭开它神秘的面纱。此外，Anthropic也会推出Claude 3.5 Opus，这两个模型将是AGI进程是否顺利的关键风向标。这些项目很可能暗示了硅谷AGI范式已经静悄悄地发生剧烈转移。本集节目带来了对AGI发展路径的最大猜想——硅谷AGI范式正在发生转移，self-play RL（强化学习）开启了新赛道。大部分人还没意识到，在纯靠语言模型预训练的Scaling Law这个经典物理规律遇到瓶颈后，多家硅谷明星公司已经把它们的资源重心押宝在一条新路径上：self-play RL（自博弈强化学习）。只不过，这个范式转移还未形成共识。Self-play RL到底是什么？它如何有别于传统路径？它能成为继续Scaling Law的一把神奇钥匙吗？这集节目是关于self-play RL的一篇高质量科普，也希望为大模型从业者带来方向性的启发。除了self-play RL，我们着重探讨了硅谷一级市场的明星赛道（Coding、视频生成、通用机器人），以及OpenAI与科技巨头近况。希望我们【全球大模型季报】能帮大家了解最前沿的AGI动态，并且能持续给大家带来启示。本集是《张小珺Jùn｜商业访谈录》和《海外独角兽》的串台节目。我们的播客节目在腾讯新闻首发，大家可以前往关注哦，这样可以第一时间获取节目信息和更多新闻资讯：）坏的推演猜测，GPT-5不乐观；好的推演猜测，RL开启新赛道 02:30 语言模型预训练的范式或许遇瓶颈，模型scaling边际效益开始递减 05:21 为什么不一定能支持模型在GPT-4o基础上大幅跃升？现在处于“真空死亡地带”？ 06:43 我最担心的是，纯靠语言模型的经典Scaling Law /Pre train这个物理规律遇到瓶颈，或者在更大参数比如2-3T以上的情况下开始失效了 09:37 如果scaling law在模型变大的过程中不work，现在有三条潜在路径：1、多模态尤其是视觉（但还没有证据说能从视觉模态训练涌现智能能力）； 2、10万卡集群（但10万卡集群充分互联的难度比预期难，可能是全人类最难的项目之一）； 3、强化学习self-play RL（这是范式级别的大转变！） 12:53 如果我是AI公司CEO，我会200%资源all in RL这条路 13:40 概念解释：Reinforcement Learning，简称RL，中文强化学习（Ilya用一句话概括强化学习：让AI用随机路径去尝试一个新任务，如果效果超出预期，就更新神经网络的权重让AI记得多使用成功的实践，再开始下一次尝试） 19:05 代码和数学可以变得很强，能不能泛化到更多领域没有证据 22:39你也可以把语言和预训练比作人类基因组，携带着人类几千年进化的基因，强化学习RL就是人类成长的一生 24:55 必须很聪明的模型才能有能力做self-play RL的探索 27:07 Anthropic Claude 3.5是这一波标志性的产品，他们不搞Sora/搜索，主线是RL；业内少数人意识到RL的重要性是最近两个月 28:35 硅谷明星公司现阶段的资源投入？1-2家公司把RL当作最高优先级 28:56 2024年9月OpenAI和Anthropic即将要发布的，什么值得期待？ 29:42 AGI范式大转移之下，还会有GPT-6和GPT-7吗？（可能明年会看到很小的模型比今天GPT-4o要聪明非常多，一个期待是实现AGI不一定需要巨量参数的模型） 30:33 新范式的困境和卡点 32:52 Character.AI出售给Google预示AGI竞赛上半场结束，下半场开始，创始人Noam从Google进入self-play RL下半场 34:36 新范式下，还需要那么多GPU吗？很多人关心英伟达股价 37:06 AGI范式转移只在最核心的researcher中有共识，

More Episodes

See all »

81. 和李开复聊聊：如果美国形成AGI霸权，我们应该怎么办？

最近美国大选尘埃落定，今天我们的话题不是美国政治，而是讨论一个地缘相关的科技话题：如果美国形成AGI霸权，我们应该怎么办？这集嘉宾是李开复（零一万物创始人和CEO、创新工场董事长和CEO）。由于他有40年人工智能从业经历，曾经在苹果、微软和Google等科技巨头中担任高管，和中美各界联络广泛；这次，我们把话题推向了更为宏大的议题：AGI霸权与垄断、海外科技巨头的卡位与现状、AI超级应用的隐形崛起。访谈中，他提供了一个如果美国有望形成AGI霸权，中国可以走的第二条道路的可能性视角。我们的播客节目在腾讯新闻首发，大家可以前往关注哦，这样可以第一时间获取节目信息和更多新闻资讯：） 02:...

Published 11/10/24

张小珺Jùn｜商业访谈录

Published 11/10/24

80. 和知乎周源聊，社会化编辑部、孤独的悖论、AI与宿命

今天的嘉宾是知乎创始人和CEO周源。可以说，大模型技术浪潮的崛起正冲击着现存内容社区的既有秩序。拿知乎来说，有了大模型之后，当我们都可以向机器提问了，为什么还需要一个“向人提问”的产品？ “向人提问”与“向AI提问”能在一个社区中共存吗？更有甚者，倘若人类不再需要与另一个人类连接识别意义，这种人与人交流的平台，会不会最终被机器吞噬，成为机器理解人类的语料？这不仅是知乎需要思考的，而是在AI技术变革面前，所有内容社区所面临共同的时代命题。这集我和周源就聊了聊内容社区与AI。今年知乎上线了自己的AI搜索产品，知乎直答。周源对AI搜索、搜索引擎市场和Perplexity发表了一些特别...

Published 10/31/24