75. 和OpenAI前研究员吴翼解读o1：吹响了开挖第二座金矿的号角 - Listen - 张小珺Jùn｜商业访谈录

75. 和OpenAI前研究员吴翼解读o1：吹响了开挖第二座金矿的号角

Listen now

Description

上集节目，广密在OpenAI o1问世之前，准确地预言了代号为“Strawberry”（草莓）的项目走向，以及它背后暗示的AGI范式已经转移，强化学习开启了新赛道。这集节目录制在o1问世之后，我第一时间和边塞科技创始人、清华叉院信息研究院助理教授，同时也是前OpenAI研究员的吴翼聊了聊。他的研究方向正是强化学习。吴翼从技术视角全方位地解读了o1模型，并且分享了只有内部视角才能看见的真实的OpenAI。我们的播客节目在腾讯新闻首发，大家可以前往关注哦，这样可以第一时间获取节目信息和更多新闻资讯：） 01:50 2019年在OpenAI做研究员 03:04 那个年代所有PHD都希望去Google Brain和DeepMind 03:46 OpenAI o1-preview初体验，很意外在用户使用端做这么大规模的推理 07:20 pre-training（预训练）能挖的金矿越来越少，以强化学习为基础的post-training（后训练）是另一个大金矿，使迈向AGI的梯子多了几节 09:00 o1-preview版本是GPT-3时刻，到没到ChatGPT时刻要看正式版本 10:33 o1应该核心关注两个要点和背后的技术原理 13:54 强化学习能否探索出Scaling Law有希望，但很复杂 15:06 强化学习三要素：reward model+搜索和探索+prompt，每一块都很难 16:42 2014年开始，UC Berkeley集体转向，押注强化学习 19:36 RL算法的演进：从DQN（Deep Q-Network）到PPO（Proximal Policy Optimization） 23:45 相信会带来通用能力而不是垂类能力提升 24:47 长文本是实现AGI的第一步，推理能力是第二步 29:57 通过o1-preview能反向复原哪些技术细节？ 34:00 reward model不太可能有一个单独的小组闭着眼睛训练，是耦合的 38:30 思维链、安全、幻觉和算力 41:25 为什么这么项目叫“Q*”？后来又叫“草莓”？梗都很有意思 49:49 o1不代表垂直模型，依然相信会出现全能的大统一模型 57:57 关于Scaling Law，2019年OpenAI内部讨论的细节 01:00:26 2019年的OpenAI处于“闭着眼睛挖矿的状态” 01:03:20 OpenAI当年如何做管理：搞大新闻、发博客，KPI是博客关注量 01:10:28 2020年离开OpenAI后悔吗？o1发布前的预言单集：AGI范式大转移：和广密预言草莓、OpenAI o1和self-play RL｜全球大模型季报4 【更多信息】联络我们：微博@张小珺-Benita，小红书@张小珺jùn 更多信息欢迎关注公众号：张小珺

More Episodes

See all »

81. 和李开复聊聊：如果美国形成AGI霸权，我们应该怎么办？

最近美国大选尘埃落定，今天我们的话题不是美国政治，而是讨论一个地缘相关的科技话题：如果美国形成AGI霸权，我们应该怎么办？这集嘉宾是李开复（零一万物创始人和CEO、创新工场董事长和CEO）。由于他有40年人工智能从业经历，曾经在苹果、微软和Google等科技巨头中担任高管，和中美各界联络广泛；这次，我们把话题推向了更为宏大的议题：AGI霸权与垄断、海外科技巨头的卡位与现状、AI超级应用的隐形崛起。访谈中，他提供了一个如果美国有望形成AGI霸权，中国可以走的第二条道路的可能性视角。我们的播客节目在腾讯新闻首发，大家可以前往关注哦，这样可以第一时间获取节目信息和更多新闻资讯：） 02:...

Published 11/10/24

张小珺Jùn｜商业访谈录

Published 11/10/24

80. 和知乎周源聊，社会化编辑部、孤独的悖论、AI与宿命

今天的嘉宾是知乎创始人和CEO周源。可以说，大模型技术浪潮的崛起正冲击着现存内容社区的既有秩序。拿知乎来说，有了大模型之后，当我们都可以向机器提问了，为什么还需要一个“向人提问”的产品？ “向人提问”与“向AI提问”能在一个社区中共存吗？更有甚者，倘若人类不再需要与另一个人类连接识别意义，这种人与人交流的平台，会不会最终被机器吞噬，成为机器理解人类的语料？这不仅是知乎需要思考的，而是在AI技术变革面前，所有内容社区所面临共同的时代命题。这集我和周源就聊了聊内容社区与AI。今年知乎上线了自己的AI搜索产品，知乎直答。周源对AI搜索、搜索引擎市场和Perplexity发表了一些特别...

Published 10/31/24