EP 36. 对话Deepmind, 英伟达大语言模型专家(上):AI Agent智能体与开源LLM的应用、挑战与未来
Description
承诺大家的大波AI上新来啦!这次的嘉宾是Monica一直期待的重磅组合,能听到AI领域如此一线的核心从业者的分享,真是太难得了。这次在硅谷创新腹地,毗邻 Stanford 的 Palo Alto 线下录制, 不知不觉就聊了近三个小时,我们分成上下期,方便大家收听!
Hello World, who is OnBoard!?
两位AI研究者都在OpenAI 工作过。Nvidia 资深研究员 Jim Fan,是Twitter 上AI领域的顶尖KOL,连亚马逊的创始人 Jeff Bezos 都在关注,几乎每一条twitter 分析都是必读文章。戴涵俊是Google Deepmind 的资深研究员,更是Google 大语言模型的深度参与者。再次来串台的硅谷上市公司华人高管,硅谷徐老师, 持续高质量输出。
上期的内容,我们围绕最近AI领域最火的话题,Generative Agents(生成式智能体)。两位AI研究员都对这个领域有最一线的研究和实践经验,我们深入探讨了从AutoGPT开始,Generative Agents 从技术到应用,都有哪些新的进展、技术和场景的挑战,由此延伸到开源与闭源大语言模型的竞争格局。
跟EP35 Monica 与另一位AI研究员符尧的访谈对比听听就发现,Generative Agents 这个前沿领域,显然还有很多尚未有共识的地方。
下一期,我们会讨论更多AI领域核心话题,包括多模态模型,机器人应用落地,AI对saas的影响,LLM发展史,未来畅想等等,更是不容错过。赶紧关注Onboard!
几位嘉宾都是长期在美国工作生活,夹杂英文在所难免,不接受抱怨。Enjoy!
嘉宾介绍
Jim Fan(推特:@DrJimFan),Nvidia 高级 AI 研究科学家,曾在OpenAI工作,Stanford PhD 李飞飞实验室
戴涵俊(推特:@hanjundai),Google Deepmind 资深研究员,深度参与 Google 大语言模型项目,曾在OpenAI工作,Georgia Tech PhD
硅谷徐老师(推特:@h0wie_xu),硅谷连续创业者、人工智能高管、斯坦福商学院客座讲师,「科技早知道」主播 |微信公众号:硅谷云| AI博客:howiexu.substack.com
主持:Monica(推特:Monica_XieY):美元VC投资人,前 AWS 硅谷团队+AI创业公司打工人,公众号:M小姐研习录 (ID: MissMStudy) 主理人 | 即刻:莫妮卡同学
在粗糙简陋的 studio 顺利完成3小时录制!
Hanjun 的霸气车牌!
我们都聊了什么
02:50 几位嘉宾自我介绍,最近看到了什么有意思的AI项目
05:51 Hanjun @Google Deepmind: 最近发表的 speculative decoding 工作如何提升模型速度
09:14 Jim Fan @Nvidia: 为什么AI agents 是值得关注的方向,基于agents 有什么应用
12:42 什么是 AI agents? 好的 Agents 需要怎样的核心能力
16:54 企业场景落地 AI Agents 应用,主要有哪些挑战?
25:18 AI Agents 目前落地的挑战,是由底层基础模型的能力决定的吗?
35:56 如何看待目前 AI Agents 不同的实现方式?Adept AI 的形态会被取代吗?
39:57 未来工具使用更多是 AI agents 来完成,对于应用生态意味着什么?
48:18 Llama 2 开源对于LLM生态意味着什么?底层基础模型会赢家通吃吗?
56:58 如何理解开源和闭源模型的壁垒?
68:24 我们需要领域专有模型吗?
我们提到的内容
Hanjun 提到的论文:Accelerating Large Language Model Decoding with Speculative Sampling Jim 的论文: Voyager: An Open-Ended Embodied Agent with Large Language Models Jim 提到的论文:Generative Agents: Interactive Simulacra of Human Behavior 开源项目 Auto-GPT: An experimental open-source attempt to make GPT-4 fully autonomous Llama 2: Meta 开源的大语言模型 Adept.ai: a new way to use computers. Transformer 论文作者创办 Character AI Jim 提到的基于大语言模型的游戏:病娇AI女友 MPT-7B (MosaicML Pretrained Transformer): MosaicML 发布的可商用开源大语言模型 Anthropic: Transformer 论文作者创立的大语言模型公
你们期待已久的最硬核干货的OpenAI o1模型技术解读来了!上个月最值得关注的事件,或许就是9月12号OpenAI o1模型的发布了,大家对这个新的模型翘首以待许久,OpenAI CEO Sam Altman 也称之为新范式的开始。经过强化学习(Reinforcement Learning)并结合Chain of thoughts 思维链技术,o1在处理物理、数学、编程等复杂问题时,甚至和该领域的博士生水平不相上下。OnBoard! 的嘉宾,不会让你失望!
Hello World, who is...
Published 10/11/24
本期播客与《此话当真》合作,这次的创业者深度访谈,有些不一样!这位女侠一般的创业者 2016 年就开始做出海应用创业。这次的访谈,我们看看一位8年出海老兵,如何从0做到数千万用户,又如何在 LLM 大潮中,雷厉风行地带领公司将 AI 融入实践中。
Hello World, who is OnBoard!?
今天的嘉宾,是 Guru Network 创始人兼CEO, Renee 王小雨。2016年,她开发的 Castbox 成立并进军海外移动端播客市场,填补了市场空白,注册用户曾一度达到 3000 万,位列第三方播客产品榜首。如今,这位毕业于北大心理学系,有着多年开发经验的前 Google...
Published 09/19/24