GPT-4o 只是对话式 AI 的冰山一角,背后隐藏了哪些新机会?
Listen now
Description
GPT-4o 只是「对话式 AI 」(conversational AI) 的冰山一角。 同期发布的 Project Astra 还演示了对话式 AI 和可穿戴硬件结合的可能。 更早些,hume.ai 上线了能解读 53 种不同情绪的「共情语音接口」(EVI),发布了一档实时交互式 AI 播客。 ChatTTS 让更多人体验到会笑会停顿,几乎与真人无异的语音合成技术。 投资机构 a16z 近期发布报告,创立了「Voice AI Agent」的投资新赛道并高呼:「是时候重新发明通话了!」 技术上实现 《Her》 的「最后一步」是什么?创业者如何利用现有技术能力满足用户?哪些场景最可能诞生真实付费需求? 本期节目,嘉宾将从模型开发者、实时互动从业者、AI 陪伴玩具创业者的不同视角,探讨「对话式 AI」的边界,分享实践中看到的新机会。 有嘉宾说:人工智能实现 human like 的最后一步,是允许 AI 与人类拥有平等地位:如果你希望 AI 像人,那就请允许 AI 可以随时地回应你也打断你,聆听你也忽略你…… 如果是这样,你愿意吗? 【本期主播与嘉宾】张栋,SpeechGPT 作者,SpeechGPT 是一个端到端的语音模型。 王乐,Folotoy 创始人,AI 陪伴对话玩具创业者。 李忻玮,声网 AI 算法工程师,《从零开始学扩散模型》作者,Hugging Face 中文社区成员。 白宦成,全流程工程师,AI 产品经理,RTE 开发者社区布道师,《编码人声》主播。 【听友福利】欢迎在评论区留言,分享你对 GPT-4o 的看法,或者对最有潜力的对话式 AI 场景的预测。我们将抽出一位送出魔性的 Folotoy 仙人掌 AI 玩具一份(价值 398 元)。 【相关信息】一起探索人和 AI 的新连接方式!RTE 开发者社区将在 6 月 22 日、23 日,联合 Founder Park 在北京举办线下的 AGI Playground 活动,边玩边探索 AGI 和 RTE 实时互动的新可能。加入社区微信群,还可以提前获取活动消息,抽免费活动门票。关注「RTE 开发者社区」微信公众号,在后台回复「小助手」即可入群。 【制作团队】后期 / 卷圈监制 / 姝琦产品统筹 / bobo联合制作 / RTE开发者社区 关于「编码人声」「编码人声」是由「RTE开发者社区」策划的一档播客节目,关注行业发展变革、开发者职涯发展、技术突破以及创业创新,由开发者来分享开发者眼中的工作与生活。录制嘉宾覆盖信通院 & 科委专家、国内外资深投资人、VR/AR & 虚拟人 & AIGC 等新兴技术领域头部创业者、一线网红 & 硬核开发者、跨界画家 & 作家 & 酿酒师等。 RTE 开发者社区是聚焦实时互动领域的中立开发者社区。不止于纯粹的技术交流,我们相信开发者具备更加丰盈的个体价值。行业发展变革、开发者职涯发展、技术创业创新资源,我们将陪跑开发者,共享、共建、共成长。社区于2023年底正式启动了「主理人+工作组」的运营机制,并确认了社区的 3 位联合主理人 ——· 零一万物 01.AI 开源负责人 @林旅强 Richard· FreeSWITCH 中文社区创始人 @杜金房· 小红书音视频架构负责人 @陈靖 本节目由津津乐道播客网络与 RTE 开发者社区联合制作播出。 RTE 开发者社区 | 公众号:RTE开发者社区 | 津津乐道播客官网 | 版权声明 | 评论须知 | 加入听友群
More Episodes
虚拟世界与现实世界的界限逐渐模糊,已然成为不争的事实。但究竟哪些曾经的幻想已然照进现实,又有哪些挑战依然横亘眼前?本期节目,我们邀请三位来自不同领域的嘉宾,从 2024 年底的当下出发,共同审视虚拟与现实融合的真实图景。 InSpaze 的易明分享了在全新的硬件生态 Vision Pro 上开发社交应用的挑战与机遇,并展望了虚拟社交的未来;Motphys 的崔汉青深入剖析了实时物理引擎如何赋予虚拟世界更真实的物理规律,以及在游戏、具身智能、数字孪生领域的应用;MicroBlocks 的邵悦展示了物理计算平台 MicroBlocks...
Published 11/17/24
Published 11/17/24
无论你是否熟悉 Function Call、Tool Use 或者 RPA,都可能刷到了 Claude 推出「能像人一样操控电脑」的 Computer Use 的新闻。 与 Claude 3.5 Sonnet 一同发布的 Computer Use,可模拟人与计算机的交互,执行如移动光标、点击按钮、输入信息等操作。 本期节目,我们请到了 Riffo 的陈春宇和 LLamaEdge 的 Michael Yuan。Riffo 能在桌面调用 LLM 能力,实现文件智能重命名和整理;而 LLamaEdge 则是一个轻型、本地化的 LLM Runtime。本期的主播白宦成也长期从事企业 AI...
Published 10/29/24