编码人声:在 GPT-4o 释放完整能力前,听听实时多模态 AI 创业者的一手经验
Listen now
Description
5 月中旬 GPT-4o 的发布,让人与 AI 的交互,从对话框的文本交流加速推进到了音视频多模态的实时互动。 本期节目,我们邀请到实时互动 AI 创业者史业民。他结合了自己的一手研发经验,深度分析了 GPT-4o 在多模态、实时交互、情感语音的新能力和能力边界,分享了 GPT-4o 正在催生的潜在场景和新机会。史业民还从开发者视角,提出了面向开发者的 GPT-4o 和面向用户的 ChatGPT 能力可能存在区别的提醒,以及在开发多模态 AI 产品时需要注意到的技术细节。 从对话框到音视频,多模态的实时互动 AI 已成趋势。希望本期节目能对你有所启发。
More Episodes
本期节目有些特别,我们邀请到了一位从电脑爱好者“转型”成为反诈警察的神秘嘉宾。 他将在节目中分享他在日常工作中遇到的那些趣事和怪事,从一个独特的视角带大家了解诈骗背后的套路和手段。或许有时候,你被诈骗了,并不是因为你不够聪明,而是因为骗子早已盯上了你。。。 【听友福利】 拼多多百亿补贴:进入拼多多搜索“【津津乐道】”或点击评论区置顶链接,直达活动会场,iphone16系列至高直降1100,搜索词长期有效,大家可以经常搜搜看,经常有活动更新。
Published 11/21/24
虚拟世界与现实世界的界限逐渐模糊,已然成为不争的事实。但究竟哪些曾经的幻想已然照进现实,又有哪些挑战依然横亘眼前?本期节目,我们邀请三位来自不同领域的嘉宾,从 2024 年底的当下出发,共同审视虚拟与现实融合的真实图景。 InSpaze 的易明分享了在全新的硬件生态 Vision Pro 上开发社交应用的挑战与机遇,并展望了虚拟社交的未来;Motphys 的崔汉青深入剖析了实时物理引擎如何赋予虚拟世界更真实的物理规律,以及在游戏、具身智能、数字孪生领域的应用;MicroBlocks 的邵悦展示了物理计算平台 MicroBlocks...
Published 11/17/24
Published 11/17/24