编码人声:很好也很贵?OpenAI Realtime API 一手体验和 Voice AI 的未来
Listen now
Description
OpenAI Realtime API 发布了,你准备好了么?Realtime API 让开发者可以构建近乎实时的「语音到语音」的体验,无需将多个模型拼接在一起进行转录、推理和文本到语音的转换,实现更流畅的打断体验,还可以无缝切换多种语言。本期节目请来了第一批接入并体验 OpenAI Realtime API 的开发者,为你解析背后的技术和开发者的新机会。两位嘉宾分别是在实时多模态 AI 领域深耕多年的专家——开源实时多模态 AI 框架 TEN Framework 的联合发起人 Plutoless ,以及拾象科技的 AI Research Lead 钟凯祺 Cage。节目深度分析了 OpenAI Realtime API 的优势与挑战,讨论了实时多模态 AI 如何实现语音进、语音出的端到端交互,大幅降低延迟,提升用户体验,使得与 AI 的对话更加自然流畅。也谈到了目前存在的高昂成本和技术集成的复杂性,以及这些问题对开发者意味着什么。此外,嘉宾们还深入探讨了实时多模态 AI 的定义,什么才是真正的实时多模态?他们分享了自己在实践中遇到的挑战和最佳实践,探讨了在 OpenAI Realtime API 的背景下,开发者如何抓住新的机遇。他们也展望了 AI 在未来实时互联网中的角色,讨论了 AI 安全、人与 AI 的协作、多模态交互等话题。 节目中提到的 Voice Agent 象限图:X 轴为「准确优先」到「创造力优先」,Y 轴为「实时不敏感」到「实时敏感」(「海外独角兽」制图): 本期嘉宾和主播普列思(Plutoless), 开源多模态实时互动框架 TEN Framework 的联合发起人和开发者体验负责人,RTE 开发者社区布道师。拥有多年在实时互动领域的专业从业经验。钟凯祺 Cage,「海外独角兽」AI Research Lead。朱峰,「津津乐道播客网络」创始人,产品及技术专家。听友福利10 月 25 日到 26 日,RTE 开发者社区联合声网策划的 RTE 大会 2024 将在北京举行。今年的技术论坛将覆盖音视频技术、AI 生成视频、Voice AI、多模态大模型、空间计算和新硬件、云边端架构和 AI Infra 等话题。期待与你一起探索实时互动的更多可能,咱们 10 月 25 日到 26 日,北京见!获取《编码人声》听众限免门票: https://r.daofm.cn/9fgol 同期 AI Workshop 报名:「组装」你的专属多模态 Agent!(10 月 26 日下午,北京)https://www.bagevent.com/event/rteworkshop 相关内容访问 TEN Agent,即刻体验 OpenAI Realtime API开源实时多模态 AI 框架 TEN Framework嘉宾 Cage 共同撰写文章:《Voice Agent:AI 时代的交互界面,下一代 SaaS 入口》特德·姜在《纽约客》的文章: Why A.I. Isn’t Going to Make Art制作团队后期 / 卷圈监制 / 姝琦产品统筹 / bobo联合制作 / RTE开发者社区 关于「编码人声」「编码人声」是由「RTE开发者社区」策划的一档播客节目,关注行业发展变革、开发者职涯发展、技术突破以及创业创新,由开发者来分享开发者眼中的工作与生活。录制嘉宾覆盖信通院 & 科委专家、国内外资深投资人、VR/AR & 虚拟人 & AIGC 等新兴技术领域头部创业者、一线网红 & 硬核开发者、跨界画家 & 作家 & 酿酒师等。 RTE 开发者社区是聚焦实时互动领域的中立开发者社区。不止于纯粹的技术交流,我们相信开发者具备更加丰盈的个体价值。行业发展变革、开发者职涯发展、技术创业创新资源,我们将陪跑开发者,共享、共建、共成长。社区于2023年底正式启动了「主理人+工作组」的运营机制,并确认了社区的 3 位联合主理人 ——· 零一万物 01.AI 开源负责人 @林旅强 Richard· FreeSWITCH 中文社区创始人 @杜金房· 小红书音视频架构负责人 @陈靖 本节目由津津乐道播客网络与 RTE 开发者社区联合制作
More Episodes
虚拟世界与现实世界的界限逐渐模糊,已然成为不争的事实。但究竟哪些曾经的幻想已然照进现实,又有哪些挑战依然横亘眼前?本期节目,我们邀请三位来自不同领域的嘉宾,从 2024 年底的当下出发,共同审视虚拟与现实融合的真实图景。 InSpaze 的易明分享了在全新的硬件生态 Vision Pro 上开发社交应用的挑战与机遇,并展望了虚拟社交的未来;Motphys 的崔汉青深入剖析了实时物理引擎如何赋予虚拟世界更真实的物理规律,以及在游戏、具身智能、数字孪生领域的应用;MicroBlocks 的邵悦展示了物理计算平台 MicroBlocks...
Published 11/17/24
AI火了两年,最终主播用钱包投票的应用到底有哪些? 在这期节目中,我们将为听众深度剖析主播团队在过去半年实战检验过的AI工具和SaaS服务。通过反复试错和长期付费使用,我们筛选出了一批真正可以提升工作效率、且稳定可靠的生产力工具。无论你是个人创作者还是企业用户,都能从中找到适合自己的选择。 除了软件服务,我们还会分享几款经过深度使用、确实能带来价值的硬件产品体验。在当下AI工具良莠不齐的环境下,我们希望用第一手的使用体验,为听众们踩坑避雷,节省宝贵的时间和金钱成本。 在AI企业市场领域有丰富经验的某高老师,还为大家解读To...
Published 11/07/24
Published 11/07/24