S3E1丨阿拉丁神灯还是潘多拉魔盒?Sora很热,但无需神化
Listen now
Description
人工智能技术的发展一日千里。2月16日,OpenAI推出文生视频模型Sora,在视频时长、场景理解和物体一致性等方面实现重大突破,再次验证Transformer架构的极强拓展性,文生视频的热潮快速席卷科技圈和资本市场,生动逼真的细节和流畅的运镜转场也给影视、创意、游戏等行业从业者带来极大震撼,甚至被市场寄予“真实世界模拟器”的期待。 另一方面,OpenAI也同时承认Sora尚存缺陷和不足,批评和质疑随之而来,例如Sora尚且无法理解复杂场景的物理原理及其因果,有观点认为围绕Sora营销与炒作远甚于其实际的技术影响力,而算力和数据量的瓶颈依然限制其商业潜力,同时虚拟视频生成技术的快速发展为监管人工智能带来新的挑战。 Sora将“颠覆”视频行业吗?市场是否又一次对Sora寄予了过高的期待?本期节目邀请华泰证券研究所科技及电子行业首席分析师黄乐平和华泰证券研究所传媒行业首席分析师朱珺,希望尽量通俗地解释Sora背后的技术原理,并客观理性地探讨Sora的技术路线可行性与商业前景。本期也是【泰度Voice】春节后的第一期节目,今年泰度将继续关注最新鲜的科技热点和最重要的产业趋势,任何你所关心的选题,欢迎在评论区给我们留言。 聊天的人 华泰证券研究所科技及电子行业首席分析师 黄乐平 华泰证券研究所传媒行业首席分析师 朱珺 《泰度Voice》主编 原瑞阳 时间轴 07:56 相对中文媒体的积极肯定,英文媒体对Sora褒贬不一 08:25 基于diffusion transformer架构,技术上不算大突破 09:09 将视觉数据转换成patches,这一路径值得肯定 11:28 transformer能够理解文字,但能否理解视频? 18:21 Sora可以帮助好的创意更容易落地 24:48 Sora出现是文生视频中重要一环,但不是终点 28:04 用魔法打败魔法,AI的监管要依靠AI工具 33:57 目前的Sora类似chatGPT2.0,正式商业化尚需时日 37:05 为什么不是YouTube背后的Google先跑出来? 41:46 OpenAI的架构面临挑战,复制其成功不易 泰度小课堂 研报:《Sora-生成式AI又一重要进展》 作者: 黄乐平 S0570521050001 | AUZ066 余熠 S0570520090002 | BNC535 发布日期:2024年2月17日 风险提示:AI 及技术落地不及预期 研报:《Sora引领AI视频生成新纪元》 作者: 朱珺 S0570520040004 | BPX711 吴珺 S0570523100001 发布日期:2023年2月19日 风险提示:竞争加剧风险;监管风险;模型技术进展不及预期 制作团队 主编:原瑞阳 项目统筹:韦晔 制作:高海博 声音设计:杨啸天、陆佳杰 节目运营:小米粒 本节目录制于2024年2月23日,本播客不保证节目播出时援引数据信息的及时、准确、完整。 法律声明 本播客不是华泰证券股份有限公司研究报告(下称”华泰证券”)的发布平台,旨在为公众提供宏观、产业、市场热点解读,不构成华泰证券开展证券投资咨询业务或提供任何的投资建议、投资分析意见。本播客不构成任何合同或承诺的基础,不因任何单纯订阅本播客的行为而将订阅人视为华泰证券客户。任何读者在订阅本播客前,请自行评估接收相关推送内容的适当性,且若使用本播客所载内容,务必寻求专业投资顾问的指导及解读。 本播客内容可能涉及华泰证券分析师对华泰证券已发布研究报告的解读,或转发、摘编华泰证券已发布研究报告的部分内容及观点,完整的分析应以报告发布当日的完整研究报告内容为准。订阅者仅使用本播客内容,可能会因缺乏对完整报告的了解或缺乏相关的解读而产生理解上的歧义。如需了解完整内容,请具体参见华
More Episodes
作为“新质生产力”的落地场景之一,人形机器人正在催生科技行业和资本市场新一轮热潮。近半年来,国内外各类原型机或产品密集亮相,一级市场投融资活跃。通用大模型的横空出世有望使人形机器人的感知决策能力被极大提升,基于transformer架构的神经网络模型被认为是打开人形机器人通用之路的关键。尽管进展显著,训练数据量级和数据质量依然是限制人形机器人技术泛化的主要瓶颈,从长期来看,行业普遍预期任务级人形机器人成熟仍需数年之久。 本期节目邀请华泰证券机械行业首席分析师倪正洋对谈华业天成执行董事陆昆仑,以非常通俗直观的方式解释算法如何训练一台通用型人形机器人,学界和业界已经有哪些进展和共识,尚存哪...
Published 04/08/24