Description
🌐 字节跳动与香港大学合作:HybridFlow框架大幅提升强化学习效率字节跳动豆包大模型团队与香港大学共同开发的HybridFlow框架,通过混合编程模型和分布式计算技术,将强化学习训练吞吐量提升至20倍,解决了大模型训练中的灵活性和性能问题。
💊 中国科学院与华西医院合作:PRnet模型助力药物发现中国科学院与四川大学华西医院开发的PRnet深度生成模型,成功预测转录对新型化学扰动的反应,推荐了233种疾病的候选药物,研究成果发表于《Nature Communications》。
🏆 Richard Sutton团队提出“奖励聚中”新思想,强化学习性能大幅提升Richard Sutton教授团队提出的“奖励聚中”新思想,通过减去平均奖励显著提升了几乎所有强化学习算法的性能,该研究入选首届强化学习会议(RLC 2024)。
🔍 OpenAI宣布ChatGPT成为AI搜索引擎,实时信息能力全面开放OpenAI宣布ChatGPT正式成为AI搜索引擎,消除了即时信息的最后短板,付费订阅者和候补名单用户可立即使用联网的实时对话信息能力。
🧠 MIT研究发现LLM几何结构与大脑功能性脑叶相似MIT研究团队发现大型语言模型(LLM)在学习概念时形成的几何结构与大脑功能性脑叶的相似性,揭示了AI系统在处理信息时自然地发展出与生物大脑相似的几何和分形结构。
🤖 中山大学与华为诺亚合作:PIVOT-R模型提升机器人复杂任务表现中山大学和华为诺亚等单位的研究团队提出的PIVOT-R模型,通过视觉-语言模型解析用户指令,指导机器人执行任务,成功率超过谷歌的RT-1模型26.6%。
🚀 清华大学交叉信息院发现data scaling laws,机器人零样本泛化能力突破清华大学交叉信息院的研究团队在具身智能领域取得突破性进展,发现了data scaling laws,使得机器人能够在零样本情况下泛化到全新场景和物体,彻底改变通用机器人的开发方式。