2024.11.01 每日AI论文 | 稀疏自编码器提升图像模型可解释性，梯度视角揭示LLMs层级差异。 - Listen -

2024.11.01 每日AI论文 | 稀疏自编码器提升图像模型可解释性，梯度视角揭示LLMs层级差异。

Listen now

Description

本期的 11 篇论文如下： [00:27] 🔍 Unpacking SDXL Turbo: Interpreting Text-to-Image Models with Sparse Autoencoders（解构SDXL Turbo：使用稀疏自编码器解释文本到图像模型） [01:05] 🧠 What Happened in LLMs Layers when Trained for Fast vs. Slow Thinking: A Gradient Perspective（LLMs训练中快速与慢速思考的层级差异：梯度视角） [01:43] 🔍 A Pointer Network-based Approach for Joint Extraction and Detection of Multi-Label Multi-Class Intents（基于指针网络的多标签多类别意图联合提取与检测方法） [02:23] 🔄 Constraint Back-translation Improves Complex Instruction Following of Large Language Models（约束反向翻译提升大型语言模型复杂指令遵循能力） [02:59] 📄 Language Models can Self-Lengthen to Generate Long Texts（语言模型能够自我延长以生成长文本） [03:35] 📊 BenchX: A Unified Benchmark Framework for Medical Vision-Language Pretraining on Chest X-Rays（BenchX：胸部X光片医学视觉-语言预训练统一基准框架） [04:17] 💾 BitStack: Fine-Grained Size Control for Compressed Large Language Models in Variable Memory Environments（BitStack：在可变内存环境中压缩大型语言模型的细粒度大小控制） [05:04] 🤖 Navigating the Unknown: A Chat-Based Collaborative Interface for Personalized Exploratory Tasks（探索未知：基于聊天的个性化探索任务协作界面） [05:40] 🤖 SelfCodeAlign: Self-Alignment for Code Generation（自代码对齐：代码生成中的自对齐方法） [06:18] 🎥 DELTA: Dense Efficient Long-range 3D Tracking for any video（DELTA：高效密集长程3D视频追踪） [06:57] 🎥 Learning Video Representations without Natural Videos（无需自然视频即可学习视频表示）【关注我们】您还可以在以下平台找到我们，获得播客内容以外更多信息小红书: AI速递

More Episodes

See all »

2024.11.21 每日AI论文 | 4比特注意力加速显著，视频生成基准全面评估。

本期的 8 篇论文如下： [00:28] ⚡ SageAttention2 Technical Report: Accurate 4 Bit Attention for Plug-and-play Inference Acceleration（SageAttention2技术报告：用于即插即用推理加速的精确4比特注意力机制） [01:10] 📹 VBench++: Comprehensive and Versatile Benchmark Suite for Video Generative Models（VBench++：全面且多功能的视频生成模型基准套件） [01:51] 🎮...

Published 11/21/24

2024.11.20 每日AI论文 | 图像生成加速，语言模型数据集创新

本期的 7 篇论文如下： [00:33] ⚡ Continuous Speculative Decoding for Autoregressive Image Generation（自回归图像生成的连续推测解码） [01:14] 📚 RedPajama: an Open Dataset for Training Large Language Models（红睡衣：用于训练大型语言模型的开放数据集） [01:58] 🤖 Soft Robotic Dynamic In-Hand Pen Spinning（软体机器人动态手内笔旋转） [02:39] 🚀 ITACLIP: Boosting...

Published 11/20/24

HuggingFace 每日AI论文速递

Published 11/20/24