E108|从20分迅速追到50分,国产大模型难在哪儿|AIGC特辑
Listen now
Description
4月是大模型频频迭代的一个月,也是中国大模型的集中发布期。这些模型更新迭代之后到底进化在哪儿,可能深度使用者最有发言权。本期嘉宾和他的团队也在过往的使用体验中,结合一些学术论文研究出了一套给大模型打分的标准——如果不是一个专业的技术人员,普通人也可以通过一些好玩的测试题目,区分国产大模型与GPT4到底有哪些不同。 随着越来越多的大公司与创业公司加入到国产大模型的竞争中,本期节目我们也聊了聊,除了芯片困境,国产大模型到底怎么样,以及难在哪儿? 【主播】 泓君,资深媒体人 【嘉宾】 戴雨森,真格基金管理合伙人 【你将听到】 使用体验 【03:18】大模型的使用体验:与七八年前的对话机器人很不一样 【04:51】ChatGPT 20问游戏:理解规则+二分法查找 【05:51】Midjourney:从V3到V5进化惊人,打开新的使用方式 【08:48】手工更贵,机器做的更好:原创会越来越有价值 【10:05】如何使用ChatGPT:更适合脑洞与头脑风暴 评分系统 【12:21】300个问题,如何设计出一套大模型的评分系统 【15:22】GPT4评分80分,国产模型迅速从20分追到50分 【16:43】麻辣螺丝钉与爆炒篮球,GPT的进化速度 【20:05】两个月飞速进展:从聊天机器人到GPT4到AutoGPT 【21:46】大模型也有类似于自动驾驶的五级分类 【24:10】基于大模型的创业,早创业还是晚创业谁更有优势? 国产大模型 【29:12】国产大模型格局未定,但要先造船 【32:13】大模型的终局是什么:赢家通吃?类公有云格局or百家争鸣? 【34:50】不止是A100芯片,数据、算法、架构,都需要解决 【36:59】中文互联网的数据不是问题? 【38:33】AutoGPT初印象:既震撼又忧虑 【40:43】微软可以一天训练一个GPT3,但只有它的超算才能训练GPT-4 【44:01】GPT的价值观:目前还是加州白人男性价值观 【46:38】潜在安全风险:操作选举,电话杀猪盘,垃圾信息 【49:04】OpenAI的股权结构:收益权与控制权分开 【53:00】做出OpenAI需要探索能力,第二个做更需要执行能力 【54:54】这轮AI浪潮有泡沫也有啤酒,人类最大的一轮技术革命 【57:04】未来不可预测,我所说的都是错的 【59:04】技术成熟有利于成熟创业者,新技术反而利好年轻人 【招聘】 我们团队目前正在招聘全职的播客节目监制、视频后期、商务拓展以及运营,欢迎感兴趣的小伙伴把你们的简历和代表作品发送到我们的邮箱:[email protected]。具体要求我们之后会发布在【硅谷101】的微信公众账号上,欢迎关注。 【相关资料】 真格基金的评分系统:大模型测试集Z-Bench https://mp.weixin.qq.com/s/D9xQYIw8K2OjVLBwzNtagQ 【BGM】 Cheese and Crackers 【后期】 AMEI 【在这里找到我们】 公众账号:硅谷101 收听渠道:苹果|小宇宙|喜马拉雅|蜻蜓FM|网易云音乐|QQ音乐|荔枝播客 海外用户:Apple Podcast|Spotify|TuneIn|Google Podcast|Amazon Music 联系我们:[email protected]
More Episodes
你知道每使用一次ChatGPT,OpenAI需要交多少电费吗?前阵子模型微调平台OpenPipe创始人Kyle...
Published 04/30/24
Published 04/30/24