21世纪经济报道记者 袁思杰 香港报道
春节期间,一场“中国AI地震”席卷全球科技圈。
DeepSeek发布的全新人工智能模型 R1,引发了全球范围内的关注和讨论。作为一款主打低成本、高效率的AI语言模型,R1的性能在某些垂直领域已接近甚至媲美OpenAI的ChatGPT-4。更令人瞩目的是,DeepSeek宣称其模型训练成本仅为同类大模型的1/10。
R1发布后,美国科技股大幅波动:英伟达股价暴跌近17%,单日市值蒸发高达5888亿美元,创下美股史上单日市值蒸发新纪录。“木头姐”凯西·伍德也在公开访谈中坦言:“DeepSeek的低成本模式可能颠覆硅谷的算力霸权逻辑。”
同时,DeepSeek已展现出商业化势能:上线18天全球下载量突破1600万次,日活用户超2000万,推动亚马逊Bedrock、微软Azure和华为昇腾云争相接入其模型服务。
DeepSeek是怎样在算力不足的情况下实现低成本训练的?开源大模型的模式是否可以打破巨头垄断?低成本训练反而会引起算力需求激增吗?哪种AI商业化路径更具长期竞争力?AI浪潮下普通人如何自我提升?
围绕这些问题,三七二十一节目邀请到了豆神集团副总裁兼任CTO阎鹏、快思慢想研究院院长和原商汤智能产业研究院创始院长田丰,以及知名科技博主(海宁科技观)陈海宁,共同探讨这些话题!
Show Notes:
03:50 DeepSeek通过架构创新实现低成本训练
04:28 强化学习比重提升使DeepSeek大模型更强大
07:50 2025年是AI大模型的“成本年”
09:20 中国AI技术社区的发展需建立本土技术站
10:00 DeepSeek的成功让资本重新重视开源模型的潜力
12:03 开源模型在企业应用中有技术门槛
14:04 DeepSeek坚持开源策略旨在建立中国AGI技术社区和创新技术站、减少对美国的依赖
16:38 AI大模型开源的好处在于共享成果和共建提升
21:55 随着算力需求持续增长和成本降低,大模型应用和服务普及是必然过程
23:02 AI发展对算力需求只会加速
24:10 “DeepSeek时刻”让AI迈向通用化技术时代
25:52 “成本拐点”:市场规模和产品成本成反比
29:25 AI浪潮已改变普通人的工作和生活
30:30 应尽早使用AI工具提高效率,同时提高数字化教育程度
33:17 AI普及将如智能手机般融入生活,带来商业机会
37:56 进行AI技能学习,建议打基础、学习思维方法以应对AI浪潮
43:31 教育和医疗可能成为AI应用最早爆发领域,服务业可实现规模化和高质量发展
48:03 AI将在互联网、软件、服务业和硬件四方向推进商业化,科研是关键
站长:乡村生活网;联系电话:023-72261733 ;微信/手机:18996816733;邮箱:2386489682@qq.com;
办公地址:涪陵区松翠路23号附12;