从春节到现在deepseek 热度不减。有几个信号包括:
1、deepseek 引爆了港股,甚至喊出了中国资产重估等等。
2、最近还得到消息,部分政府要求部署 deepseek,以及新的规划中 AI 会作为重点。
这些现象的背后逻辑是什么?今天来谈一下deepseek 核心的底层逻辑。
底层逻辑一:为什么 deepseek 会引起轰动
本质上 deepseek 解决了一个关键的问题,就是在模型效果接近OpenAI 的最新成果,并在工程和成本上高效得多,并且是开源的。
1、通过效果和工程上的创新,让业内人士看到了创新点和值得学习的地方。
2、开源一下子让模型的使用方大大拓展了。
最后的结果是 deepseek 7 天就达到了 1 亿用户。deepseek 让国内各大企业,政府都把开源的满血版部署起来了。
底层逻辑二:deepseek 为啥能带动港股上涨
这几年俄乌战争,资本为了避险,都纷纷撤出了港股,导致了港股的持续下跌。其实在之前 20~21 年海外投资者是看好中国科技的潜力,港股在持续上涨的。
deepseek让外国投资者看到了中国科技的潜力,尤其是 AI 的潜力。其实中国不仅仅有 deepseek,还有 AI 6 小龙,还有众多大厂模型方面也进步很好。虽然和美国比,还有一定的差距,但是差距是在逐步缩小,并且有很多创新的点。
除了大模型和 AI,在具身智能,机器人,无人驾驶等领域,国内众多厂商也非常先进。
另外大家会发现,在这些最热门的行业里面,美国领先的企业里面,真正负责的华人的占比也非常高。
现在网上有一种说法,说现在的高科技,其实本质上是再美国的中国人,以及在中国的中国人 PK,这种说法是有一定的道理的。
deepseek 是一个很好的窗口,让海外投资者重新认真中国企业的创新能力。
另外 deepseek 除了利好自己外,其实还有两类公司是利好的:
一类是以阿里云为代表的云公司。更多的deepseek用量,代表更大的计算资源的消耗,而这个恰好是云公司擅长的。
一类是有能力做应用的公司,以腾讯为代表。deepseek 公司的服务因为容量有限,所以让腾讯抓住了这个机会,在微信,以及独立的 App 元宝支持 deepseek 满血版。大量的用户选择了腾讯的服务。元宝也冲到了 iPhone 应用榜单下载前几位。
这两个公司的股票,最近在港股都得到了很好的验证,一个上 130,一个上 500 了,都创了最近几年的新高。
底层逻辑三:为什么这两年科技有一种井喷的感觉
应该说这两年体现的科学创新,是中国这些年来持续高校培养理工科的开花结果。说了一个大家没有意识到的数字,中国是全球程序员最多的国家。人才的基数和密度摆在这里,不出创新成果都很难。
另外,实际上在疫情前,就有一种明确的信号,国内的很多产品和服务做到比美国好,比如通讯,电商,制造等行业。
这几年贸易战加上疫情让这个一度放缓,现在本质上是又回到了正规上,更重要的是信心回来了一部分。
另外,最近几家创新的公司都出现在杭州(宇树科技,深度求索等等),也让杭州对创业者友好的治理模式受到追捧。其实核心要义就是对小公司,小团队更多的帮助。最近看到深圳等等城市都在学习杭州的模式,改善对中小公司的支持,这是一个非常大的进步。
大公司是利润,就业的高效机器,但是创新通常来自更自由,更没有负担的小公司。这个特点尤其是在高科技行业明显。相信政府更好多支持创业小公司,未来创新的潜力会更大。
底层逻辑四:AI 不是工具革命,而是科学革命的工具
最近王坚院士在世界互联网大会人工智能专委会研讨会上提了一个观点:AI不是工具革命,而是科学革命的工具。人工智能以数据为驱动、以模型为载体,正成为科学研究的加速器、技术创新的孵化器,开创了科研的新范式。
这两年,工业界大家纷纷在探索大模型怎么赋能改造业务,以及期待诞生 AI 原生应用。但是效果并不是特别显著。
大模型(大语言模型),还存在各种回答不准确,真正能比较好落地的场景是编程,搜索,知识组织等对精确性要求不高的场景。
所以大模型未必会如互联网一样,诞生一系列基于大模型的 AI 原生应用。反而有可能是因为有了大模型之后,将每个人知识和技能拔高了一个层次,然后通过促进科研工作者,知识工作者的效率,会诞生一系列更新的科研成果。大模型本身不产生革命的应用,但是会成为革命性成果都孕育的载体。
如果是这样的话,政府要求部署 deepseek 就有了意义。政府应该更积极推动大模型的使用,甚至可以承担大模型底层基础设施的建设,免费开放给更多人使用。
大模型应该像互联网一样被免费使用,这样科技创新才会出来,而不是大模型本身怎么样。
底层逻辑五:deepseek 热潮还能持续多久
deepseek 明显提高的是深度推理的能力,因此在编程,搜索,知识组织场景上有很大的提升,其他领域并没有明显的变化。所以 deepseek 产生业务价值上其实还并没有比以前的大模型更好。
估计过几个月这阵热潮就过去了,类似去年这个时候,最热的是kimi,或者大模型 6 小龙,但很快随着时间的推移,热潮就冷却了。
底层逻辑六:deepseek 这条路有没有上限
大模型最近的演进路线其实有点类似原来 AlphaGO 的发展路径一样,刚开始的时候卷数据(更大的参数,更好多数据),到现在卷模型(RL 强化学习加持),然后是卷工程成本(更低的推理成本,响应时间等等)
AlphaGO 在很好的解决了下棋这些场景之后,无法解决更复杂的的自动驾驶等场景,就慢慢销声匿迹了。
现在 OpenAI,deepseek 走的技术路线基本差不多,非常有可能在数学,编程,知识搜索几个领域做到一定程度之后也就发展不动了。
从现在看,deepseek 这条路的上限很快就能看到,期待业界有更底层的创新。
底层逻辑七:deepseek 对数据类产品的影响的判断
简单回顾一下,deepseek 实际解决的场景,数学,编程,知识搜索几个领域就会知道,deepseek 对数据类的产品帮助不大。
只有类似错误诊断,代码辅助可能会原来体验更好(因为有更好多推理能力),其他的比如 GBI等需要确定的场景作用不会太大。
总结展望
最后简单总结下,AI 浪潮估计还要持续一段时间,未来会有什么变化,以及发展到哪一步很难讲。对个人来讲,最重要的是先把 AI 工具用起来,提效当前的工作,可能创新就接踵而至了。





