DeepSeek-R1在多项数学和推理基准测试中,都击败了OpenAI o1等业界领先的人工智能模型。不论在能力、成本、开放性等各个指标,DeepSeek都在挑战着西方人工智能巨头。

他大胆的愿景奏效了。

公司最初只有1万块英伟达H100晶片

一直为美国总统特朗普提供建议的硅谷风险投资家安德森(Marc Andreessen)于上星期五(24日)在社交平台X发布贴文说:“Deepseek-R1是我见过最惊人、最令人印象深刻的突破之一。”

因此,DeepSeek必须想出更有效的方法,来训练它的人工智能模型。

DeepSeek最让市场大跌眼镜的是,它能够在无需花费同等费用的情况下,构建一个类似OpenAI的ChatGPT。DeepSeek公开它大概需要花费560万美元,来构建它的人工智能模型。

两年后的今天,DeepSeek爆红了。

DeepSeek的成功对原本被追捧的晶片巨头英伟达(Nvidia)、超微(Advanced Micro Devices)、博通公司(Broadcom Inc)、Marvell Technology Inc等到底意味着什么?

他说,即使你要我找,我也找不到创建DeepSeek的商业理由。因为从商业的角度,这不值得做,基础科学研究的投资回报率很低。当OpenAI的早期投资者给它钱时,他们肯定也没有考虑自己会获得多少回报。相反的,他们是真的很想做这件事。

对美国晶片出口管制带来挫折

美国政府是在2022年10月开始对高科技晶片实施出口管制,严格限制中国人工智能公司获得像英伟达H100等尖端晶片。梁文锋向媒体承认,这确实给DeepSeek带来了问题。虽然该公司一开始储备了1万块英伟达H100晶片,但是它需要更多的晶片才能与OpenAI和Meta Platforms等公司竞争。

多年来,High-Flyer一直在储备图形处理器(Graphics Processing Unit,简称GPU)并构建Fire-Flyer超级电脑来分析财务数据。然后,在2023年,也拥有电脑科学硕士学位的创办人梁文锋决定将基金的资源投入一家名为DeepSeek的新公司,开发自己的人工智能模型。

认知被颠覆,造成不安与惊慌是正常的。很明显的是,整个华尔街也接受不了DeepSeek的突然成功。

梁文锋去年曾向中国媒体说过,他转换跑道的决定是出于对科学的好奇心,而不是渴望盈利。

DeepSeek最后最重要的一步,就是它愿意免费与公众分享这些创新,因此它迅速在全球人工智能研究界赢得了相当大的好感。

在中美科技冷战期间,美国对出口的严厉管制,严重地限制了中国科技公司利用“西方的科技”在人工智能领域竞争的能力。这些中国科技公司无法通过购买更多高科技晶片,来培训无限扩大的人工智能模型。基于此,许多中国人工智能相关企业都只能专注在下游应用,而不是建立自己的人工智能模型。

而人工智能开发商Anthropic首席执行官阿莫代(Dario Amodei)去年提到的构建模型成本则是在1亿美元至10亿美元之间。美国的各个大型科技公司每年花费数百亿美元的资本支出,大部分也是专门用在人工智能基础设施上。

从更大的角度来看,这场中美科技冷战现在已经不是一面倒。

市场投资者对人工智能泡沫破灭的担忧,导致纳斯达克综合指数在这一天下挫3.07%。整个股市对DeepSeek的反应,引发投资者对过度炒作的人工智能投资周期的怀疑,也不禁开始质疑人工智能巨额投资的效率。

DeepSeek已经颠覆了这方面的认知。

晶片巨头英伟达股价星期一(1月27日)溃败,猛跌17%至118.58美元,市值一夜蒸发近6000亿美元(约8072亿新元)。(法新社)

到底DeepSeek是怎样的一家公司?它的创始人梁文锋又是谁?

延伸阅读

美国总统特朗普是否会加速之前宣布的Stargate数据中心发展计划?是否能更快地拉到各个大巨头至少投资5000亿美元在Stargate?

若把这次DeepSeek的成功形容为人工智能的黑天鹅事件,其实一点也不为过。

他们使用一系列工程技巧优化了模型架构,如:晶片之间的通信方案、减少字段以节省内存,以及创新地使用模型混合方法等。其中许多方法都不是什么新做法,但是把这些工程技巧结合在一起,它产生的尖端模型竟是了不起的。

谁是梁文锋?

成本的差距令人震惊。

DeepSeek是在1月20日发布了一个开源人工智能模型,而且免费供人使用。这个模型迅速成为硅谷的热门话题。

就是这股“想做”的冲劲,今天的DeepSeek不仅能脱颖而出,而且还是中国唯一一家不依赖百度、阿里巴巴或字节跳动等科技巨头融资的领先人工智能公司之一。其独立性,不言而喻。

梁文锋原本是中国量化对冲基金的创始人。约两年前,他决定投身人工智能领域。当时他拿着1万块英伟达(Nvidia)晶片,组建了一支年轻、雄心勃勃的人才团队。

DeepSeek的出现,也许会连原本对Stargate有意见的全球首富马斯克(Elon Musk)也改变初衷。

这些公司的市值应该是反映它们未来几年由人工智能驱动的业绩。但是现在按这种理解还合理吗?这些科技巨头对人工智能的高额资本支出还是正确的吗?

其实DeepSeek在中国人工智能行业,是个非常另类的人工智能初创公司。它最初是中国表现最好的量化对冲基金之一,也就是High-Flyer的深度学习研究分支,名为Fire-Flyer。

这个对冲基金成立于2015年,并迅速在中国声名鹊起,成为首支募集资金超过1000亿元人民币(约185亿5600万新元)的量化对冲基金。不过自2021年以来,这个数字已降至80亿美元(约107亿5400万新元)左右。

当然DeepSeek的突然冒起,也会给美国目前专门对准人工智能资源的出口管制带来挫折。因为现在中国人工智能的发展已经不受限于高端晶片的多寡了。

中国人工智能初创公司深度求索(DeepSeek)不仅轰动美国硅谷,更在星期一(1月27日)让华尔街股市掀起大海啸,引发科技股大暴跌,而晶片巨头英伟达(Nvidia)股价当天溃败,猛跌17%至118.58美元,市值一夜蒸发近6000亿美元(约8072亿新元)。

肯定的是,DeepSeek的出现,将促使美国超大规模科技企业更迫切地要利用它们的关键优势,也就是它们拥有的高端科技晶片,来扩大他们与DeepSeek的距离。

也许从这点来看,这些美国科技巨头今后可能会更需要像英伟达和博通公司的晶片。