智东西(公众号:zhidxcom)




编译 | 江宇




编辑 | 李水青



智东西4月17日消息,今日,据外媒The Information报道,


DeepSeek正首次寻求外部融资,目标估值超过100亿美元(约合人民币681.8亿元)。




据多位知情人士透露,DeepSeek已开始与投资人接触,


计划融资至少3亿美元



约合人民币20.5亿元),以补充资金储备,应对AI大模型研发日益高昂的成本竞争。



如果本轮融资落地,DeepSeek将首次引入外部资本,也意味着其长期坚持的“自我供血”模式出现转变。


DeepSeek由母公司幻方量化孵化并持续输血,过去曾拒绝多家国内头部VC和科技巨头的投资邀约。




这一转向背后,一方面是


资金压力


加大,另一方面或许也与其近期的


人才流失


有关。



自2025年初,DeepSeek-R1模型爆红以来,DeepSeek尚未推出新一代模型,同时多位核心研究人员相继离开。其中,DeepSeek V3模型重要贡献者罗福莉已加入小米负责AI业务,另一位核心研究员郭达雅则跳槽至字节跳动,薪资大幅提升。



引入外部资金后,DeepSeek有望加大算力投入,继续推进前沿模型研发,同时通过更具竞争力的薪酬体系稳定核心团队。



不过,这笔融资也可能面临一定不确定性。知情人士称,部分美国投资机构在是否参与投资上态度相对谨慎。此前,美国国会曾对DeepSeek提出过相关质疑,但目前该公司并未被纳入任何美国贸易限制名单。





产品层面,DeepSeek原计划于今年2月发布下一代旗舰模型DeepSeek V4,但因工程问题多次推迟。




报道称,其团队正在投入大量精力,使模型能够直接适配


华为昇腾芯片


运行,这一调整也拖慢了进度——此前其模型主要基于英伟达芯片。



行业环境的变化同样构成压力来源。当前AI模型迭代速度持续加快,中美科技巨头凭借资金优势不断加码,对初创公司形成挤压,这也被认为是DeepSeek转向融资的重要背景。



值得一提的是,DeepSeek此前推出的R1模型曾以更低成本实现接近海外顶级模型的性能,引发市场广泛关注,并一度引起资本市场对高端AI芯片长期需求的重新审视。该模型主要基于A100、H800等上一代芯片训练完成,这些芯片原本用于其母公司幻方量化的数据训练。



另据The Information此前报道,DeepSeek正在使用英伟达最新一代Blackwell芯片训练下一代模型,不过该类芯片目前受到出口管制影响,获取存在一定限制。



来源:The Information