
据报道,DeepSeek拟募资最高500亿元人民币,这将成为中国人工智能公司有史以来最大的一轮融资。此次融资也促使DeepSeek加速落地营收规划、推进商业化盈利。知情人士称,DeepSeek近期已向部分投资者表示,计划加快大模型迭代发布节奏,向行业主流看齐。其中一位知情人士透露,公司计划在6月推出V4模型的迭代版本V4.1。
事实上早在4月18日,有关DeepSeek正启动首次外部融资的消息便在业内持续传播,报道称DeepSeek计划募资≥3 亿美元,估值≥100 亿美元。到了4月22日,又有消息称,腾讯和阿里正在洽谈投资DeepSeek,DeepSeek目前正寻求以超过200亿美元估值筹集资金。5月6日有报道称,国家集成电路产业投资基金正与DeepSeek洽谈主导其首轮外部融资,企业投后估值有望达到450亿美元左右。而此次报道透露本轮融资完成后,含募资额在内,DeepSeek整体估值或将突破500亿美元,投后预期估值大幅攀升,远超最初超100亿美元的预期。
公开资料显示,DeepSeek成立于2023年7月,由量化资管巨头幻方量化孵化。天眼查信息显示,4月27日,杭州深度求索人工智能基础技术研究有限公司(DeepSeek)注册资本发生变更,由1000万元增加至1500万元,增幅50%。其中,DeepSeek创始人梁文锋认缴的注册资本由10万元增加500万元,达到510万元,直接持股比例由1%升至34%。宁波程恩企业管理咨询合伙企业(有限合伙)持股比例由99%下降至66%。此次变化后,梁文锋通过宁波程恩企业管理咨询合伙企业(有限合伙)等,以间接、直接方式持有DeepSeek约84.29%股权。
此前梁文锋始终将“技术独立性”放在首位,曾多次公开强调不愿被资本裹挟,因此成立以来,即便面对国内外顶级投资机构的橄榄枝,也始终坚决拒绝。这种理想主义让DeepSeek做出了惊艳的产品,迭代出DeepSeek LLM、DeepSeek-V2、DeepSeek-V3、DeepSeek-R1、DeepSeek-V3.2、DeepSeek-V4等多款具备里程碑意义的基础模型。
4月24日,DeepSeek放出了V4预览版,并同步开源。DeepSeek-V4拥有百万字超长上下文,在Agent能力、世界知识和推理性能上均实现国内与开源领域的领先。DeepSeek-V4开创了一种全新的注意力机制,在token维度进行压缩,结合DSA稀疏注意力(DeepSeek Sparse Attention),实现了全球领先的长上下文能力,并且相比于传统方法大幅降低了对计算和显存的需求。(一百万)上下文将是DeepSeek所有官方服务的标配。同时,DeepSeek-V4针对 Claude Code 、OpenClaw、OpenCode、CodeBuddy等主流的Agent产品进行了适配和优化,在代码任务、文档生成任务等方面表现均有提升。
在DeepSeek-V4系列发布期间,华为昇腾、寒武纪、海光信息、摩尔线程、沐曦股份、昆仑芯、平头哥真武等多家国产AI芯片宣布适配DeepSeek-V4。高盛发布分析报告称,DeepSeek-V4的核心意义在于以更低成本支持更复杂的智能体应用落地,从而打开AI应用规模化的新空间。
然而,在基础模型领域,人才甚至是比算力、数据更稀缺的资源。DeepSeek因为长期不融资导致了一定的人才流失,细数那些从DeepSeek出走的核心开发人员,包括Fuli Luo(罗福莉)2025年加入小米担任小米Mimo实验室负责人。她主导研究的MiMo-V2系列模型Token消耗量一度在OpenRouter平台今年3月的周榜中位列第一;Bingxuan Wang(王炳宣)2025年末加入腾讯混元团队;Daya Guo(郭达雅)2026年加入字节跳动Seed实验室担任Agent(智能体)负责人之一;Chong Ruan(阮翀)2026年加入智能驾驶公司元戎启行任首席科学家,主导基座模型开发。因此有分析认为,DeepSeek此次融资的首要目标是确立市场化估值,让期权可量化、可预期,稳住剩余核心团队。
本文转自媒体报道或网络平台,系作者个人立场或观点。我方转载仅为分享,不代表我方赞成或认同。若来源标注错误或侵犯了您的合法权益,请及时联系客服,我们作为中立的平台服务者将及时更正、删除或依法处理。
