Kimi开源多模态模型Kimi-VL、Kimi-VL-Thinking

来源:半导纵横发布时间:2025-04-10 16:20
大模型
生成海报

今日,月之暗面Kimi开源轻量级视觉语言模型Kimi-VL及其推理版Kimi-VL-Thinking。

按照Kimi官方的说法,其关键亮点包括基于MoE架构,总参数为16B,但推理时仅激活2.8B;具备强大的多模态推理能力(媲美参数大10倍的模型)和Agent能力;支持128K上下文窗口;采用相对较为宽松的MIT许可证。

和Qwen2.5-VL、Gemma-3等前沿开源VLM相比,Kimi-VL-Thinking仅使用2.8B激活参数即可实现强大的多模态推理。同时在一些重要基准测试中,Kimi新模型“以小博大”,超越了GPT-4o等规模更大的模型。

目前两款模型均已上架Hugging Face,分为Instruct基础版和Thinking推理版。

本文转自媒体报道或网络平台,系作者个人立场或观点。我方转载仅为分享,不代表我方赞成或认同。若来源标注错误或侵犯了您的合法权益,请及时联系客服,我们作为中立的平台服务者将及时更正、删除或依法处理。

评论
暂无用户评论