品玩5月28日讯,据 AIBASE 报道,快手近日正式开源其自研的30B级多模态大模型Keye-VL-2.0-30B-A3B。该模型首次将DSA(DeepSeek Sparse Attention)稀疏注意力机制引入多模态场景,成功支持256K超长上下文,实现了对小时级视频的毫秒级时序推理。
Keye-VL-2.0具备强大的时序因果推理能力,能够在连续的时序流动中捕捉画面背后的逻辑链条,实现从“看见画面”到“读懂因果”的跨越。在TimeLens基准测试中,其视频动作定位与高光提取等核心指标均超越了Gemini-2.5-Pro和Gemini 3 Flash。此外,该模型首次解锁了Code、Tool、Search等Agent协作机制,推动模型从被动的“观察者”进化为能解决复杂任务的“行动者”。
目前,该模型的权重与部署文档已全面开源。开发者可通过Hugging Face、ModelScope及GitHub获取,并支持使用Docker快速部署及调用兼容OpenAI协议的API服务。
