阿里巴巴新一代基座模型 Qwen3.5 已在 HuggingFace 的 Transformers 项目中出现代码合并申请(PR),预示发布在即。
据悉,Qwen3.5采用了全新的混合注意力机制,并极有可能是一款原生支持视觉理解的 VLM 模型。目前开发者挖掘的信息显示,Qwen3.5预计将开源至少 2B 的密集模型以及 35B-A3B 的 MoE 模型。此前有消息称,该系列模型将在今年春节期间正式开源。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END

阿里巴巴新一代基座模型 Qwen3.5 已在 HuggingFace 的 Transformers 项目中出现代码合并申请(PR),预示发布在即。
据悉,Qwen3.5采用了全新的混合注意力机制,并极有可能是一款原生支持视觉理解的 VLM 模型。目前开发者挖掘的信息显示,Qwen3.5预计将开源至少 2B 的密集模型以及 35B-A3B 的 MoE 模型。此前有消息称,该系列模型将在今年春节期间正式开源。
暂无评论内容