风险提示:本平台信息来源于大数据及网络,包括AI及网友发布,内容不完全属实。仅供学习研究,不构成投资依据,请投资者注意风险,据此交易盈亏自负。

快讯图标 阿里Qwen3.5即将开源,混合注意力机制引关注

⚠️ 风险提示:本站内容来源于互联网,不代表平台观点,请独立判断和决策,市场有风险,据此操作风险自担。

近日,全球最大人工智能开源社区HuggingFace的项目页面上出现了Qwen3.5被合并至Transformers库的PR(代码提交请求)。

据透露,该模型采用了全新的混合注意力机制,并可能是一款具备原生视觉理解能力的视觉语言模型(VLM)。部分开发者进一步发现,Qwen3.5或将开源至少两个版本:一个20亿参数的密集型模型,以及一个350亿参数的MoE(混合专家)模型。

此前,科技媒体The Information曾报道,Qwen3.5计划在春节假期期间开放源代码。2025年4月29日,阿里巴巴正式推出了新一代Qwen3模型,该模型在全球开源模型中表现突出,成为当时最强的开源模型之一。

作为国内首个支持“混合推理”架构的模型,它将快速思考与深度思考能力整合于一身,显著降低了计算资源的消耗。

风险提示:本平台信息来源于大数据及网络,包括AI及网友发布,内容不完全属实。仅供学习研究,不构成投资依据,请投资者注意风险,据此交易盈亏自负。

有话要说

请先 登录 后再发表评论。