圖:阿里雲發布並開源全新推理模型通義千問QwQ-32B。
阿里巴巴(09988)旗下阿里雲宣布,發布並開源全新的推理模型通義千問「QwQ-32B」,通過強化學習,在數學、代碼及通用能力上實現提質,強調整體性能比肩DeepSeek-R1。
阿里雲表示,在保持強勁性能的同時,千問QwQ-32B還大幅降低部署使用成本。
據了解,千問QwQ-32B模型中集成與智能體Agent相關的能力,讓其能夠在使用工具的同時進行批判性思考,並根據環境反饋來調整推理過程。
通義團隊表示,未來將繼續探索將智能體與強化學習的集成,以實現長時推理,探索更高智能進而最終實現通用人工智能(AGI)的目標。