4月3日消息,据透露,阿里巴巴计划在2025年4月的第二周发布全新模型Qwen3,这款模型预计将成为2025年上半年阿里最重要的技术产品之一。消息还指出,随着DeepSeek-R1的发布,阿里云基础模型团队的策略重心进一步向增强模型的推理能力倾斜。
在去年9月19日举行的2024云栖大会上,阿里云CTO周靖人发布了通义千问新一代开源模型Qwen2.5。这款模型在多轮对话和复杂任务处理能力上得到了显著提升,生成质量和逻辑连贯性也有了明显的改善。值得一提的是,Qwen2.5-72B-Instruct版本在Chatbot Arena盲测中排名全球前十,成为首个进入该榜单的中国模型,标志着中国在AI模型领域的重要进展。
根据公开信息,自2023年8月以来,阿里云陆续开源了Qwen、Qwen1.5、Qwen2和Qwen2.5等四代模型。这些模型涵盖了从0.5B到110B的全尺寸,并包括大语言、多模态、数学和代码等多种模态。这些技术进步不仅展示了阿里在AI领域的雄厚实力,也为行业的发展提供了更多的选择和可能性。(宜月)
文章总结
总的来说,阿里巴巴在AI模型领域的持续创新和发布新产品,显示了其在技术前沿的持续探索和不断突破。Qwen3的即将发布以及此前Qwen2.5在全球范围内的成功,进一步巩固了阿里在全球AI技术领域的重要地位。未来,随着更多创新模型的推出,我们有理由期待阿里巴巴在AI领域带来更多令人瞩目的成就。