k8凯发

02092701968

公司新闻

k8凯发 > 新闻中心 > 公司新闻

k8凯发官网野牛养生必发app下载社会新闻大众网

  • 发布时间:2025-03-08
  • 点击次数:

  3月6日,阿里通义千问大模型团队宣布,正式推出最新的推理模型QwQ-32B。

  阿里巴巴称,这是一款拥有320亿参数的模型,其性能可与具备6710亿参数(其中370亿被激活)的DeepSeek-R1媲美,但二者在参数量上相差将近20倍。

  据介绍,通过大规模强化学习,千问QwQ-32B在数学、代码及通用能力上实现质的飞跃,整体性能比肩DeepSeek-R1,同时大幅降低了部署使用成本,在消费级显卡上也能实现本地部署。

  在数学推理、编程能力和通用能力的一系列基准测试中,通义千问大模型团队将QwQ-32B与OpenAI的o1-mini以及DeepSeek满血版及蒸馏版进行了比较,结果显示,在测试数学能力的AIME24评测集上,以及评估代码能力的LiveCodeBench中,QwQ-32B表现与DeepSeek-R1相当,远胜于o1-mini及相同尺寸的R1蒸馏模型。

  据介绍,在冷启动基础上,阿里通义团队针对数学和编程任务、通用能力分别进行了两轮大规模强化学习。在初始阶段,特别针对数学和编程任务进行了强化学习训练。与依赖传统的奖励模型不同,通义千问大模型团队通过校验生成答案的正确性来为数学问题提供反馈,并通过代码执行服务器评估生成的代码是否成功通过测试用例来提供代码的反馈。

  业内人士分析,QwQ-32B的成功表明,将强大的基础模型与大规模强化学习相结合,能够在较小的参数规模下实现卓越性能,这为未来通向通用人工智能提供了可行路径。

  值得注意的是,尽管DeepSeek-R1拥有6710亿的巨型参数量,但由于DeepSeek创新性地使用了MoE(混合专家模型)架构以及MLA(多头潜在注意力机制)的方法,每次推理仅激活370亿参数(占总量的5.5%)。这使得DeepSeek-R1虽然整体很大,但实际干活时只需要动用一小部分力量,能够做到节省资源,高效完成任务。

  阿里通义团队表示,未来将继续探索将智能体与强化学习的集成,以实现长时推理,探索更高智能进而最终实现AGI的目标。

  目前,阿里已采用宽松的Apache2.0协议,将QwQ-32B模型向全球开源,所有人都可免费下载及商用,也可以通过阿里云百炼平台直接调用模型API服务。同时,用户也可通过通义APP免费体验最新的QwQ-32B模型。

  此前,2月25日,阿里通义Qwen发布基于旗舰模型Qwen2.5-Max构建的推理模型QwQ-Max-Preview预览版,支持联网搜索,会和DeepSeek以及Kimi的推理模型一样展现思考过程.

  长江证券研报指出,近期,阿里在AI领域持续发力,践行了其AI驱动战略,随着其后续投入的逐步提升,相关成果有望加速迭代,相关成果或将惠及相关产业链,加速AI应用落地,进而进一步带动算力需求的爆发。同时,随着阿里在AI基础设施、基础模型平台及AI原生应用、现有业务的AI转型等三方面加大投入,k8凯发或将引领中国AI产业加速发展。

  “轰”的一声,山地都轻颤了一下,强大的少年狈风一下子又仰躺了下去,没能起来。没有人会怀疑小不点脚部的力量。

  为保证这次军训高质量开展,在此,我代表学校对所有参训同学提出以下几点希望:

  1、我们本届毕业班工作的指导是:面向全体学生,保优生,k8凯发抓中层,促学困生;强化常规管理,正学风、抓课堂、求效率。

  02月26日,新疆举办首届乌兹别克斯坦商贸文旅合作交流会,运动会田径运动员加油广播稿 篇2,至尊赢三张,下载送38元彩金有哪些,米乐m6小罗。

  “滚!”石子陵眼睛立了起来,黄金神矛一扫,符文漫天,像是瀚海汹涌,怒击苍天。

  如山洪倒卷,似瀚海击天,这片王侯领地被乌光笼罩后,所有人口全部冲天而上,飞向那张开的巨大鸟嘴中。

  “我想去看大黑。”小清风说道,眼中有不舍与怀念,希望离开前去看一看这个最好的朋友。

  新闻信息服务许可证音像制品出版许可证广播电视节目制作经营许可证网络视听许可证网络文化经营许可证k8凯发