配资炒股经验 阿里巴巴登顶全球开源模型!
2025-05-034月29日,阿里巴巴开源了备受期待的新一代通义千问模型Qwen3(简称千问3),在GPQA、AIME24/25、LiveCodeBench等多个权威基准测试中全面超越R1、OpenAI-o1等全球顶尖模型,表现出极具竞争力的结果,登顶全球开源模型。 其中,在奥数水平的AIME25测评中,千问3获得81.5分,刷新开源纪录;在考察代码能力的Live Code Bench测评中,千问3突破70分大关,表现超过Grok3;在评估模型人类偏好对齐的Arena Hard测评中,千问3以95.6分超越Op