智东西 8 月 2 日报道,在 AI 技术飞速发展的当下,竞争与创新的浪潮正以前所未有的速度席卷整个行业。就在刚刚,知名 AI 大模型评测平台 Chatbot Arena 公布了最新榜单,这一消息瞬间吸引了全球 AI 领域从业者和爱好者的目光。

在大语言模型总榜中,阿里的 Qwen3-235B-A22B-Instruct-2507 表现惊艳,一举位列第三。月之暗面的 Kimi-K2-0711-preview 以及深度求索的 DeepSeek-R1-0528 也毫不逊色,二者并列为总榜第五。值得注意的是,这几款开源模型的成绩超越了如 Claude 4、GPT-4.1 等顶尖闭源模型,彰显出中国开源大模型在全球舞台上的强劲实力。
多模态大模型领域同样精彩纷呈。字节跳动的图像生成模型 Seedream-3 在文生图榜中位列第五,其在图像生成方面的技术优势得以凸显。字节的图像编辑模型 Seededit-3.0、开源统一多模态基础模型 BAGEL,以及阶跃星辰的开源图像编辑模型 Step1X-Edit,分别在图像编辑榜中占据第五、第七、第八的位置,展示了中国在多模态技术方面的多元探索与创新成果。
在 7 月 30 日公布的 Chatbot Arena 编程榜单里,深度求索的 DeepSeek-R1-0528 与阿里的 Qwen3-Coder 并列第一,月之暗面的 Kimi-K2-Instruct 位列第七。这一结果不仅反映出中国开源模型在编程能力上的卓越表现,更预示着在软件开发、代码生成等实际应用场景中,中国 AI 技术将发挥越来越重要的作用。
值得一提的是,阿里 Qwen3-235B-A22B-Instruct-2507、阿里 Qwen3-Coder、月之暗面 Kimi K2 等表现出色的模型,均是在 7 月最新发布的开源模型。赶在 7 月收尾、8 月开头的关键时刻,中国 AI 大模型领域依旧保持着紧锣密鼓的上新节奏。字节跳动、阶跃星辰、阿里、月之暗面等行业重要参与者,近两天接连公布模型新动作,持续为中国 AI 开源生态注入新的活力。
就在周四晚,字节跳动 Seed 团队发布了实验性扩散语言模型 Seed Diffusion Preview,阶跃星辰开源了基础大模型 Step3。紧接着在周五,阿里开源了 “甜品级” 编程模型 Qwen3-Coder-30B-A3B-Instruct,月之暗面发布了 kimi-k2 的高速版 kimi-k2-turbo-preview。这些密集的发布行动,充分展示了中国 AI 企业和研究机构对技术创新的执着追求以及强大的研发实力。

此外,Hugging Face 在周五发布了中国 AI 社区 7 月重点,对这一个月来令人目不暇接的开源浪潮进行了全面回溯。其中涵盖的 7 月 31 个亮眼开源模型、1 个框架、1 个数据集,来自 16 家企业、高校或研究机构,它们分别是阿里(9 个)、月之暗面(2 个)、智谱(2 个)、阶跃星辰(1 个)、字节跳动(2 个)、昆仑万维(2 个)、智源研究院(1 个)、中国电信人工智能研究院(1 个)、蚂蚁集团(4 个)、快手(1 个)、捏 Ta(1 个)、磐石(3 个)、上海交通大学(1 个)、腾讯(1 个)、上海人工智能实验室(1 个)、复旦大学(1 个)。具体如下:
- 阿里(9 个):推出了编程模型 Qwen3-Coder-30B-A3B-Instruct、Qwen3-Coder-480B-A35B-Instruct,深度思考模型 Qwen3-30B-A3B-Thinking-2507、Qwen3-235B-A22B-Thinking-2507,基础模型 Qwen3-235B-A22B-Instruct-2507、Qwen3-30B-A3B-Instruct-2507,CoT 音频模型 ThinkSound,统一视频生成模型 Wan2.2-TI2V-5B,文生视频模型 Wan2.2-T2V-A14B。阿里在 AI 开源领域的频繁动作和多元布局,充分展现了其作为行业领军者的技术实力与创新活力。
- 月之暗面(2 个):发布了 MoE 基础模型 Kimi-K2-Base,以及与 Numina 团队联合研发的数学定理证明模型 Kimina-Prover-72B。月之暗面的这些成果,进一步丰富了中国 AI 开源生态在基础模型和专业领域模型方面的资源。
- 智谱(2 个):带来了多模态大模型 GLM-4.1V-9B-Thinking 和基础模型 GLM-4.5。智谱 AI 在模型研发上的持续投入,为推动 AI 技术在多模态和基础能力方面的发展做出了积极贡献。
- 阶跃星辰(1 个):开源了基础模型 Step3,为行业提供了新的基础技术支撑,有助于推动相关领域的技术创新和应用拓展。
- 字节跳动(2 个):推出智能体模型 Tar-7B 和多语言翻译模型 Seed-X-Instruct-7B。字节跳动凭借在不同领域的模型创新,不断拓展 AI 技术的应用边界,为全球用户带来更多可能。
- 昆仑万维(2 个):发布了多模态推理大模型 Skywork-R1V3-38B 和多模态统一模型 Skywork-UniPic-1.5B。昆仑万维在多模态技术上的深入探索,为实现更加智能、全面的人机交互体验奠定了基础。
- 智源研究院(1 个):开发了文生配音视频框架 MTVCraft,为视频内容创作领域带来了新的技术手段和创作思路。
- 中国电信人工智能研究院(1 个):推出 AI-Flow-Ruyi-7B-Preview0704,展示了电信行业在人工智能领域的技术探索和实践成果。
- 蚂蚁集团(4 个):开源了多模态推理模型 M2-Reasoning,多模态大模型 Ming-Lite-Omni-1.5,金融训练数据集 Agentar-DeepFinance-100K,交互式深度推理模型 KAG-Thinker-en-ch-7b-instruct。蚂蚁集团在金融科技与 AI 融合方面的成果,对于推动金融行业的智能化发展具有重要意义。
- 快手(1 个):研发了自适应思考模型 KAT-V1-40B,体现了快手在 AI 技术与自身业务场景深度融合方面的努力,为内容创作和推荐等业务提供了更强大的技术支持。
- 捏 Ta(1 个):推出动漫风格图像生成模型 Neta-Lumina,满足了特定领域对于图像生成的个性化需求,为动漫产业的发展提供了新的技术工具。
- 磐石(3 个):发布了科学基础大模型 S1-Base-671B、S1-Base-8B、S1-Base-32B,为科学研究领域提供了重要的基础模型支持,有助于加速相关科研工作的进展。
- 上海交通大学(1 个):研发了端侧原生大模型 SmallThinker-4BA0.6B-Instruct,在端侧设备的 AI 应用方面取得了重要突破,为智能终端设备的智能化升级提供了新的解决方案。
- 腾讯(1 个):推出 3D 世界生成模型 HunyuanWorld-1,展现了腾讯在 3D 内容生成领域的技术实力,有望为游戏、虚拟现实等行业带来新的发展机遇。
- 上海人工智能实验室(1 个):开发了科学多模态大模型 Intern-S1,为科学研究中的多模态数据分析和处理提供了有力的工具,促进了科学研究与 AI 技术的深度融合。
- 复旦大学(1 个):推出语音生成模型 MOSS-TTSD-v0.5,在语音合成技术方面取得了新的进展,为智能语音交互等应用场景提供了更优质的解决方案。
此前,Hugging Face 趋势榜前十曾被华人团队包揽。在如今的最新榜单中,华人团队依旧占据前十中的 8 席,其中智谱占 2 席、腾讯占 1 席、阿里占 4 席、AI 大神李沐的美国创业公司 BosonAI 占 1 席。从最新的 Hugging Face 趋势榜 TOP100 中,可以梳理出其中的中国 AI 开源团队名单,主要有 14 家企业及独立研究机构,分别是智谱、腾讯、阿里、上海人工智能实验室、月之暗面、阶跃星辰、捏 Ta、昆仑万维、小红书、字节跳动、蚂蚁集团、深度求索 DeepSeek、快手、智源研究院,还有上海交通大学(SmallThinker)、复旦大学(与阶跃星辰合作 OmniSVG)、香港城市大学(PusaV1)等高校。
此外,智象未来(HiDream)、美团(MeiGen)、群核科技(SpatialLM)、百度(ERNIE)、稀宇科技(MiniMax)、磐石(ScienceOne)、面壁智能(MiniCPM)等企业的模型虽在最新趋势榜 100 名开外,但它们同样是中国开源 AI 生态的重要力量。加起来,积极拥抱 AI 开源的中国企业,超过 20 家。
尤其是阿里,堪称无人争锋的头号 “卷王”,其开源频率直接断层。在 7 月,阿里先后开源了音频模型 ThinkSound、多模态推理模型 HumanOmniV2、编程模型 Qwen3-Coder(480B-A35B-Instruct)、推理模型 Qwen3-235B-A22B-Thinking-2507、Qwen3-30B-A3B-Thinking-2507、基础模型 Qwen3-235B-A22B-Instruct-2507(非思考版)、电影级视频模型 Wan2.2、编程模型 Qwen3-Coder-Flash(30B-A3B-Instruct),并将新模型背后的 GSPO 新算法公开。这种高密度的开源行动,不仅展示了阿里强大的技术储备,更体现了其推动 AI 开源生态发展的决心与担当。
以下是位列最新 Hugging Face 趋势榜 TOP100 中的中国企业、独立研究机构及上榜模型:
- 智谱(7 个):GLM-4.5、GLM-4.5-Air、GLM-4.5-FP8、GLM-4.5-Base、GLM-4.5-Air-FP8、GLM-4.1V-9B-Thinking、GLM-4.5-Air-Base。智谱 AI 通过不断优化和拓展模型系列,为用户提供了多样化的选择,满足了不同场景下的应用需求。
- 腾讯(3 个):HunyuanWorld-1、Hunyuan3D-2.1、X-Omni-En。腾讯在 3D 和多模态领域的模型布局,有助于其在游戏、社交等核心业务中实现更丰富的用户体验和创新应用。
- 阿里(18 个):Qwen3-30B-A3B-Instruct-2507、Qwen3-Coder-480B-A35B-Instruct、Qwen3-Coder-30B-A3B-Instruct、Qwen3-235B-A22B-Thinking-2507、Wan2.2-TI2V-5B、Wan2.2-T2V-A14B、Qwen3-30B-A3B-Thinking-2507、Wan2.2-I2V-A14B、Qwen3-235B-A22B-Instruct-2507、Wan2.2-TI2V-5B-Diffusers、Owen3-30B-A3B-Instruct-2507-FP8、Wan2.2-T2V-A14B-Diffusers、Wan2.2-I2V-A14B-Diffusers、Qwen3-Coder-480B-A35B-Instruct-FP8、Qwen3-0.6B、Qwen3-235B-A22B-Thinking-2507-FP8、Qwen3-30B-A3B、Qwen3-8B。阿里丰富的上榜模型涵盖了多种类型和参数规模,全面展示了其在 AI 模型研发上的广度和深度。
- 上海人工智能实验室(2 个):Intern-S1、Intern-S1-FP8。该实验室的模型成果在推动人工智能技术在科研、产业等领域的应用方面具有重要价值。
- 月之暗面(1 个):Kimi-K2-Instruct。月之暗面的这款模型凭借其在特定领域的出色性能,在趋势榜中占据一席之地。
- 阶跃星辰(2 个):Step3、OmniSVG(与复旦大学合作)。阶跃星辰与高校的合作成果,体现了产学研结合在推动 AI 技术创新中的积极作用。
- 捏 Ta(1 个):Neta-Lumina。捏 Ta 的动漫风格图像生成模型满足了特定用户群体对于个性化图像创作的需求。
- 昆仑万维(1 个):Skywork-UniPic-1.5B。昆仑万维的这款模型在多模态统一方面的探索,为相关领域的发展提供了新的思路和方法。
- 小红书(1 个):dots.ocr。小红书的模型成果在图像识别和文字提取等方面具有一定的应用价值,与平台的内容创作和管理需求紧密结合。
- 字节跳动(1 个):Seed-X-PPO-7B。字节跳动的模型在语言处理和智能交互等方面不断创新,为用户带来更智能的体验。
- 蚂蚁集团(1 个):Ming-Lite-Omni-1.5。蚂蚁集团的模型在金融多模态和推理等方面具有独特优势,为金融科技的发展提供了有力支持。
- 深度求索 DeepSeek(2 个):DeepSeek-R1、DeepSeek-R1-0528-Qwen3-8B。深度求索的模型在多模态理解与生成等方面表现出色,受到了广泛关注。
- 快手(1 个):KAT-V1-40B。快手的模型为其内容创作和推荐系统提供了强大的技术支撑,有助于提升用户体验和平台竞争力。
- 智源研究院(1 个):bge-m3。智源研究院的模型成果在推动 AI 技术的基础研究和应用拓展方面发挥了积极作用。
上榜的还有一些知名个人开发者,比如 Kijai,虽然无法确定国籍,但从其密集选用国产模型的动作来看,大概率是华人。此外,unsloth、Comfy-Org、bullerwins、QuantStack、Phr00t、英伟达等海外团队位列趋势榜前 100 的模型,不少都选用阿里 Qwen3、阿里 Wan2.2、智谱 GLM-4.1V 等模型作为底模进行微调、蒸馏或量化。这一现象充分表明,中国开源模型在全球范围内已经具备了较强的影响力和吸引力,成为了众多开发者进行二次开发和创新的重要基础。
在展现受欢迎程度的 “Most likes” 榜中,最后一次更新停留在今年 3 月份的旧版 DeepSeek-R1 依旧稳居第一。不过,最受欢迎榜 TOP10 中,其他 9 席都是海外开源项目。尽管如此,中国开源模型在过去一段时间里取得的成绩有目共睹,众多优秀模型的涌现为行业发展注入了强大动力。期待在未来,中国开源模型能够继续保持创新的势头,不断追赶并超越,在全球 AI 开源领域取得更多的突破性进展,为推动人工智能技术的普及和应用做出更大的贡献。