• 2025 年,美团开源了 LongCat-Flash-Chat 大模型,采用 MoE 架构,总参数为 560B,激活参数为 18.6B~31.3B(平均 27B)。该模型以极快的反应速度和推理能力著称,每秒可输出 100 个 token,提供几乎零延迟的体验。

    模型亮点:


    1. 极致速度
      回答速度快如闪电,每秒可输出 100 个 token,满足高效需求。
    2. 通用知识领域
      在 ArenaHard-V2 基准测试中得分 86.50,排名第二;MMLU 得分 89.71,CEval 得分 90.44,与国内顶尖模型比肩。
    3. 智能体能力
      在 τ2-Bench(智能体工具使用基准)中超越参数更大的竞品;在 VitaBench(复杂场景智能体基准)中以 24.30 的得分位列第一。
    4. 指令遵循
      在 IFEval 基准中以 89.65 的得分拿下第一名,中文指令遵循方面表现出色。

    模型特点:


    • 更轻的模型:采用 MoE 架构,激活参数平均 27B,降低计算负担。
    • 更顺的系统:优化系统设计,实现几乎零延迟的响应体验。
    • 广泛的应用:适用于通用知识领域、智能体工具使用及复杂场景处理。

    使用建议:


    • 高效应用:利用其快速响应能力,提升应用效率。
    • 持续优化:根据实际需求,持续优化模型性能。
    • 广泛测试:在不同场景下测试模型表现,确保其稳定性

Longcat官网:

https://longcat.chat/