Liquid AI推出LFM2.5-230M,实现手机端每秒213标记的超轻模型
•2 阅读•2分钟•开源
llama.cppLiquid AIFunction CallingLFM2.5-230MOn-Device Inference
•2 阅读•2分钟•开源
模型概览
Liquid AI在本次发布中提供了两套检查点:
- LFM2.5-230M‑Base:原始预训练权重,供二次微调使用。
- LFM2.5-230M:已完成指令微调的通用版本。
模型采用 LFM2 架构,拥有 14 层,其中 8 层为双门 LIV 卷积块,余下 6 层为分组查询注意力(GQA)块,旨在提升 CPU 上的推理速度。关键规格如下:
- 参数量:230 M
- 上下文长度:32 768 token
- 词表规模:65 536
- 多语言支持:包括英语、中文、阿拉伯语、日语等十余种语言
- 知识截止:2024年中
性能基准
Liquid AI 在十项基准上对模型进行了评估,核心结果如下(分数越高越好):
- IFEval:71.71,领先 Qwen3.5‑0.8B(59.94)和 Gemma 3 1B(63.49)
- IFBench:38.40,领先同类模型
- CaseReportBench(临床数据抽取):22.51,表现最佳
- MMLU‑Pro:20.25,略逊于 Qwen3.5‑0.8B(37.42),表明在广泛知识覆盖上仍有提升空间。
模型在 工具调用(Function Calling)任务上表现突出,能够在系统提示中以 JSON 形式定义工具,生成 <|tool_call_start|> 与 <|tool_call_end|> 标记之间的调用语句,再返回自然语言答案。
本文是对第三方新闻源的主观解读。消息可能出现过时、不准确、歧义或错误的地方,仅供参考使用。点击此处查看消息源。