频道：开源 - Air News

OmniVoice Studio推出本地开源语音克隆平台，实现全链路离线生成替代ElevenLabs

OmniVoice Studio是一款完全本地运行的开源桌面应用，提供语音克隆、视频配音、实时转写和说话人分离等功能，支持 646 种语言的文本转语音，无需 API 密钥、云账号或订阅费用，为用户提供高隐私的全链路离线生成方案。

Open-MM-RL多模态强化学习管线实现完整数据分析与奖励评估

MarkTechPost 今日发布了一套基于 TuringEnterprises/Open-MM-RL 数据集的完整多模态强化学习工作流。文章从数据结构、图像分布到答案类型进行全方位统计，并构建可验证的奖励函数、视觉语言模型提示模板，最终导出 GRPO‑style 数据，为后续大模型强化学习提供可靠基准。

GRPOOpen-MM-RLSmolVLM多模态强化学习

05/26 (周二)•95 阅读•1分钟•开源

腾讯开源TencentDB Agent Memory打造四层本地记忆管线，令Agent令牌消耗降超60%

腾讯近日在MIT许可证下开源TencentDB Agent Memory，提供符号化短期记忆与四层长周期记忆金字塔的本地化解决方案。该系统基于SQLite+sqlite-vec，融合BM25与向量检索，在OpenClaw和Hermes中实现，官方基准显示令牌使用下降61%，任务成功率提升逾50%。

LLMOpenClawTencentTencentDB Agent Memory

05/24 (周日)•93 阅读•1分钟•开源

SuperClaude框架打造多模式Claude工作流，提升AI开发效率

本教程展示如何在Anthropic的Claude模型之上，借助开源SuperClaude框架构建包含指令、代理、模式和会话记忆的多步骤工作流，实现从需求构思到代码实现的全链路AI辅助开发。本文还提供完整代码示例和实战案例，帮助开发者快速上手并提升Prompt的一致性与角色感知。

ClaudeAnthropicLLMSuperClaude

05/24 (周日)•61 阅读•1分钟•开源

Perplexity开源Bumblebee打造只读开发者端供应链扫描器

Perplexity供应链安全Bumblebee开发者端Go

05/23 (周六)•106 阅读•1分钟•开源

GBrain开启自连线记忆层，让AI代理永不遗忘

Garry Tan 领衔开源项目 GBrain v0.38.2.0 今日正式发布，提供基于 markdown 与本地 PGLite 的自连线记忆层。该层通过正则推理自动构建类型化知识图谱，零 LLM 调用即可实现结构化检索，为 AI 代理提供持久且可编辑的上下文记忆。

ClaudeGarry TanGBrainPGLite

05/23 (周六)•75 阅读•1分钟•开源

OpenMythos打造循环深度Transformer，MLA与GQA模型对比展示推理深度扩展

OpenMythos 在 GitHub 开源的循环深度 Transformer 实现，本文通过 Google Colab 教程构建 MLA 与 GQA 两种注意力变体，比较参数规模与循环注入矩阵的谱半径，并在合成求和任务上验证循环次数对推理深度的提升，展示了在固定参数下通过增加循环实现更强推理能力的可行路径。

MoEGQAOpenMythosMLA

05/22 (周五)•68 阅读•1分钟•开源

turbovec推出基于TurboQuant的Rust向量索引，实现16倍压缩并在ARM上超越FAISS

今日，开源项目turbovec正式发布，采用Google Research的TurboQuant算法，提供Rust实现并配备Python绑定。该索引在保持检索精度的同时实现最高16倍压缩，并在Apple M3 Max等ARM平台上比FAISS快12%至20%，为本地RAG部署打开新路径。

GoogleFAISSTurboQuantturbovec

05/21 (周四)•30 阅读•1分钟•开源

Hugging Face推出Ettin重排序模型族实现跨规模检索精度新标杆

Hugging FaceEttincross-encoderMTEBFlash Attention 2

05/19 (周二)•25 阅读•1分钟•开源

llmcompressor实现FP8、GPTQ与SmoothQuant量化，打造高效指令调优大模型

MarkTechPost推出完整教程，利用 llmcompressor 对 Qwen2.5‑0.5B‑Instruct 进行 FP8 动态量化、GPTQ W4A16 与 SmoothQuant + GPTQ W8A8 三种压缩方案，并通过磁盘体积、生成延迟、吞吐率和困惑度等指标进行系统 benchmark，帮助开发者快速评估部署效率。

QwenFP8量化GPTQSmoothQuant

05/18 (周一)•14 阅读•1分钟•开源