Air News - 最新科技资讯

腾讯开源TencentDB Agent Memory打造四层本地记忆管线，令Agent令牌消耗降超60%

腾讯近日在MIT许可证下开源TencentDB Agent Memory，提供符号化短期记忆与四层长周期记忆金字塔的本地化解决方案。该系统基于SQLite+sqlite-vec，融合BM25与向量检索，在OpenClaw和Hermes中实现，官方基准显示令牌使用下降61%，任务成功率提升逾50%。

LLMOpenClawTencentTencentDB Agent Memory

05/24 (周日)•93 阅读•1分钟•开源

SuperClaude框架打造多模式Claude工作流，提升AI开发效率

本教程展示如何在Anthropic的Claude模型之上，借助开源SuperClaude框架构建包含指令、代理、模式和会话记忆的多步骤工作流，实现从需求构思到代码实现的全链路AI辅助开发。本文还提供完整代码示例和实战案例，帮助开发者快速上手并提升Prompt的一致性与角色感知。

ClaudeAnthropicLLMSuperClaude

05/24 (周日)•61 阅读•1分钟•开源

Repowise全流程助力代码库智能化，实现图分析、死代码检测与AI上下文

本文详细演示如何使用 Repowise 为 Python 项目 itsdangerous 构建仓库级智能。通过配置 LLM 凭证、初始化索引、解析生成的图谱、执行死代码检测、记录架构决策，并生成 AI 可读的 CLAUDE.md，上手即能获得代码结构、影响力文件及维护优先级的全景视图。

OpenAIAnthropicLLMRepowise

05/16 (周六)•55 阅读•1分钟•应用

MCP路由式AI代理系统教程揭示动态工具曝光与上下文注入全流程

5月15日，MarkTechPost发布了一篇详细教程，手把手演示如何从零构建MCP风格的路由式AI代理系统。文章围绕工具发现、智能路由、结构化规划与安全执行四大模块展开，旨在帮助开发者实现工具最小化曝光、上下文注入以及可解释的多工具协作。

开源LLMAgentic AIMCPTool Routing

05/16 (周六)•25 阅读•1分钟•开源

OpenAI Codex助力销售团队实现全流程智能化

OpenAI生成式AILLMCodex销售自动化

05/15 (周五)•28 阅读•1分钟•应用

Cline开源SDK重塑AI编码代理运行时提升CLI与IDE跨端持久性

ClaudeLLM多代理Cline

05/15 (周五)•59 阅读•1分钟•开源

Nous Research推出Token Superposition Training 将LLM预训练加速最高2.5倍

LLMNous ResearchToken Superposition Training

05/14 (周四)•32 阅读•1分钟•前沿

Clio年ARR突破5亿美元法律AI赛道迎来规模化爆发

ClaudeAnthropicLLMLegalTechClio

05/14 (周四)•48 阅读•1分钟•应用

异步连续批处理解锁GPU满载，推理吞吐提升22%

Hugging FaceLLMCUDAContinuous Batching

05/14 (周四)•23 阅读•1分钟•前沿

Anthropic发布自然语言自编码器让Claude自述思考，开启可解释性新纪元

ClaudeAnthropicLLM自然语言自编码器

05/13 (周三)•16 阅读•1分钟•前沿

OpenAI助力混合记忆自主代理全链路实现，打造可扩展智能助理

本篇教程详细展示了如何基于 OpenAI 的 GPT‑4o‑mini，构建具备向量检索、BM25 关键字匹配以及工具调度的混合记忆自主代理，实现长期记忆存取、自动工具调用和多轮推理，帮助研发者快速落地高效的智能助理。

OpenAILLMGPT-4o-mini

05/13 (周三)•39 阅读•1分钟•应用

AntAngelMed发布103B医学大模型，1/32 MoE激活实现高效医疗AI

LLMMoEHealthBenchAntAngelMed

05/13 (周三)•48 阅读•1分钟•前沿

状态空间模型崛起：线性时序架构挑战Transformer主流

LLMTransformerState Space Models线性时序模型

05/12 (周二)•24 阅读•1分钟•前沿

Groq驱动的多步骤智能研究助手正式亮相，LangGraph实现子代理与记忆功能

近日，开发者利用Groq的免费OpenAI兼容推理接口，结合LangGraph和LangChain，搭建了一套具备工具调用、子代理分工以及长期记忆的Agentic研究助理。该系统可在浏览器或Colab环境中自动检索、抓取、分析信息并生成结构化报告，为科研与商业情报提供了高效的自动化方案。

LLMLangGraphTool CallingGroqAgentic Memory

05/07 (周四)•25 阅读•1分钟•应用

vLLM升级至V1实现RL训练后端一致性，四项修复恢复性能

LLMServiceNowvLLM强化学习

05/07 (周四)•50 阅读•1分钟•前沿

Google推出Gemma 4多令牌预测草稿器实现三倍推理加速

GoogleLLMGemma 4MTPSpeculative Decoding

05/06 (周三)•20 阅读•1分钟•前沿

Uber引入OpenAI助手提升司机收益与乘客预约效率

OpenAILLMUber语音交互

05/06 (周三)•13 阅读•1分钟•应用

#
LLM

腾讯开源TencentDB Agent Memory打造四层本地记忆管线，令Agent令牌消耗降超60%

SuperClaude框架打造多模式Claude工作流，提升AI开发效率

Google发布Gemini 3.5 Flash，编码和代理任务速度提升四倍成本减半

Ocean完成2800万美元融资，推出AI驱动邮件防钓鱼平台

arXiv宣布一年禁投政策严惩全程AI生成论文

Repowise全流程助力代码库智能化，实现图分析、死代码检测与AI上下文

MCP路由式AI代理系统教程揭示动态工具曝光与上下文注入全流程

OpenAI Codex助力销售团队实现全流程智能化

Cline开源SDK重塑AI编码代理运行时提升CLI与IDE跨端持久性

Nous Research推出Token Superposition Training 将LLM预训练加速最高2.5倍

Clio年ARR突破5亿美元法律AI赛道迎来规模化爆发

异步连续批处理解锁GPU满载，推理吞吐提升22%

Anthropic发布自然语言自编码器让Claude自述思考，开启可解释性新纪元

OpenAI助力混合记忆自主代理全链路实现，打造可扩展智能助理

AntAngelMed发布103B医学大模型，1/32 MoE激活实现高效医疗AI

状态空间模型崛起：线性时序架构挑战Transformer主流

Groq驱动的多步骤智能研究助手正式亮相，LangGraph实现子代理与记忆功能

vLLM升级至V1实现RL训练后端一致性，四项修复恢复性能

Google推出Gemma 4多令牌预测草稿器实现三倍推理加速

Uber引入OpenAI助手提升司机收益与乘客预约效率

标签分类

#LLM

腾讯开源TencentDB Agent Memory打造四层本地记忆管线，令Agent令牌消耗降超60%

SuperClaude框架打造多模式Claude工作流，提升AI开发效率

Google发布Gemini 3.5 Flash，编码和代理任务速度提升四倍成本减半

Ocean完成2800万美元融资，推出AI驱动邮件防钓鱼平台

arXiv宣布一年禁投政策 严惩全程AI生成论文

Repowise全流程助力代码库智能化，实现图分析、死代码检测与AI上下文

MCP路由式AI代理系统教程揭示动态工具曝光与上下文注入全流程

OpenAI Codex助力销售团队实现全流程智能化

Cline开源SDK重塑AI编码代理运行时 提升CLI与IDE跨端持久性

Nous Research推出Token Superposition Training 将LLM预训练加速最高2.5倍

Clio年ARR突破5亿美元 法律AI赛道迎来规模化爆发

异步连续批处理解锁GPU满载，推理吞吐提升22%

Anthropic发布自然语言自编码器让Claude自述思考，开启可解释性新纪元

OpenAI助力混合记忆自主代理全链路实现，打造可扩展智能助理

AntAngelMed发布103B医学大模型，1/32 MoE激活实现高效医疗AI

状态空间模型崛起：线性时序架构挑战Transformer主流

Groq驱动的多步骤智能研究助手正式亮相，LangGraph实现子代理与记忆功能

vLLM升级至V1实现RL训练后端一致性，四项修复恢复性能

Google推出Gemma 4多令牌预测草稿器 实现三倍推理加速

Uber引入OpenAI助手提升司机收益与乘客预约效率

标签分类

#
LLM

arXiv宣布一年禁投政策严惩全程AI生成论文

Cline开源SDK重塑AI编码代理运行时提升CLI与IDE跨端持久性

Clio年ARR突破5亿美元法律AI赛道迎来规模化爆发

Google推出Gemma 4多令牌预测草稿器实现三倍推理加速