字节跳动发布DeerFlow 2.0 开源超代理框架,实现多代理协同与沙箱执行
字节跳动今日正式开源DeerFlow 2.0,一套基于Docker沙箱的SuperAgent框架。它通过层级多代理编排、持久记忆与模型中立,实现从深度调研到全栈应用的全自动交付,旨在突破传统AI助手的执行瓶颈。
字节跳动今日正式开源DeerFlow 2.0,一套基于Docker沙箱的SuperAgent框架。它通过层级多代理编排、持久记忆与模型中立,实现从深度调研到全栈应用的全自动交付,旨在突破传统AI助手的执行瓶颈。


DeepLearning.AI今日推出开源工具Context Hub,针对Agentic工作流中的文档滞后问题,为编码代理提供即时、版本化的API文档查询与注解功能,帮助开发者降低因过时接口导致的调试成本。
AI先驱Andrej Karpathy发布了630行Python实现的Autoresearch工具,支持AI代理在单块NVIDIA GPU上自行迭代机器学习实验,并通过BPB指标自动提交有效改进,已在Shopify内部实现19%验证分数提升。

MarkTechPost 今日公布了基于认知蓝图的开源代理运行时框架。该系统通过结构化的身份、目标、规划、记忆、验证和工具模块,让大型语言模型在执行复杂任务时实现可规划、可记忆、可校验的全链路自治,旨在降低研发门槛并提升 agentic AI 的可靠性。
Google今日发布TensorFlow 2.21,核心更新为LiteRT从预览版升至正式版,全面取代TensorFlow Lite。LiteRT在GPU上提升1.4倍性能,并首次原生支持NPU加速,同时扩展低精度算子并加入对PyTorch、JAX的一键转换,旨在提升移动端和边缘设备的AI部署效率。
Google AI今日正式开源Android Bench,这是面向Android开发任务的评测框架与排行榜。该基准从真实GitHub项目中抽取任务,覆盖API迁移、Wear OS网络等场景,并通过单元测试与仪器化测试验证模型修复效果,为LLM在移动端的实用性提供了首个量化标准。

MarkTechPost 发布的实战教程展示了如何使用开源数据引擎 Daft,完成从 MNIST 原始 JSON 数据读取、图像重塑、特征工程、聚合统计到模型训练与 Parquet 持久化的完整流程,证明了 Daft 在结构化与图像并行处理上的高效可扩展性。
OpenAI今日开源Symphony,一个基于Elixir与BEAM的调度框架,旨在通过结构化的实现运行(implementation runs)自动管理AI编码代理。该系统将issue追踪、沙盒执行、工作证明与代码合并闭环,实现大规模、容错的代码生成与部署。
MarkTechPost 今日发布了基于 FLAN‑T5 的 Tree-of-Thoughts 多分支推理代理,采用束搜索、启发式评分和深度限制剪枝,实现对 24 游戏等任务的高效结构化推理。该框架开源代码完整,可直接复用于更广泛的数学与规划问题。

随着生成式AI从聊天界面向多步骤自治代理演进,非确定性成为制约生产化的核心瓶颈。LangWatch 作为首个开源的评估、追踪与仿真平台,为 LLM 代理提供统一的监控层,帮助开发者在完整执行路径上定位错误、迭代提示并实现合规部署。



MarkTechPost 今日发布完整教程,展示如何使用开源库 Vaex 在不将数据全部加载到内存的前提下,完成从数据生成、特征工程、聚合统计到模型训练的全链路流水线。该方案在 200 万行合成数据上实现了秒级响应,为大规模分析提供了可落地的实践路径。
阿里巴巴Qwen团队今日推出Qwen 3.5小型系列模型,参数规模从0.8B到9B,专为移动端、IoT和轻量化多模态代理设计,强调在算力受限环境下保持高推理能力。