PageIndex推理式RAG:用树搜索替代向量检索
PageIndex以“智能目录+LLM推理式树搜索”替代向量相似度检索,在长文档与专业文档场景提升可解释性与定位精度,并在金融问答基准中给出高准确率表现,为企业知识库落地提供新路径。
PageIndex以“智能目录+LLM推理式树搜索”替代向量相似度检索,在长文档与专业文档场景提升可解释性与定位精度,并在金融问答基准中给出高准确率表现,为企业知识库落地提供新路径。
开源项目planning-with-files以Markdown文件复刻Manus的Context Engineering,用任务计划、发现记录与进度日志实现持久化“工作记忆”,并适配Claude Code等多平台,缓解智能体目标漂移与重复犯错问题。
Ollama v0.15.4围绕集成体系与模型解析器做了系统级升级:OpenClaw自动化Onboarding、注册表别名与路径兼容全面落地,同时Ministral工具调用解析支持嵌套JSON,提升本地AI集成的稳定性与可维护性。
阶跃星辰开源Step 3.5 Flash,面向Agent场景优化推理与长上下文,最高350 TPS,并以稀疏MoE、MTP-3与混合注意力降低计算开销,为企业级智能体落地提供更可控的性能与成本路径。
通过 CocoIndex 将 Google Drive 中的 Markdown 会议纪要交给 LLM 抽取 Meeting/Person/Task,并以增量更新写入 Neo4j,实现可查询、可持续演进的组织知识图谱能力。
借助 Claude Code 的 Skills 机制,用户可自动完成角色关系调研并生成 Graphviz 图谱,从 DOT 输出 PDF,甚至扩展为可交互网站,为知识结构化与协作沉淀提供新范式。
Agent Skills 以“渐进式加载+按需调用脚本”重构本地知识检索流程,在跨格式文件与多轮问题上更像“会思考的检索”。它是否能替代传统RAG,关键取决于数据形态、成本与可控性。
Claude Skills 将“偏好与流程”封装为 SKILL.md 与资源目录,并用渐进式披露降低 token 成本;配合 MCP 可把工具访问与最佳实践组合成可复用的工作流,对企业标准化与效率提升带来新思路。
OpenClaw 以“Interface via Documentation”将 Skill 定义与执行代码解耦,通过 Runtime 统一完成选择、参数化、安全校验与执行,减少胶水代码并提升可观测性,为企业级 Agent 的工程化落地提供新路径。
面对Context bloat problem,Claude Skills用渐进式披露按需加载知识,LangChain SubAgents用隔离上下文分流工具细节。两种“分而治之,机制正在重塑Agent工程范式,并对企业效率与人才能力提出新要求。