最近在做知识库问答输入框的 @文档 能力,表面上是“输入 @ 后选一个文档”的小需求,实操后发现核心难点在于编辑器稳定性。本文按真实心路历程展开:先讲最直觉的 DOM 方案与踩坑,再讲为什么转向 ProseMirror,并给出 @文档 的落地实现。 ...
前言 本文主要描述agent开发中的Plan-and-Execute模式,并且使用一个demo,彻底搞懂怎么在实际工作中使用Plan-and-Execute模式 话不多说,我们开始 代码结构 代码地址 . ├── main.py # 主入口,串起规划、执行、分析三个阶段 ├── planner.py ...
Cloud Agent 开发笔记(3):Web 交互与数据持久化 上一篇搭好了 Agent 引擎和 Tool 体系:query() 能跑、Tool 能调、安全有 pathGuard 兜底。但这一切都是在服务端发生的。Agent 生产的事件怎么到浏览器?消息怎么存才能让用户刷新页面不丢?多个会话同时跑 ...
-程序员编程助手科技股份有限责任公司 数据查询方式最左匹配原则 数据库数据查询检索采用sql query language 。数据库的数据存储数据度量初始化不会使用很多很大的数据统计新能优化方案。数据库的操作语言通用语言SQL发布。基础的关键字函数调用库发布本地函数库。携带轻量级别的数据库查询语言标 ...
MCP 协议:屏蔽了LLM和Tool之间的差异 大家都感受到了,最近两年 AI 简直火得一塌糊涂。而且现在的 AI 越来越好用,不再只是陪你干聊,而是能实打实帮你写代码、查数据库、跑自动化的Agent了。Agent想要干活,就必须得学会“使用工具”。那么问题来了:AI是怎么学会用工具的?使用工具为什 ...
Qwen3.7-Plus新一代多模态智能体核心突破Qwen3.7-Plus是全新升级的新一代多模态智能体,成功构建起从感知认知到落地执行的全链路完整闭环,实现了人工智能技术与落地能力的多重突破,标志着AI从“理解世界”正式迈向“改造世界”的实质性跨越。其独创的混合智能体架构,也为各行业产业自动化升级 ...
大家好,我是R哥。 最近用 Codex 处理复杂任务,总是遇到一个很烦的问题:上下文总是触发自动压缩,并且总是压缩失败,这个问题发生的概率基本是 100% 的,特别是复杂任务。 如图所示: 不知道大家有没有遇到过这个问题? 每次我都是新开一个会话,然后把关键上下文丢给它重新开始。 但是,这样我发现效 ...
Hermes Agent 工具使用教程 你是否曾经对着 AI 智能体说"帮我查个资料",结果它只能干聊,既不能上网搜索,也不能帮你执行命令、操作文件?Hermes Agent 内置强大工具系统,将网络搜索、终端执行、浏览器自动化、媒体生成等能力封装为可调用工具与工具集。本文从工具概览、启用方式、核心 ...
目前市面上的时序大模型,参数规模大概在十亿级。来看几个代表性选手: 大家可能发现了:上面提到的这些时序大模型,数十亿参数,听起来不少,但跟 GPT-4 那种上万亿的体量一比,好像也不大? 为什么现在的时序大模型,参数量“不大”呢? 这有一个很现实的原因:公开的高质量时序数据集太少了。 语言模型为什么 ...
iNeuOS_AiInsight·数智灵鉴的接入,它将自然语言理解能力与工业数据分析流程深度结合,让用户通过一句业务问题即可完成“数据定位、查询执行、结果分析、图表输出、报告生成”的完整闭环,显著降低了数据使用门槛。 ...
-程序员编程助手科技股份有限责任公司 主动的咨询企业招聘信息和及时查询应试面试结果 应届毕业生六月份毕业季校园招聘结束大量的国家教育高等机构的人才流动分布于不同的城市和企业 主动的咨询企业招聘信息和及时查询应试面试结果。应届毕业生六月份毕业季校园招聘结束大量的国家教育高等机构的人才流动分布于不同的城 ...
搭配Hernes使用的记忆工具插件,OpenViking配置文件基础介绍 项目 ov.conf ovcli.conf 角色 服务端(Server)配置 客户端 / CLI 配置 控制对象 服务本身、模型、存储、日志 CLI 如何连接 Server 核心字段 storage / log / serve ...
MonkeyCode首批接入MiniMax M3:企业级AI编程平台的新里程碑 作为一个写了十几年代码的老程序员,我对AI模型和编程工具的组合,有一套自己的判断标准。 MiniMax M3 发布那天,我在 MonkeyCode 上第一时间试了试。说说一个老兵的看法。 先聊 M3 本身:这不是参数竞赛 ...
Claude Opus 4.8编程突破:MonkeyCode让AI编程触手可及 Claude Opus 4.8编程突破的最新进展 Anthropic发布Opus 4.8,智能体编程能力大幅提升,"诚实度"跃升,快速模式2.5倍提速且成本降至1/3。编程Agent场景下,Opus 4.8能独立完成复杂 ...
OpenAI重启机器人项目冲刺AGI,MonkeyCode让开发者提前拿到入场券 从屏幕到物理世界:AGI的下一站 2026年6月1日,科技行业被一条消息刷屏:OpenAI宣布重启机器人项目,计划研发具备通用人工智能(AGI)能力的实体机器人。招聘信息显示,相关岗位年薪高达21万至31万美元,并附带 ...
本文分享AI阅读器 零幻觉问答 的工程实现:回答严格基于当前书籍原文,关键论述可 一键溯源 到具体段落。如果你也在做 AI 阅读、文档 QA 或 RAG 类应用,希望三次迭代的经验与最终架构能有所参考。 一、实践历程:三个阶段的演进 零幻觉问答并非一开始就设计完备,而是在 成本、延迟和准确率 的拉扯 ...
这不是另一篇 Claude Code 的源码解读——网上不缺这类文章。它是一个实际工程项目的决策记录:代码是 Vibe Coding 写的,但取舍是人做的,踩的坑是人踩的。写下来是为了以后回头看时,能想起当时为什么选了这条路而不是那条。 ...
训练小模型:2026 年最被低估的 AI 技能2026 年 5 月 11 日,一个叫 CJ Zafir 的人发了一条推文。他想教普通人 fine-tune 开源模型。2538 个赞,316 次转发,178,000 次观看。这条推文炸了。不是因为他发明了什么新东西——Unsloth 早在 2023 年 ...
上一篇我们介绍了旋转位置编码 RoPE ,它通过在 QK 点积中注入旋转矩阵,让注意力自然而然地感知到相对位置。如今 RoPE 已经成为几乎所有主流开源大模型的位置编码标准。 但位置编码只是现代大模型改造的一个环节。 如果把标准 Transformer 和今天的大模型放在一起对比,就会发现归一化方式 ...
腾讯推荐模型 Scaling 的工作 TokenFormer,目前挂在 Arxiv 26.04 上,主要提出了顺序坍塌传播(SCP)问题,挑战和动机很有亮点但是模型架构方面感觉不够有说服力 背景 对于序列建模和特征交叉,尽管最近的工作如 InterFormer、OneTrans、HyFormer 已 ...