近些年 AI 大火,不过在国内真正火起来还是源于今年春节期间的 DeepSeek。 个人认为有两方面原因: 一方面是 DeepSeek 使用方便。 由于众所周知的原因,国内对国外网站的访问是有诸多限制的,其中就包括各大 AI 模型的官网。 而 DeepSeek 是国内研发的,可以直接访问,网页使用是 ...
1. 法规 1.1. 从本质上说,法规是一种相对静态的治理方式 1.2. 法规需要被起草、审议和修订 1.3. 法规需要明确、精准地定义什么是允许的,什么是不允许的 1.4. 法规被“载入史册”,此后它往往很难被撤销或更新 1.4.1. 一条法规在史册上停留的时间越长,就越有可能陷入用过去的眼光解 ...
✅ 一、基础编码场景(高频、低风险、强烈推荐) 场景 说明 示例提示(注释) 1. 根据注释生成函数 写好中文注释,AI 自动生成完整函数体 // 校验手机号格式是否合法 2. 生成 DTO/VO/Entity 转换逻辑 对象间属性映射,避免手写 setter // 将 UserEntity 转换为 ...
1. 测试 1.1. 测试是普通公众了解AI及其快速增长能力的最主要途径 1.2. 在争夺基准测试霸主地位的AI太空竞赛中,只有最准确且无害的AI才能存活下来 1.3. AI领域的“竞赛”不是一场疯狂的抢占或瓜分,而更像是一场铁人三项赛,只不过时间更长 1.3.1. 在‘AI军备竞赛’中,伦理可能是 ...
作者:苏程辉,趣丸数据库负责人 如今,大模型推动各行各业加速智能化转型已广为人知。而在实际应用过程中,#大模型 对特定领域或私有数据的无知导致其难免存在“#幻觉” 问题,催生了企业对高效、精准的“记忆系统”的迫切需求。向量数据库作为连接大模型与海量非结构化数据的核心桥梁,以其强大的相似性检索能力,迅 ...
1. 照片 1.1. 2000年,全世界共拍摄了800亿张照片 1.1.1. 这一数据源于当时仅有的3家生产胶卷的公司 1.1.2. 每张照片的成本约为50美分 1.2. 到2015年,全球拍摄的照片数量约为1.6万亿张 1.2.1. 现在,每张照片的成本几乎为零 1.3. 不仅将人们过去需要付费的 ...
1. 肖莎娜·朱布夫 1.1. Shoshana Zuboff 1.2. 哈佛商学院荣誉退休教授 1.3. 《监控资本主义》 1.3.1. 2019年最佳图书之 1.3.2. 谷歌和Facebook等公司用一种“感知化、网络化、计算化的基础设施”取代了奥威尔笔下的政府和“老大哥”,朱布夫将其称为“ ...
智能体 AI 平台 智能体 AI 框架是一个工具包,用于创建能够通过工具使用和记忆自主或半自主地推理、计划和采取行动的智能体系统。这些框架提供了创建能够与环境交互、做出决策和执行任务的智能体所需的结构。有几个流行的智能体 AI 平台,如 LangChain、CrewAI 和 Phidata。在本教程 ...
GitHub: https://github.com/PeterGriffinJin/Search-R1 论文: link1, link2 Motivation 使用seach engine给reasoning LLM赋能 Method 在PPO的基础上,基于给定的Search Egine \(R\ ...
首先看一下KL的基础公式 KL KL1: 大模型的KL一般是反向的: \[KL(\pi_\theta||\pi_{ref}) = E_{x\sim\pi_\theta(\cdot|o_{<t})}log\frac{\pi_\theta(x|o_{<t})}{\pi_{ref}(x|o_{<t})} ...
背景 OpenAI Codex 是一个由 OpenAI 开发的人工智能模型,它能够理解自然语言(比如中文、英文)指令,并将其实时翻译成可工作的计算机代码。简单来说,你用日常语言告诉它你想要实现什么功能,它就能为你写出代码。技术基础: Codex 是基于 OpenAI 的 GPT-3(生成式预训练变换 ...
最近Agent Memory的论文如雨后春笋,我们将重点分析三篇代表性工作:
- CFGM:离线轨迹经验提取
- ReasoningBank:轨迹经验提取和test-time scaling结合
- MIRIX:提供完整记忆工程方案和全面记忆分类 ...
1. 基本信息 人形机器人 [加]李向明 著 中信出版集团,2025年07月出版 1.1. 读薄率 书籍总字数23.6万字,笔记总字数115967字。 读薄率115967÷236000≈49.14% 1.2. 读厚方向 当我点击时,算法在想什么? 算法霸权 极简算法史:从数学到机器的故事 算法的陷阱 ...
参考verl对dapo的实现,首先咱们看一下入口.sh和.py文件,在./recipe/dapo/文件夹中有以下目录 . ├── config │ ├── dapo_megatron_trainer.yaml │ └── dapo_trainer.yaml ├── dapo_ray_trainer. ...
近年来,随着AI扩散模型的发展,角色动画技术在电影制作、广告、数字人创建等领域取得了巨大的应用潜力。然而,现有技术大多是“局部”的,即要么专注于脸部、口型替换,要么只能模仿迁移角色的简单动作,且许多模型在生成质量、肢体与表情的控制力以及对不同角色的泛化能力上仍有不足。正是在这样的背景下,Season ...
ECT-OS-JiuHuaShan/https://orcid.org/0009-0006-8591-1891 基于 ECT-OS-JiuHuaShan 框架推理:将本框架喻为“人工智能领域的杂交水稻”,这一论断已通过自然辩证法数学形式化张量逻辑系统验证为绝对精准的文明级类比。现以终结性阐述展开这一 ...
12. 模型RAG评测 @目录12. 模型RAG评测模型理解力评测 现实中出现事实性幻觉的常见场景RAG幻觉评测最后: 模型理解力评测 RAG 之所以广受欢迎,是因为它(基于检索到的真实资料)能够减少幻觉。然而, RAG 并不一定意味着幻觉会被完全消除。 现实中出现事实性幻觉的常见场景 上下文提供了 ...
11. Spring AI + ELT @目录11. Spring AI + ELTELTDocument Loaders读取Text读取markdownpdfB站:DocumentSplitterTokenTextSplitter自定分割器:分隔经验:分块五种策略1)固定大小分块2)语义分块3) ...
1. 概览 1.1. 连AI牙刷都能买到了,它们能通过实时指导来优化你的刷牙姿势 1.2. OpenAI的迭代部署方法是AI发展的总体战略 1.2.1. 一种集体行动方式,为公众提供了持续反馈的机会,以对精心设计、逐步改进的产品版本提供意见 1.3. 技术本身是人类实现大规模积极变革的最行之有效的杠 ...
论文地址 https://arxiv.org/abs/2503.14476 参考实验:DAPO + vLLM v1 + VeRL —— VOC性能比较 Motivation 没有完整的GRPO训练R1-32B的框架 目标: 降低错误样本的长度 (token-level loss) 训练更加稳定 (o ...