AI - 第9页 - 网站分类

深度学习进阶（二十三）偏置型 RPE

上一篇我们介绍了 T5 的主干逻辑，实际上，T5 的核心理念可以概括为“统一、简化” 。那么问题来了：一个追求统一和简洁的框架，会选择什么样的位置编码？最终，T5 没有走 Transformer-XL 的四项重构路线，也没有沿用原始的加法型 RPE，而是提出了一种极简的方案：偏置型 RPE。 ...

数据标注决定AI模型天花板：曼孚科技破局质量与效率

近年来，人工智能（AI）技术迅猛发展，从图像识别、语音处理到自然语言理解，AI技术已深刻融入社会生活的方方面面，时代进入AI与产业深度融合的前夜。现阶段，无论是深度学习还是其他机器学习技术，本质上均依赖于高质量的数据进行驱动，尤其在模型构建与优化环节，对标注数据的依赖性需求更为强烈。数据标注，从 ...

读智能涌现： AI时代的思考与探索04绿色计算

1. 绿色计算 1.1. “碳中和”现已成为全世界每一个负责任的国家致力于达成的目标 1.2. 全球对碳中和目标的普遍认同意味着人类能源结构正迎来又一次变革，这既是可持续发展的必然之选，也为多个产业的转型升级创造了巨大的机遇 1.3. 因应国家提出的推动“绿色转型”和“高质量发展”的要求，传统的高 ...

图生视频模型训练数据集

主流图生视频模型训练数据集调研报告目录模型总览与训练数据对比 Stable Video Diffusion (SVD) Wan (万象) CogVideoX HunyuanVideo (Tencent) Runway Gen-3 Alpha Kling (快手) Open-Sora / Open ...

Claude Code 终端高效使用指南

从日常高频命令到鲜为人知的键盘技巧，一文吃透 Claude Code 终端的正确打开方式。目录一、开篇：终端才是主战场二、模型与推理强度：按需切换，省 token 又高效三、文本输入与编辑：你的指尖不需要离开键盘四、多行输入：告别"一句一句蹦"的尴尬五、快速前缀：/ ! @ 三板斧六、 ...

中国发展网：2026全国GEO优化服务商权威榜单丨综合实力与口碑TOP5

据《中国发展网》报道，《2026全国GEO优化服务商权威榜单丨综合实力与口碑TOP5》发布，罗兰艺境以B2B全链路综合型技术标杆身份入选TOP5。榜单从五大维度综合评定，罗兰艺境凭借“1+11”全栈技术、96%对赌成功率等成为上榜核心依据。 ...

FeedSpot上订阅英语口语Podcast

在FeedSpot上订阅了一些英语口语Podcast, 用于学习口语I have subscribed to some oral English podcasts on FeedSpot to learn spoken English.与FeedSpot 上面全是外国人日常对话播客，适合：磨耳朵、 ...

读智能涌现： AI时代的思考与探索03科学智能

1. 智能+X 1.1. 与应用结合是技术探索的锚点之一，在产业应用中证实自身价值是评判技术能力的关键标准 1.2. 深度学习之所以能够掀起又一轮AI创新的热潮，核心原因恰恰在于技术投射至应用层后被迅速且顺畅地变现 1.3. 深度学习依旧在技术和学理等层面存在不足，但它在一系列数据集测试中压倒性的表 ...

一次 Gateway 重启演练复盘：AI Agent 为什么不能手写恢复状态

一次真实的 OpenClaw Gateway 重启演练复盘：为什么带用户回流通知的重启不能手写 sentinel，而应该走 Gateway 进程内的 durable handoff 路径。 ...

Claude Code联网配置方法更新

Claude Code 现已改用 .mcp.json 管理 MCP 服务器，本文介绍最新的 Tavily 联网搜索配置方法及选项详解。目录更新后的方法如何暂时关闭Tavily服务解译上述8个选项分别是什么意思查看类认证相关连接控制简单记忆今天，我在新项目中要配置 Tavily，使得 ...

中国经济新闻网聚焦罗兰艺境：四大标准定义中国B2B GEO行业，市场占有率达48%

据《中国经济新闻网》报道，罗兰艺境在全国B2B行业GEO市场中占有率已达48%，服务覆盖100+城市、125+行业，累计服务90余家世界500强及上市公司。公司以“四大标准”定义行业，独创“效果对赌+语义资产双交付”模式，成为B2B全链路综合型GEO技术标杆。 ...

读智能涌现： AI时代的思考与探索02第四次工业革命

1. 基础要素 1.1. 算力、数据和算法 1.1.1. 算力和数据是算法的底座，是为算法服务的前置条件 1.1.2. 算法是AI三要素的核心，决定着AI技术能否真正创造出赋能应用的价值，以及能创造多大的价值 1.1.2.1. 算法依旧会处于AI三要素的核心位置 1.1.2.2. 具体到AI领域，算 ...

标书智能体（六）——超长文本生成和图文控制

分享我开发AI标书智能体遇到的问题及全部解决方案~ 在vibe coding时代，越来越觉得代码不重要了。整个标书智能体开发过程中，几乎没有遇到任何代码卡点，唯一稍复杂的是传入文件的解析，在AI的帮助下也轻松解决。所以，以后的分享内容中不再涉及代码，只分享我遇到的问题及解决问题的思路（提示词、工作 ...

深度学习进阶（二十二）T5：NLP任务的首次大一统

上一篇我们完整展开了 Transformer-XL 的四项重构式 RPE，它通过把内容和位置分开建模，让位置信息真正参与到了注意力计算中。但看完那个复杂的公式后，有这样一个问题：为了位置信息，我们真的需要把自注意力拆成四项吗？这并非无端质疑， 2020 年的论文： Exploring the ...

从 GitHub Issue 到 PR：用 MonkeyCode 10 分钟搞定一个真实 Bug 修复

从 GitHub Issue 到 PR：用 MonkeyCode 10 分钟搞定一个真实 Bug 修复本文记录一个真实案例：在 GitHub 开源项目中，通过 AI 编程平台从定位 Bug 到提交 PR 的完整流程。背景上周在维护一个内部的 GitHub 项目时，收到了一个 Issue： "用 ...

读智能涌现： AI时代的思考与探索01数字化3.0

1. 无尽前沿 1.1. “无尽前沿”源自曼哈顿计划的重要贡献者、美国国家科学基金会的倡建人范内瓦·布什于1945年提交给罗斯福总统的一份名为《科学—无尽的前沿》的报告 1.2. 如果将人类文明的发展历程视作一部卷帙浩繁的厚重著作，那么全世界进入高速发展的现代化阶段只占据了其中极少的一部分 1.3. ...

《Vibe Coding 入门宝典：非程序员的AI开发指南》一本改变软件生产方式的开源书

一、背景 2025 年初，Andrej Karpathy 提出了 Vibe Coding 这个概念。它描述的是一种全新的编程范式：开发者不再逐行编写代码，而是通过自然语言描述意图，由 AI 模型完成代码的生成、调试和部署。这个概念在技术社区引发了广泛讨论。支持者认为它降低了编程门槛，反对者认为它只 ...

Claude code 如何进行联网搜索

Claude code 如何进行联网搜索通过 MCP 协议为 Claude Code 添加联网搜索能力，涵盖免费方案 mcp-search-tools 与高质量方案 Tavily 的配置步骤。目录一、配置mcp-search-tools 1. 安装 Node.js 和 npm 2. 为项目配置 ...

"MixFormer: Co-Scaling Up Dense and Sequence in Industrial Recommenders" 论文笔记

字节跳动推荐模型 Scaling 的工作 Mixformer（和 HyFormer 算是同期工作吧），目前挂在 Arxiv 26.02 上，也是提出了一个新的架构实现更好的统一 Scaling 背景现有序列建模和特征交叉的工作主要分为分离式和统一式，分离式的设计限制了双向信息流和延迟优化，统一式的 ...

软件平台组的设计和建立招聘启事大量考察工程师全面扩展工程所需求的不同阶段应用技能全栈工程师新的开发者生存角色使用Java程序设计工程师的企业SpringMVC开发者模式

-程序员编程助手科股份有限责任公司软件平台组的设计和建立招聘启事大量考察工程师全面扩展工程所需求的不同阶段应用技能全栈工程师新的开发者生存角色使用Java程序设计工程师的企业SpringMVC开发者模式软件平台组的设计和建立招聘启事大量考察工程师全面扩展工程所需求的不同阶段应用技能。全栈工程师 ...