2025年11月份博文汇总与视频一.LLM相关1.如何构建和训练世界级LLM 一份关于如何构建和训练世界级大型语言模型(LLMs)的详细指南,由Hugging Face团队撰写。它涵盖了从模型架构设计、数据准备、训练过程到后处理的全过程,提供了丰富的技术细节和实践经验2.美团多智能体WOWServi ...
这一章我们通过三巨头 Google、OpenAI、Anthropic 三篇充满脑洞的论文,深入探讨模型内部状态的可访问性与可操控性。我们将从三个维度展开:模型是否有自我认知?如何引导这种认知?如何从数学和电路层面解释这种认知? ...
1. 引言 当前,高性能文本到图像(Text-to-Image, T2I)生成模型市场呈现出一种根本性的二元格局。一方面,是以Nano Banana Pro、Seedream 4.0为代表的专有(闭源)商业模型,它们性能强大,但其技术实现被封装于“黑盒”之内,限制了社区的研究与创新。另一方面,则是以 ...
这学期参加了同研究科的田中研的读书会,所选的是近年出的较新的书《Learning Theory from First Principles》。作者Francis Bach是COLT2025的keynote speaker。我主动承担了4.1-4.4部分(这周做了分享),该部分和我目前的科研方向比较相... ...
1.概述 在当今快速发展的 AI 时代,如何高效、准确地评估 AI 模型的性能已成为一个关键挑战。传统的评测方法往往依赖大量人工干预,不仅效率低下,而且难以保证评测的一致性和客观性。本文将深入探讨如何使用 Vibe Coding 的理念,结合现代 AI 技术,构建一个智能、高效且可扩展的自动化评测系 ...
Google生成式UI下一代人机交互技术1.0 摘要 在当前的技术浪潮中,大语言模型(LLM)已展现出在内容生成方面的卓越能力,深刻地改变了我们获取与处理信息的方式。然而,这些强大的模型在输出形态上普遍受限于静态、预定义的界面,最常见的便是由标题、列表和代码块组成的Markdown“文本墙”。这种呈 ...
说到AI大家都懂,说到自媒体大家也懂,那么把AI和自媒体结合到一起会是怎么样的? 我觉得应该是更便利,更方便,原来我们在写自媒体文章的时候也会用到AI来辅助一下,帮助我们润色、修饰、给初稿、给大纲,最后发现该省的时间一样没有省下来,反而还要来回改,当时就在想如果从生成到配图再到发布全部自动化操作了该 ...
OceanBase 年度发布会 Hands-on AI Workshop 回顾!代码实操:在来自 Dify 、LangChain Community 和 OceanBase 的技术专家指导下,现场数百名开发者在两小时内,基于 seekdb 实际动手完成了从环境部署、Agentic RAG 搭建到构建... ...
01 | WeClone如何创造数字分身 拥有一个数字分身可能是很多人的一个愿望。其实通过给大模型喂我们的聊天记录,就可打造出我们的数字分身,当前爆火的Weclone项目采取的就是这种做法。先导出自己的聊天记录,再把聊天记录作为数据用来微调大模型,让模型学习我们的语言风格和习惯,就能打造出专属的数字 ...
OceanBase 开源生态总经理封仲淹为大家介绍 OceanBase 产品发布会上公布的 seekdb,以及 OceanBase 开源 seekdb 的初衷。 ...
此分类用于记录吴恩达深度学习课程的学习笔记。 课程相关信息链接如下: 原课程视频链接:[双语字幕]吴恩达深度学习deeplearning.ai github课程资料,含课件与笔记:吴恩达深度学习教学资料 课程配套练习(中英)与答案:吴恩达深度学习课后习题与答案 本篇为第三课的第二周内容,2.1到2. ...
摘要在Web安全与小程序逆向分析中,传统的自动化扫描器(如AWVS、Nessus)往往是“语法大师,逻辑白痴”——它们能轻易发现SQL注入,却难以理解复杂的业务上下文 。本文探讨了一种新的安全审计范式:利用大语言模型(LLM)作为虚拟安全专家,填补自动化工具的广度与人类专家的深度之间的鸿沟 。通过婚 ...
在AI科技圈,Qwen因其开源模型数量位居世界第一、模型涵盖各种大小、开销低而表现不俗,被称为“源神(开源界的神)”。这也导致有些人在体验之后,觉得Qwen写的代码质量是国内第一,仅次于Claude、chatGPT、Gemini、grok这些国外大模型之后。但GLM却像是被遗忘了一样,网上对它知之甚 ...
之前我已经给大家分享过很多个人使用 AI 的技巧,今天这篇文章就主要分享大模型 API 的使用教程,我将以国内智谱最新旗舰的 GLM-4.6 模型为例,手把手带你学会 3 大使用 API 的场景。 ...
此分类用于记录吴恩达深度学习课程的学习笔记。 课程相关信息链接如下: 原课程视频链接:[双语字幕]吴恩达深度学习deeplearning.ai github课程资料,含课件与笔记:吴恩达深度学习教学资料 课程配套练习(中英)与答案:吴恩达深度学习课后习题与答案 本篇为第三课的第一周内容,1.8到1. ...
重新定义需求评审的未来 高质量的需求是软件项目成功的基石,然而,传统的需求评审流程往往耗时、繁琐且容易出错。需求文档中的模糊性、不一致性和遗漏是导致项目失败最常见的因素之一。大型语言模型(LLM)作为一种颠覆性技术,为解决这些长期存在的挑战提供了新的可能性。它强大的自然语言处理能力,能够以前所未有的 ...
此分类用于记录吴恩达深度学习课程的学习笔记。 课程相关信息链接如下: 原课程视频链接:[双语字幕]吴恩达深度学习deeplearning.ai github课程资料,含课件与笔记:吴恩达深度学习教学资料 课程配套练习(中英)与答案:吴恩达深度学习课后习题与答案 本篇为第三课的第一周内容,1.5到1. ...
一位对 AI 充满好奇的学习者——揭开 Claude Opus 4.5 的神秘面纱,清晰展示它在软件工程、安全性和多语言处理等领域取得的革命性进步。1. 软件工程领域的“超强大脑”无人能及的工程能力一个令人震撼的事实是:在一项时长2小时、极其困难的内部工程带回测试中,Opus 4.5 的得分“超过了 ...
MasaCtrl发布于ICCV2023, 是一个比较老的论文,这里研究这个主要是因为和研究内容相近。我想着是就算方法可能已经没那么新,其中的思想或多或少是可以借鉴的。 MasaCtrl主要致力于解决两个问题: T2I生成图像,如生成连续图像以做动画需求等时(其实套到我们的课题里就是对应大图里的各个小 ...
此分类用于记录吴恩达深度学习课程的学习笔记。 课程相关信息链接如下: 原课程视频链接:[双语字幕]吴恩达深度学习deeplearning.ai github课程资料,含课件与笔记:吴恩达深度学习教学资料 课程配套练习(中英)与答案:吴恩达深度学习课后习题与答案 本篇为第三课的第一周内容,1.1到1. ...