琰琰讲AI

用通俗语言,讲透AI技术原理

这是一个不讲黑话、不用数学公式吓唬人的AI技术专栏。从Transformer到RAG,从注意力机制到模型蒸馏, 我会用最直白的语言把每个概念背后的原理拆开给你看。不讲故事,只讲原理;不堆术语,只求通透。

4 篇教程
自注意力机制到底是怎么算的?——Q/K/V 与加权求和
2026-06-29 · 前两篇我们反复提到一个词:注意力机制。它让每个词去看所有其他词、它让 Transformer 能并行计算、它是整个大模型大厦的基石。但「看」到底是怎么看的?这篇我们把这个「看」的过程彻底拆开。 核心直觉:加权求和 注意力机制的本质,就四个…
大模型是如何学习的?——从预测下一个词到 RLHF
2026-06-29 · 前两篇我们画了地图,讲了 Transformer 的结构。但这就像你了解了汽车的发动机结构,却还没搞懂——这车到底怎么开起来的? 一个千亿参数的大模型,它到底是怎么「学会」理解语言的?这篇不讲数学公式,用直觉讲透整个学习过程。 核心任务:…
先画一张地图:AI、深度学习、大模型,到底是什么关系?
2026-06-29 · 这个专栏叫「琰琰讲AI」。但严格来说,我们不会讲整个 AI——那是一个大到可以写满一面图书馆的学科。我们只讲其中一条线:大模型的技术原理。 为了让后续每篇文章都有一个清晰的位置,这篇我们先画一张地图。 第一层:人工智能(AI) 人工智能这个…
Transformer 是什么?——从注意力说起
2026-06-29 · 如果你关注AI领域,一定听过 Transformer 这个词——GPT、BERT、T5、LLaMA……几乎所有今天你能叫得上名字的大模型,底层都是 Transformer。但 Transformer 到底是什么?它为什么能取代之前所有的架构…