LLM 问答过程动画 Demo

LLM 问答过程（通俗动画）

展示：输入 → Token → Embedding坐标 → Transformer特征 → 概率 → 逐词输出

step: 0

输入（User）

速度（越右越快）

提示：速度影响每个阶段的停留时长（不影响逻辑）。

生成长度（输出多少个 token）

这里为了演示，生成结果是“模拟的”，但流程和真实模型一致。

用户输入：模型先接收一段字符串。

hello

x: text

把文本切成 token（编号）。

—

x: token ids

根据 token id 取出向量坐标（查表）。

—

E[V×d] x: vectors

多层“看关系（Attention）+改特征（FFN）”，输出更有用的特征。

—

features context-aware

把特征映射到词表，得到“下一个 token”的概率。

—

softmax P(next token)