线性代数 – 解析几何的历史和现代意义

早在古希腊时期，人们就已经开始系统研究点、直线、圆、角、三角形以及空间中的各种图形。欧几里得的《几何原本》以公理化的方式建立了平面几何的基本体系：从少数公理和公设出发，通过严密的逻辑推理得到大量几何命题。此时的几何学主要依靠图形、作图和演绎证明，强调的是“形”的直观关系。

然而，随着数学和自然科学的发展，仅仅依靠图形推理逐渐显得不够方便。天文学、力学、工程测量等领域需要更精确地描述位置、轨迹、距离和变化。能不能把几何图形转化成可以计算的代数对象？换句话说，能不能用数字和方程研究几何？

解析几何的核心思想可以概括为：

用坐标描述位置，用向量描述方向与位移，用方程描述几何对象，用代数方法研究几何关系。
OR —
用坐标表示点，用向量表示方向和位移，用方程表示曲线、曲面、直线和平面。

解析几何不仅是几何学与代数学的结合，也为后续的线性代数、微积分、空间解析几何、工程建模和计算机图形学等领域奠定了基础。

一、很早以前

在解析几何出现之前，几何学已经有了非常丰富的成果。欧几里得几何研究的是理想化的点、线、面以及它们之间的关系。例如，两点确定一条直线，三角形内角和等于两直角，圆可以由圆心和半径确定。这些结论并不依赖坐标，而是通过图形和逻辑证明建立起来的。

古典几何的优势在于直观清晰。比如我们说“两条直线平行”，图形上可以直接看出它们永不相交；我们说“圆上的点到圆心距离相等”，也很容易从图形中理解。

但是古典几何也有局限。比如给定一个圆和一条直线，要求它们是否相交、交点在哪里，单靠作图并不总是方便。如果图形变得复杂，比如椭圆、抛物线、双曲线，或者空间中的平面、直线、曲面，仅凭直观推理就会越来越困难。

数学需要一种既保留几何直观，又能够进行精确计算的新语言。

二、坐标系

解析几何的突破，来自坐标思想。坐标系相当于给空间建立了一张数字地图。在平面中，如果规定两条互相垂直的数轴，一条作为 (x) 轴，一条作为 (y) 轴，那么平面上的每一个点都可以用一个有序数对表示：

P=(x,y)

在三维空间中，加入第三条坐标轴 (z) 轴，一个点就可以表示为：

P=(x,y,z)

点的信息一旦可以用数字表示，几何对象就可以转化为代数对象。

例如，在平面直角坐标系中，所有满足 $x^2+y^2=r^2$ 的点构成一个以原点为圆心、半径为 (r) 的圆。原本需要用语言描述的圆，现在变成了一个方程。同样，一条直线可以写成 $ax+by+c=0$ ，一个球面可以写成 $x^2+y^2+z^2=R^2$ 。

坐标系把几何对象转化成了方程的解集。“曲线、曲面”，从解析几何的角度看，就是满足某个方程的一切点的集合。

三、向量 – 既有大小又有方向

一条直线不仅需要知道它经过哪里，还要知道它朝哪个方向延伸。一个物体的运动不仅需要知道它在哪里，还要知道它往哪里移动。

如果点 $A=(x_1,y_1,z_1)$ ，点 $B=(x_2,y_2,z_2)$ ，那么从 (A) 指向 (B) 的向量是：

(x_2-x_1,\ y_2-y_1,\ z_2-z_1)

这个向量表示的是从 (A) 到 (B) 的位移。它既有大小，也有方向。

定义 – 有限维向量空间的坐标向量

设 $E = {v_1, v_2, \dots, v_n}$ 是向量空间 $V$ 的一个有序基，则 $V$ 中的任意向量 $\boldsymbol{x}$ 都可唯一表示为：

\boldsymbol{x} = \alpha_1 v_1 + \alpha_2 v_2 + \dots + \alpha_n v_n

其中 $\alpha_i (i=1,2,\dots,n)$ 为标量，称为向量空间 $V$ 中向量 $\boldsymbol {x}$ 关于有序基 $E$ 的坐标 (Coordinates)。向量 $({\alpha }_{1},{\alpha }_{2},\dots ,{\alpha }_{n}{)}^\mathrm{T}_{E}$ 称为向量空间 $V$ 中向量 $\boldsymbol {x}$ 相关于基 $E$ 的坐标向量 (Coordinate vector)，记为 $[\boldsymbol {x}{]}_{E}$ 。

有了方向之后，还需要有一种衡量向量大小的方法：

定义 – $\mathbb{R}^3$ 中向量的欧几里得长度

设 $\boldsymbol{x} = (x_1, x_2, x_3)^\mathrm{T}$ 是 $\mathbb{R}^3$ 中的向量，则 $\boldsymbol{x}$ 的欧几里得长度定义为一个实数：

p(\boldsymbol{x}) = \sqrt{x_1^2 + x_2^2 + x_3^2} = \sqrt{\sum_{i=1}^3 x_i^2},

我们用 $\|\boldsymbol{x}\|$ 表示这个数值。若 $\|\boldsymbol{x}\| = 1$ ，则称 $\boldsymbol{x}$ 为单位向量。

这个定义可以扩展到更大的有限维空间，那时它将被称为范数（norm），用以度量“向量有多大”。

欧几里得范数有三条基本的性质：

欧几里得范数的性质

正齐次性（Positive homogeneity）

公式： $\|\lambda \boldsymbol{u}\| = |\lambda| \cdot \|\boldsymbol{u}\|$

含义：标量 $\lambda$ 与向量 $\boldsymbol{u}$ 相乘后，向量的模长等于标量的绝对值乘以原向量的模长。
几何意义：标量乘法只会改变向量的长度（缩放）和方向（\lambda<0时反向），不会改变模长的计算规则。

三角不等式（Triangle inequality）

公式： $\|\boldsymbol{u} + \boldsymbol{v}\| \leq \|\boldsymbol{u}\| + \|\boldsymbol{v}\|$

含义：两个向量和的模长，不大于两个向量模长的和。
几何意义：以 $\boldsymbol{u}$ 和 $\boldsymbol{v}$ 为邻边的三角形中，第三边（ $\boldsymbol{u}+\boldsymbol{v}$ ）的长度不超过另外两边长度之和，等号当且仅当 $\boldsymbol{u}$ 与 $\boldsymbol{v}$ 同向时成立。

正定性（Positivity）

公式： $\|\boldsymbol{u}\| \geq 0,\quad \|\boldsymbol{u}\| = 0 \iff \boldsymbol{u} = \boldsymbol{0}$

含义：向量的模长是非负实数，且模长为0的充要条件是该向量为零向量。
几何意义：向量的长度不可能为负，只有零向量没有长度（起点与终点重合）。

对于 $\mathbb{R}^n$ 中的非零向量 $\boldsymbol{x}$ ，将 ${x}_{0}=\frac {x} {\|x\|}$ 称为其方向向量（Direction vector）。

······

学习线性代数以后，向量的意义还会进一步扩大。它不只是几何中的箭头，也可以表示很多抽象对象。比如一个学生的多科成绩可以看作一个向量，一张图片的像素可以看作一个高维向量，一段文字经过 AI 模型处理后也可以变成一个高维向量。

向量其实是一种非常普遍的数学语言。它最开始可能只是用来描述平面或空间中的方向，但后来却能描述数据、图像、文本，甚至人的偏好和语义关系。

四、内积 – 用一个数描述角度关系

在解析几何中，内积是一个很关键的概念。两个向量 $\boldsymbol{u}=(u_1,u_2,u_3)$ 和 $\boldsymbol{v}=(v_1,v_2,v_3)$ 的内积为

u_1v_1+u_2v_2+u_3v_3

内积看起来只是一个计算规则。但它真正重要的地方是与夹角有关：

|\boldsymbol{u}||\boldsymbol{v}|\cos\theta

也就是说，内积可以把两个向量之间的角度关系转化成一个数。

特别地，当

\boldsymbol{u}\cdot\boldsymbol{v}=0

时，两个非零向量互相垂直。

这些东西我们在高中的时候就知道，判断两条直线是否垂直，可以看方向向量的内积；判断一个向量是否在某个平面内，也可以借助它和法向量的关系；平面方程的推导，也是依赖“平面内的方向向量与法向量垂直”。

内积把“角度”这样一个几何概念，变成了代数计算，垂直不一定要从图像上看出来，并且不仅局限于二维和三维空间。

五、平面和直线方程

通过坐标系、向量等等的工具，一些简单的几何对象可以被方程或方程组简单描述。

（憾的是这里所定义的平面应该被称为笛卡尔平面而非欧几里得平面，因为欧几里得只将其列为早期公理体系中的第四个公理来处理，而没有用数值去度量长度、角度或者面积。）

在三维空间中，一个平面可以由一个点和一个法向量确定。设平面经过点 $P_0(x_0,y_0,z_0)$ ，法向量为 $\boldsymbol{n}=(A,B,C)$ 。若如 $P(x,y,z)$ 是平面上的任意一点，那么向量 $(x-x_0,\ y-y_0,\ z-z_0)$ 就在平面内。由于法向量垂直于平面，所以有：

\overrightarrow{P_0P}\cdot \boldsymbol{n}=0

展开后得到：

A(x-x_0)+B(y-y_0)+C(z-z_0)=0

进一步化简为：

Ax+By+Cz+D=0

所以，平面方程不是凭空出现的代数式，而是“垂直关系”的代数表达。平面方程的定义如下：

定义 – 平面的方程

设 $\boldsymbol{n} = (A, B, C)^\mathrm{T} \in \mathbb{R}^3$ ， $P_0(x_0, y_0, z_0)$ 为 $\mathbb{R}^3$ 中的一点，则过点 $P_0$ 且以 $\boldsymbol{n}$ 为法向量的平面方程为：

A(x - x_0) + B(y - y_0) + C(z - z_0) = 0 \quad (\text{分量形式})

或

Ax + By + Cz + D = 0 \quad (\text{一般形式})

其中 $D = -Ax_0 – By_0 – Cz_0$ ；亦或

\overrightarrow{P_0P} \cdot \boldsymbol{n} = 0 \quad (\text{向量形式})

这里的 $P(x, y, z)$ 是平面上的任意一点。

空间中的直线可以由一个点和一个方向向量确定：

定义 – 直线的方程

设 $P_0(x_0, y_0, z_0)$ 为直线上一点， $\boldsymbol{v} = (l, m, n)^\mathrm{T}$ 为直线的方向向量，则直线的向量形式方程为：

\overrightarrow{P_0P} = t \cdot \boldsymbol{v} \quad \text{或} \quad \boldsymbol{r} = \boldsymbol{r}_0 + t\boldsymbol{v},\quad t \in \mathbb{R}

其中 $\boldsymbol{r} = (x, y, z)^\mathrm{T}，\boldsymbol{r}_0 = (x_0, y_0, z_0)^\mathrm{T}$ 。直线的参数方程（Parametric equation）可写为：

x = x_0 + l \cdot t,\quad y = y_0 + m \cdot t,\quad z = z_0 + n \cdot t

其中 $t$ 为参数（Parameter）。直线的对称式方程（Symmetric form equation）为：

\frac{x - x_0}{l} = \frac{y - y_0}{m} = \frac{z - z_0}{n}

我们用参数描述了运动和生成过程，直线可以用一个参数生成，曲线也可以用参数生成，例如 $\boldsymbol{r}(t)=(x(t),y(t),z(t))$ 就可以表示空间中的一条曲线。

在高等数学中，导数可以描述曲线在某一点的变化方向，积分可以描述面积、体积或累积量。到多元函数中，曲面也可以用参数来表示。

例题

求两个平面 $\pi_1$ 和 $\pi_2$ 相交所形成的直线的参数方程和对称式方程。其中 $\pi_1: 3x-6y-2z = 15, \pi_2: 2x+y-2z=5$ .

查看解答

解答

平面 $\pi_1: 3x – 6y – 2z = 15$ 的法向量 $\mathbf{n_1} = \langle 3, -6, -2 \rangle$
平面 $\pi_2: 2x + y – 2z = 5$ 的法向量 $\mathbf{n_2} = \langle 2, 1, -2 \rangle$

交线的方向向量 $\mathbf{v}$ 是两个法向量的叉乘：

\mathbf{v} = \mathbf{n_1} \times \mathbf{n_2} = \begin{vmatrix} \mathbf{i} & \mathbf{j} & \mathbf{k} \\ 3 & -6 & -2 \\ 2 & 1 & -2 \end{vmatrix} = \langle 14, 2, 15 \rangle

令 $z = 0$ ，解方程组： $\begin{cases} 3x – 6y = 15 \\ 2x + y = 5 \end{cases}$

得到交线上的一个点为 $(3, -1, 0)$ 。

以点 $(3, -1, 0)$ 和方向向量 $\langle 14, 2, 15 \rangle$ ，可得参数方程：

x = 3 + 14t,\quad y = -1 + 2t,\quad z = 15t \quad (t \in \mathbb{R})

将参数方程解出 $t$ 并相等，得到对称方程：

\frac{x - 3}{14} = \frac{y + 1}{2} = \frac{z}{15}

六、叉积

在三维空间中，叉积是一个很有几何意义的运算。两个不平行向量 $\boldsymbol{u}$ 和 $\boldsymbol{v}$ 的叉积 $\boldsymbol{u}\times\boldsymbol{v}$ 会得到一个同时垂直于它们的新向量。

这就解释了为什么求三个不共线点确定的平面时，可以先构造两个方向向量，再对它们做叉积。因为这两个向量都在平面内，它们的叉积就垂直于这个平面，所以可以作为平面的法向量。

叉积还有面积意义：

|\boldsymbol{u}\times\boldsymbol{v}|

表示以 $\boldsymbol{u}$ 和 $\boldsymbol{v}$ 为邻边的平行四边形面积，叉积既能产生垂直方向，又能表示面积。

在多元微积分中，曲面的面积元素常常与叉积有关。如果曲面被参数化为

\boldsymbol{r}(u,v)

那么两个偏导向量 $\boldsymbol{r}_u$ 和 $\boldsymbol{r}_v$ 描述了曲面在两个参数方向上的切向变化，而

|\boldsymbol{r}_u\times\boldsymbol{r}_v|

则描述了局部面积的伸缩倍数。

七、现代的解析几何

在高数的内容之外，解析几何的内容已经不再只是简单地讨论直线、平面和空间位置关系。坐标、向量、内积、叉乘、法向量这些概念，表面上属于传统空间解析几何，但其体现的是一种更深层的数学思想：把空间关系转化为可以计算、可以推广的代数结构。

解析几何不仅是一门研究图形的学科，更是一种描述空间、理解关系和处理数据的方法。它最初研究的是二维平面和三维空间中的点、线、面，但随着数学的发展，这种思想逐渐延伸到了数学分析、线性代数、计算机图形学以及人工智能等领域。

在数学分析中，解析几何与函数图像有着密切联系。一元函数

y=f(x)

的图像可以看作平面中的一条曲线。解析几何关心这条曲线由哪些点组成，而数学分析进一步研究它在某一点附近如何变化。导数

f'(x)

可以理解为曲线在某一点处切线的斜率，也就是局部变化率。

到了多元函数中，函数图像从曲线推广为空间中的曲面。例如

z=f(x,y)

表示三维空间中的一张曲面。此时，偏导数描述曲面沿不同方向的变化率，梯度

\nabla f

则指向函数增长最快的方向。

因此，数学分析并不是脱离解析几何的另一套体系。解析几何提供了图形和空间的语言，数学分析则进一步研究这些图形的局部变化、极值、面积、体积和累积过程。导数、切线、梯度、曲面积分等内容，都可以看作解析几何思想在“变化”问题中的延伸。

在线性代数中，解析几何的思想同样得到了进一步发展。矩阵不仅是代数运算的工具，也可以看作几何变换的表示。一个向量经过矩阵作用：

\boldsymbol{y}=A\boldsymbol{x}

可以理解为图形发生了旋转、缩放、投影、拉伸或对称等变化。

例如，旋转矩阵可以改变向量的方向，缩放矩阵可以改变图形的大小，投影矩阵可以把空间中的对象压到某个平面或子空间上。行列式可以表示面积或体积的缩放倍数，特征向量则表示在线性变换后方向保持不变的特殊方向。

光照计算同样离不开解析几何。一个物体表面的明暗程度，往往与光线方向和表面法向量之间的夹角有关。如果光线方向与法向量越接近，表面通常越亮；如果夹角越大，表面就会变暗。这个过程背后常常用到内积：

\boldsymbol{n}\cdot \boldsymbol{l}

其中 $\boldsymbol{n}$ 表示表面法向量， $\boldsymbol{l}$ 表示光线方向。屏幕上看似自然的三维画面，其实背后有大量解析几何的计算。角色移动、镜头旋转、物体碰撞、阴影变化、模型投影，都离不开点、向量、平面、距离、夹角和矩阵变换。

在大模型时代，解析几何的思想又被推广到了更抽象的高维空间。现实中能够直观看到的是二维和三维空间，但在计算机中，一张图片、一段文字、一段声音，甚至一个用户的兴趣偏好，都可以被表示为高维向量。

例如，一段文字经过模型编码后，可能变成一个几百维甚至上千维的向量。这个向量并不是现实空间中的箭头，却仍然可以计算距离、夹角和相似度。在这种高维空间中，“距离近”往往表示对象之间更加相似；“方向接近”则可能表示它们具有相近的语义或特征。

文本检索、图像识别、推荐系统和机器学习分类，都可以从这种几何角度理解。一个简单的分类模型，常常可以看作在高维空间中寻找一个超平面：

\boldsymbol{w}\cdot\boldsymbol{x}+b=0

这个超平面将不同类别的数据点分开。它与三维空间中的平面方程

Ax+By+Cz+D=0

在形式和思想上都十分相似，只是被推广到了更高维的空间中。

这说明，解析几何并不是只研究纸面上能画出来的图形。它真正重要的地方在于提供了一套理解空间结构的方法。这个空间可以是平面中的坐标系，可以是现实中的三维空间，也可以是计算机中的高维数据空间。

解析几何的现代意义并不局限于求直线方程、平面方程或点到平面的距离。它更重要的价值在于，让复杂对象能够被放入一个可计算的空间中，使原本抽象的关系变得可以度量、可以分析、可以处理。