线性代数 – 解析几何的历史和现代意义

7,776字

,大约需要

33–49 分钟

早在古希腊时期,人们就已经开始系统研究点、直线、圆、角、三角形以及空间中的各种图形。欧几里得的《几何原本》以公理化的方式建立了平面几何的基本体系:从少数公理和公设出发,通过严密的逻辑推理得到大量几何命题。此时的几何学主要依靠图形、作图和演绎证明,强调的是“形”的直观关系。

然而,随着数学和自然科学的发展,仅仅依靠图形推理逐渐显得不够方便。天文学、力学、工程测量等领域需要更精确地描述位置、轨迹、距离和变化。能不能把几何图形转化成可以计算的代数对象?换句话说,能不能用数字和方程研究几何?

解析几何的核心思想可以概括为:

解析几何不仅是几何学与代数学的结合,也为后续的线性代数、微积分、空间解析几何、工程建模和计算机图形学等领域奠定了基础。

在解析几何出现之前,几何学已经有了非常丰富的成果。欧几里得几何研究的是理想化的点、线、面以及它们之间的关系。例如,两点确定一条直线,三角形内角和等于两直角,圆可以由圆心和半径确定。这些结论并不依赖坐标,而是通过图形和逻辑证明建立起来的。

古典几何的优势在于直观清晰。比如我们说“两条直线平行”,图形上可以直接看出它们永不相交;我们说“圆上的点到圆心距离相等”,也很容易从图形中理解。

但是古典几何也有局限。比如给定一个圆和一条直线,要求它们是否相交、交点在哪里,单靠作图并不总是方便。如果图形变得复杂,比如椭圆、抛物线、双曲线,或者空间中的平面、直线、曲面,仅凭直观推理就会越来越困难。

数学需要一种既保留几何直观,又能够进行精确计算的新语言。


解析几何的突破,来自坐标思想。坐标系相当于给空间建立了一张数字地图。在平面中,如果规定两条互相垂直的数轴,一条作为 (x) 轴,一条作为 (y) 轴,那么平面上的每一个点都可以用一个有序数对表示:

P=(x,y)

在三维空间中,加入第三条坐标轴 (z) 轴,一个点就可以表示为:

P=(x,y,z)

点的信息一旦可以用数字表示,几何对象就可以转化为代数对象。

例如,在平面直角坐标系中,所有满足 x2+y2=r2x^2+y^2=r^2 的点构成一个以原点为圆心、半径为 (r) 的圆。原本需要用语言描述的圆,现在变成了一个方程。同样,一条直线可以写成 ax+by+c=0ax+by+c=0,一个球面可以写成 x2+y2+z2=R2x^2+y^2+z^2=R^2

坐标系把几何对象转化成了方程的解集。“曲线、曲面”,从解析几何的角度看,就是满足某个方程的一切点的集合。


Caspar Wessel

一条直线不仅需要知道它经过哪里,还要知道它朝哪个方向延伸。一个物体的运动不仅需要知道它在哪里,还要知道它往哪里移动。

如果点 A=(x1,y1,z1)A=(x_1,y_1,z_1),点 B=(x2,y2,z2)B=(x_2,y_2,z_2),那么从 (A) 指向 (B) 的向量是:

(x_2-x_1,\ y_2-y_1,\ z_2-z_1)

这个向量表示的是从 (A) 到 (B) 的位移。它既有大小,也有方向。

定义 – 有限维向量空间的坐标向量

E=v1,v2,,vnE = {v_1, v_2, \dots, v_n} 是向量空间 VV 的一个有序基,则VV中的任意向量 𝒙\boldsymbol{x} 都可唯一表示为:

\boldsymbol{x} = \alpha_1 v_1 + \alpha_2 v_2 + \dots + \alpha_n v_n

其中 αi(i=1,2,,n)\alpha_i (i=1,2,\dots,n) 为标量,称为向量空间 VV 中向量 𝒙\boldsymbol {x} 关于有序基 EE坐标 (Coordinates)。向量 (α1,α2,,αn)ET({\alpha }_{1},{\alpha }_{2},\dots ,{\alpha }_{n}{)}^\mathrm{T}_{E} 称为向量空间 VV 中向量 𝒙\boldsymbol {x} 相关于基 EE坐标向量 (Coordinate vector),记为 [𝒙]E[\boldsymbol {x}{]}_{E}

有了方向之后,还需要有一种衡量向量大小的方法:

定义 – 3\mathbb{R}^3中向量的欧几里得长度

𝒙=(x1,x2,x3)T\boldsymbol{x} = (x_1, x_2, x_3)^\mathrm{T}3\mathbb{R}^3 中的向量,则 𝒙\boldsymbol{x} 的欧几里得长度定义为一个实数:

p(\boldsymbol{x}) = \sqrt{x_1^2 + x_2^2 + x_3^2} = \sqrt{\sum_{i=1}^3 x_i^2},

我们用 𝒙\|\boldsymbol{x}\| 表示这个数值。若 𝒙=1\|\boldsymbol{x}\| = 1 ,则称 𝒙\boldsymbol{x} 为单位向量。

这个定义可以扩展到更大的有限维空间,那时它将被称为范数(norm),用以度量“向量有多大”。

欧几里得范数有三条基本的性质:

欧几里得范数的性质

正齐次性(Positive homogeneity)

公式:λ𝒖=|λ|𝒖\|\lambda \boldsymbol{u}\| = |\lambda| \cdot \|\boldsymbol{u}\|

  • 含义:标量 λ\lambda 与向量 𝒖\boldsymbol{u} 相乘后,向量的模长等于标量的绝对值乘以原向量的模长。
  • 几何意义:标量乘法只会改变向量的长度(缩放)和方向(\lambda<0时反向),不会改变模长的计算规则。

三角不等式(Triangle inequality)

公式:𝒖+𝒗𝒖+𝒗\|\boldsymbol{u} + \boldsymbol{v}\| \leq \|\boldsymbol{u}\| + \|\boldsymbol{v}\|

  • 含义:两个向量和的模长,不大于两个向量模长的和。
  • 几何意义:以 𝒖\boldsymbol{u}𝒗\boldsymbol{v} 为邻边的三角形中,第三边(𝒖+𝒗\boldsymbol{u}+\boldsymbol{v})的长度不超过另外两边长度之和,等号当且仅当 𝒖\boldsymbol{u}𝒗\boldsymbol{v} 同向时成立。

正定性(Positivity)

公式:𝒖0,𝒖=0𝒖=0\|\boldsymbol{u}\| \geq 0,\quad \|\boldsymbol{u}\| = 0 \iff \boldsymbol{u} = \boldsymbol{0}

  • 含义:向量的模长是非负实数,且模长为0的充要条件是该向量为零向量。
  • 几何意义:向量的长度不可能为负,只有零向量没有长度(起点与终点重合)。

对于 n\mathbb{R}^n 中的非零向量 𝒙\boldsymbol{x} ,将 x0=xx{x}_{0}=\frac {x} {\|x\|} 称为其方向向量(Direction vector)

······

学习线性代数以后,向量的意义还会进一步扩大。它不只是几何中的箭头,也可以表示很多抽象对象。比如一个学生的多科成绩可以看作一个向量,一张图片的像素可以看作一个高维向量,一段文字经过 AI 模型处理后也可以变成一个高维向量。

向量其实是一种非常普遍的数学语言。它最开始可能只是用来描述平面或空间中的方向,但后来却能描述数据、图像、文本,甚至人的偏好和语义关系。


在解析几何中,内积是一个很关键的概念。两个向量 𝒖=(u1,u2,u3)\boldsymbol{u}=(u_1,u_2,u_3)𝒗=(v1,v2,v3)\boldsymbol{v}=(v_1,v_2,v_3) 的内积为

u_1v_1+u_2v_2+u_3v_3

内积看起来只是一个计算规则。但它真正重要的地方是与夹角有关:

|\boldsymbol{u}||\boldsymbol{v}|\cos\theta

也就是说,内积可以把两个向量之间的角度关系转化成一个数。

特别地,当

\boldsymbol{u}\cdot\boldsymbol{v}=0

时,两个非零向量互相垂直。

这些东西我们在高中的时候就知道,判断两条直线是否垂直,可以看方向向量的内积;判断一个向量是否在某个平面内,也可以借助它和法向量的关系;平面方程的推导,也是依赖“平面内的方向向量与法向量垂直”。

内积把“角度”这样一个几何概念,变成了代数计算,垂直不一定要从图像上看出来,并且不仅局限于二维和三维空间。


通过坐标系、向量等等的工具,一些简单的几何对象可以被方程或方程组简单描述。

(憾的是这里所定义的平面应该被称为笛卡尔平面而非欧几里得平面,因为欧几里得只将其列为早期公理体系中的第四个公理来处理,而没有用数值去度量长度、角度或者面积。)

在三维空间中,一个平面可以由一个点和一个法向量确定。设平面经过点 P0(x0,y0,z0)P_0(x_0,y_0,z_0),法向量为 𝒏=(A,B,C)\boldsymbol{n}=(A,B,C)。若如 P(x,y,z)P(x,y,z) 是平面上的任意一点,那么向量 (xx0, yy0, zz0)(x-x_0,\ y-y_0,\ z-z_0) 就在平面内。由于法向量垂直于平面,所以有:

\overrightarrow{P_0P}\cdot \boldsymbol{n}=0

展开后得到:

A(x-x_0)+B(y-y_0)+C(z-z_0)=0

进一步化简为:

Ax+By+Cz+D=0

所以,平面方程不是凭空出现的代数式,而是“垂直关系”的代数表达。平面方程的定义如下:

定义 – 平面的方程

𝒏=(A,B,C)T3\boldsymbol{n} = (A, B, C)^\mathrm{T} \in \mathbb{R}^3P0(x0,y0,z0)P_0(x_0, y_0, z_0)3\mathbb{R}^3 中的一点,则过点 P0P_0 且以 𝒏\boldsymbol{n} 为法向量的平面方程为:

A(x - x_0) + B(y - y_0) + C(z - z_0) = 0 \quad (\text{分量形式})

Ax + By + Cz + D = 0 \quad (\text{一般形式})

其中 D=Ax0By0Cz0D = -Ax_0 – By_0 – Cz_0 ;亦或

\overrightarrow{P_0P} \cdot \boldsymbol{n} = 0 \quad (\text{向量形式})

这里的 P(x,y,z)P(x, y, z) 是平面上的任意一点。

空间中的直线可以由一个点和一个方向向量确定:

定义 – 直线的方程

P0(x0,y0,z0)P_0(x_0, y_0, z_0) 为直线上一点,𝒗=(l,m,n)T\boldsymbol{v} = (l, m, n)^\mathrm{T} 为直线的方向向量,则直线的向量形式方程为:

\overrightarrow{P_0P} = t \cdot \boldsymbol{v} \quad \text{或} \quad \boldsymbol{r} = \boldsymbol{r}_0 + t\boldsymbol{v},\quad t \in \mathbb{R}

其中 𝒓=(x,y,z)T𝒓0=(x0,y0,z0)T\boldsymbol{r} = (x, y, z)^\mathrm{T},\boldsymbol{r}_0 = (x_0, y_0, z_0)^\mathrm{T} 。直线的参数方程(Parametric equation)可写为:

x = x_0 + l \cdot t,\quad y = y_0 + m \cdot t,\quad z = z_0 + n \cdot t

其中 tt参数(Parameter)。直线的对称式方程(Symmetric form equation)为:

\frac{x - x_0}{l} = \frac{y - y_0}{m} = \frac{z - z_0}{n}

我们用参数描述了运动和生成过程,直线可以用一个参数生成,曲线也可以用参数生成,例如 𝒓(t)=(x(t),y(t),z(t))\boldsymbol{r}(t)=(x(t),y(t),z(t)) 就可以表示空间中的一条曲线。

在高等数学中,导数可以描述曲线在某一点的变化方向,积分可以描述面积、体积或累积量。到多元函数中,曲面也可以用参数来表示。

例题

求两个平面 π1\pi_1π2\pi_2 相交所形成的直线的参数方程和对称式方程。其中 π1:3x6y2z=15,π2:2x+y2z=5\pi_1: 3x-6y-2z = 15, \pi_2: 2x+y-2z=5.

查看解答

解答

  • 平面 π1:3x6y2z=15\pi_1: 3x – 6y – 2z = 15 的法向量 𝐧𝟏=3,6,2\mathbf{n_1} = \langle 3, -6, -2 \rangle
  • 平面 π2:2x+y2z=5\pi_2: 2x + y – 2z = 5 的法向量 𝐧𝟐=2,1,2\mathbf{n_2} = \langle 2, 1, -2 \rangle

交线的方向向量 𝐯\mathbf{v} 是两个法向量的叉乘:

\mathbf{v} = \mathbf{n_1} \times \mathbf{n_2} = \begin{vmatrix}
\mathbf{i} & \mathbf{j} & \mathbf{k} \\
3 & -6 & -2 \\
2 & 1 & -2
\end{vmatrix} = \langle 14, 2, 15 \rangle

z=0z = 0 ,解方程组:{3x6y=152x+y=5\begin{cases} 3x – 6y = 15 \\ 2x + y = 5 \end{cases}

得到交线上的一个点为 (3,1,0)(3, -1, 0)

以点 (3,1,0)(3, -1, 0) 和方向向量 14,2,15\langle 14, 2, 15 \rangle ,可得参数方程:

x = 3 + 14t,\quad y = -1 + 2t,\quad z = 15t \quad (t \in \mathbb{R})

将参数方程解出 tt 并相等,得到对称方程:

\frac{x - 3}{14} = \frac{y + 1}{2} = \frac{z}{15}

在三维空间中,叉积是一个很有几何意义的运算。两个不平行向量 𝒖\boldsymbol{u}𝒗\boldsymbol{v} 的叉积 𝒖×𝒗\boldsymbol{u}\times\boldsymbol{v} 会得到一个同时垂直于它们的新向量。

这就解释了为什么求三个不共线点确定的平面时,可以先构造两个方向向量,再对它们做叉积。因为这两个向量都在平面内,它们的叉积就垂直于这个平面,所以可以作为平面的法向量。

叉积还有面积意义:

|\boldsymbol{u}\times\boldsymbol{v}|

表示以 𝒖\boldsymbol{u}𝒗\boldsymbol{v} 为邻边的平行四边形面积,叉积既能产生垂直方向,又能表示面积。

在多元微积分中,曲面的面积元素常常与叉积有关。如果曲面被参数化为

\boldsymbol{r}(u,v)

那么两个偏导向量 𝒓u\boldsymbol{r}_u𝒓v\boldsymbol{r}_v 描述了曲面在两个参数方向上的切向变化,而

|\boldsymbol{r}_u\times\boldsymbol{r}_v|

则描述了局部面积的伸缩倍数。


在高数的内容之外,解析几何的内容已经不再只是简单地讨论直线、平面和空间位置关系。坐标、向量、内积、叉乘、法向量这些概念,表面上属于传统空间解析几何,但其体现的是一种更深层的数学思想:把空间关系转化为可以计算、可以推广的代数结构。

解析几何不仅是一门研究图形的学科,更是一种描述空间、理解关系和处理数据的方法。它最初研究的是二维平面和三维空间中的点、线、面,但随着数学的发展,这种思想逐渐延伸到了数学分析、线性代数、计算机图形学以及人工智能等领域。

在数学分析中,解析几何与函数图像有着密切联系。一元函数

y=f(x)

的图像可以看作平面中的一条曲线。解析几何关心这条曲线由哪些点组成,而数学分析进一步研究它在某一点附近如何变化。导数

f'(x)

可以理解为曲线在某一点处切线的斜率,也就是局部变化率。

到了多元函数中,函数图像从曲线推广为空间中的曲面。例如

z=f(x,y)

表示三维空间中的一张曲面。此时,偏导数描述曲面沿不同方向的变化率,梯度

\nabla f

则指向函数增长最快的方向。

因此,数学分析并不是脱离解析几何的另一套体系。解析几何提供了图形和空间的语言,数学分析则进一步研究这些图形的局部变化、极值、面积、体积和累积过程。导数、切线、梯度、曲面积分等内容,都可以看作解析几何思想在“变化”问题中的延伸。

在线性代数中,解析几何的思想同样得到了进一步发展。矩阵不仅是代数运算的工具,也可以看作几何变换的表示。一个向量经过矩阵作用:

\boldsymbol{y}=A\boldsymbol{x}

可以理解为图形发生了旋转、缩放、投影、拉伸或对称等变化。

例如,旋转矩阵可以改变向量的方向,缩放矩阵可以改变图形的大小,投影矩阵可以把空间中的对象压到某个平面或子空间上。行列式可以表示面积或体积的缩放倍数,特征向量则表示在线性变换后方向保持不变的特殊方向。

光照计算同样离不开解析几何。一个物体表面的明暗程度,往往与光线方向和表面法向量之间的夹角有关。如果光线方向与法向量越接近,表面通常越亮;如果夹角越大,表面就会变暗。这个过程背后常常用到内积:

\boldsymbol{n}\cdot \boldsymbol{l}

其中 𝒏\boldsymbol{n} 表示表面法向量,𝒍\boldsymbol{l} 表示光线方向。屏幕上看似自然的三维画面,其实背后有大量解析几何的计算。角色移动、镜头旋转、物体碰撞、阴影变化、模型投影,都离不开点、向量、平面、距离、夹角和矩阵变换。

在大模型时代,解析几何的思想又被推广到了更抽象的高维空间。现实中能够直观看到的是二维和三维空间,但在计算机中,一张图片、一段文字、一段声音,甚至一个用户的兴趣偏好,都可以被表示为高维向量。

例如,一段文字经过模型编码后,可能变成一个几百维甚至上千维的向量。这个向量并不是现实空间中的箭头,却仍然可以计算距离、夹角和相似度。在这种高维空间中,“距离近”往往表示对象之间更加相似;“方向接近”则可能表示它们具有相近的语义或特征。

文本检索、图像识别、推荐系统和机器学习分类,都可以从这种几何角度理解。一个简单的分类模型,常常可以看作在高维空间中寻找一个超平面:

\boldsymbol{w}\cdot\boldsymbol{x}+b=0

这个超平面将不同类别的数据点分开。它与三维空间中的平面方程

Ax+By+Cz+D=0

在形式和思想上都十分相似,只是被推广到了更高维的空间中。

这说明,解析几何并不是只研究纸面上能画出来的图形。它真正重要的地方在于提供了一套理解空间结构的方法。这个空间可以是平面中的坐标系,可以是现实中的三维空间,也可以是计算机中的高维数据空间。

解析几何的现代意义并不局限于求直线方程、平面方程或点到平面的距离。它更重要的价值在于,让复杂对象能够被放入一个可计算的空间中,使原本抽象的关系变得可以度量、可以分析、可以处理。