早在古希腊时期,人们就已经开始系统研究点、直线、圆、角、三角形以及空间中的各种图形。欧几里得的《几何原本》以公理化的方式建立了平面几何的基本体系:从少数公理和公设出发,通过严密的逻辑推理得到大量几何命题。此时的几何学主要依靠图形、作图和演绎证明,强调的是“形”的直观关系。
然而,随着数学和自然科学的发展,仅仅依靠图形推理逐渐显得不够方便。天文学、力学、工程测量等领域需要更精确地描述位置、轨迹、距离和变化。能不能把几何图形转化成可以计算的代数对象?换句话说,能不能用数字和方程研究几何?
解析几何的核心思想可以概括为:
用坐标描述位置,用向量描述方向与位移,用方程描述几何对象,用代数方法研究几何关系。
OR —
用坐标表示点,用向量表示方向和位移,用方程表示曲线、曲面、直线和平面。解析几何不仅是几何学与代数学的结合,也为后续的线性代数、微积分、空间解析几何、工程建模和计算机图形学等领域奠定了基础。

一、很早以前
在解析几何出现之前,几何学已经有了非常丰富的成果。欧几里得几何研究的是理想化的点、线、面以及它们之间的关系。例如,两点确定一条直线,三角形内角和等于两直角,圆可以由圆心和半径确定。这些结论并不依赖坐标,而是通过图形和逻辑证明建立起来的。
古典几何的优势在于直观清晰。比如我们说“两条直线平行”,图形上可以直接看出它们永不相交;我们说“圆上的点到圆心距离相等”,也很容易从图形中理解。
但是古典几何也有局限。比如给定一个圆和一条直线,要求它们是否相交、交点在哪里,单靠作图并不总是方便。如果图形变得复杂,比如椭圆、抛物线、双曲线,或者空间中的平面、直线、曲面,仅凭直观推理就会越来越困难。
数学需要一种既保留几何直观,又能够进行精确计算的新语言。
二、坐标系
解析几何的突破,来自坐标思想。坐标系相当于给空间建立了一张数字地图。在平面中,如果规定两条互相垂直的数轴,一条作为 (x) 轴,一条作为 (y) 轴,那么平面上的每一个点都可以用一个有序数对表示:
P=(x,y)
在三维空间中,加入第三条坐标轴 (z) 轴,一个点就可以表示为:
P=(x,y,z)
点的信息一旦可以用数字表示,几何对象就可以转化为代数对象。
例如,在平面直角坐标系中,所有满足 的点构成一个以原点为圆心、半径为 (r) 的圆。原本需要用语言描述的圆,现在变成了一个方程。同样,一条直线可以写成 ,一个球面可以写成 。
坐标系把几何对象转化成了方程的解集。“曲线、曲面”,从解析几何的角度看,就是满足某个方程的一切点的集合。
三、向量 – 既有大小又有方向

一条直线不仅需要知道它经过哪里,还要知道它朝哪个方向延伸。一个物体的运动不仅需要知道它在哪里,还要知道它往哪里移动。
如果点 ,点 ,那么从 (A) 指向 (B) 的向量是:
(x_2-x_1,\ y_2-y_1,\ z_2-z_1)
这个向量表示的是从 (A) 到 (B) 的位移。它既有大小,也有方向。
定义 – 有限维向量空间的坐标向量
设 是向量空间 的一个有序基,则中的任意向量 都可唯一表示为:
\boldsymbol{x} = \alpha_1 v_1 + \alpha_2 v_2 + \dots + \alpha_n v_n其中 为标量,称为向量空间 中向量 关于有序基 的坐标 (Coordinates)。向量 称为向量空间 中向量 相关于基 的坐标向量 (Coordinate vector),记为 。
有了方向之后,还需要有一种衡量向量大小的方法:
定义 – 中向量的欧几里得长度
设 是 中的向量,则 的欧几里得长度定义为一个实数:
p(\boldsymbol{x}) = \sqrt{x_1^2 + x_2^2 + x_3^2} = \sqrt{\sum_{i=1}^3 x_i^2},我们用 表示这个数值。若 ,则称 为单位向量。
这个定义可以扩展到更大的有限维空间,那时它将被称为范数(norm),用以度量“向量有多大”。
欧几里得范数有三条基本的性质:
欧几里得范数的性质
正齐次性(Positive homogeneity)
公式:
- 含义:标量 与向量 相乘后,向量的模长等于标量的绝对值乘以原向量的模长。
- 几何意义:标量乘法只会改变向量的长度(缩放)和方向(\lambda<0时反向),不会改变模长的计算规则。
三角不等式(Triangle inequality)
公式:
- 含义:两个向量和的模长,不大于两个向量模长的和。
- 几何意义:以 和 为邻边的三角形中,第三边()的长度不超过另外两边长度之和,等号当且仅当 与 同向时成立。
正定性(Positivity)
公式:
- 含义:向量的模长是非负实数,且模长为0的充要条件是该向量为零向量。
- 几何意义:向量的长度不可能为负,只有零向量没有长度(起点与终点重合)。
对于 中的非零向量 ,将 称为其方向向量(Direction vector)。
······
学习线性代数以后,向量的意义还会进一步扩大。它不只是几何中的箭头,也可以表示很多抽象对象。比如一个学生的多科成绩可以看作一个向量,一张图片的像素可以看作一个高维向量,一段文字经过 AI 模型处理后也可以变成一个高维向量。
向量其实是一种非常普遍的数学语言。它最开始可能只是用来描述平面或空间中的方向,但后来却能描述数据、图像、文本,甚至人的偏好和语义关系。
四、内积 – 用一个数描述角度关系
在解析几何中,内积是一个很关键的概念。两个向量 和 的内积为
u_1v_1+u_2v_2+u_3v_3
内积看起来只是一个计算规则。但它真正重要的地方是与夹角有关:
|\boldsymbol{u}||\boldsymbol{v}|\cos\theta也就是说,内积可以把两个向量之间的角度关系转化成一个数。
特别地,当
\boldsymbol{u}\cdot\boldsymbol{v}=0时,两个非零向量互相垂直。
这些东西我们在高中的时候就知道,判断两条直线是否垂直,可以看方向向量的内积;判断一个向量是否在某个平面内,也可以借助它和法向量的关系;平面方程的推导,也是依赖“平面内的方向向量与法向量垂直”。
内积把“角度”这样一个几何概念,变成了代数计算,垂直不一定要从图像上看出来,并且不仅局限于二维和三维空间。
五、平面和直线方程
通过坐标系、向量等等的工具,一些简单的几何对象可以被方程或方程组简单描述。
(憾的是这里所定义的平面应该被称为笛卡尔平面而非欧几里得平面,因为欧几里得只将其列为早期公理体系中的第四个公理来处理,而没有用数值去度量长度、角度或者面积。)
在三维空间中,一个平面可以由一个点和一个法向量确定。设平面经过点 ,法向量为 。若如 是平面上的任意一点,那么向量 就在平面内。由于法向量垂直于平面,所以有:
\overrightarrow{P_0P}\cdot \boldsymbol{n}=0展开后得到:
A(x-x_0)+B(y-y_0)+C(z-z_0)=0
进一步化简为:
Ax+By+Cz+D=0
所以,平面方程不是凭空出现的代数式,而是“垂直关系”的代数表达。平面方程的定义如下:
定义 – 平面的方程
设 , 为 中的一点,则过点 且以 为法向量的平面方程为:
A(x - x_0) + B(y - y_0) + C(z - z_0) = 0 \quad (\text{分量形式})或
Ax + By + Cz + D = 0 \quad (\text{一般形式})其中 ;亦或
\overrightarrow{P_0P} \cdot \boldsymbol{n} = 0 \quad (\text{向量形式})这里的 是平面上的任意一点。
空间中的直线可以由一个点和一个方向向量确定:
定义 – 直线的方程
设 为直线上一点, 为直线的方向向量,则直线的向量形式方程为:
\overrightarrow{P_0P} = t \cdot \boldsymbol{v} \quad \text{或} \quad \boldsymbol{r} = \boldsymbol{r}_0 + t\boldsymbol{v},\quad t \in \mathbb{R}其中 。直线的参数方程(Parametric equation)可写为:
x = x_0 + l \cdot t,\quad y = y_0 + m \cdot t,\quad z = z_0 + n \cdot t
其中 为参数(Parameter)。直线的对称式方程(Symmetric form equation)为:
\frac{x - x_0}{l} = \frac{y - y_0}{m} = \frac{z - z_0}{n}我们用参数描述了运动和生成过程,直线可以用一个参数生成,曲线也可以用参数生成,例如 就可以表示空间中的一条曲线。
在高等数学中,导数可以描述曲线在某一点的变化方向,积分可以描述面积、体积或累积量。到多元函数中,曲面也可以用参数来表示。
例题
求两个平面 和 相交所形成的直线的参数方程和对称式方程。其中 .
查看解答
解答
- 平面 的法向量
- 平面 的法向量
交线的方向向量 是两个法向量的叉乘:
\mathbf{v} = \mathbf{n_1} \times \mathbf{n_2} = \begin{vmatrix}
\mathbf{i} & \mathbf{j} & \mathbf{k} \\
3 & -6 & -2 \\
2 & 1 & -2
\end{vmatrix} = \langle 14, 2, 15 \rangle令 ,解方程组:
得到交线上的一个点为 。
以点 和方向向量 ,可得参数方程:
x = 3 + 14t,\quad y = -1 + 2t,\quad z = 15t \quad (t \in \mathbb{R})将参数方程解出 并相等,得到对称方程:
\frac{x - 3}{14} = \frac{y + 1}{2} = \frac{z}{15}六、叉积
在三维空间中,叉积是一个很有几何意义的运算。两个不平行向量 和 的叉积 会得到一个同时垂直于它们的新向量。
这就解释了为什么求三个不共线点确定的平面时,可以先构造两个方向向量,再对它们做叉积。因为这两个向量都在平面内,它们的叉积就垂直于这个平面,所以可以作为平面的法向量。
叉积还有面积意义:
|\boldsymbol{u}\times\boldsymbol{v}|表示以 和 为邻边的平行四边形面积,叉积既能产生垂直方向,又能表示面积。
在多元微积分中,曲面的面积元素常常与叉积有关。如果曲面被参数化为
\boldsymbol{r}(u,v)那么两个偏导向量 和 描述了曲面在两个参数方向上的切向变化,而
|\boldsymbol{r}_u\times\boldsymbol{r}_v|则描述了局部面积的伸缩倍数。
七、现代的解析几何
在高数的内容之外,解析几何的内容已经不再只是简单地讨论直线、平面和空间位置关系。坐标、向量、内积、叉乘、法向量这些概念,表面上属于传统空间解析几何,但其体现的是一种更深层的数学思想:把空间关系转化为可以计算、可以推广的代数结构。
解析几何不仅是一门研究图形的学科,更是一种描述空间、理解关系和处理数据的方法。它最初研究的是二维平面和三维空间中的点、线、面,但随着数学的发展,这种思想逐渐延伸到了数学分析、线性代数、计算机图形学以及人工智能等领域。
在数学分析中,解析几何与函数图像有着密切联系。一元函数
y=f(x)
的图像可以看作平面中的一条曲线。解析几何关心这条曲线由哪些点组成,而数学分析进一步研究它在某一点附近如何变化。导数
f'(x)
可以理解为曲线在某一点处切线的斜率,也就是局部变化率。

到了多元函数中,函数图像从曲线推广为空间中的曲面。例如
z=f(x,y)
表示三维空间中的一张曲面。此时,偏导数描述曲面沿不同方向的变化率,梯度
\nabla f
则指向函数增长最快的方向。
因此,数学分析并不是脱离解析几何的另一套体系。解析几何提供了图形和空间的语言,数学分析则进一步研究这些图形的局部变化、极值、面积、体积和累积过程。导数、切线、梯度、曲面积分等内容,都可以看作解析几何思想在“变化”问题中的延伸。
在线性代数中,解析几何的思想同样得到了进一步发展。矩阵不仅是代数运算的工具,也可以看作几何变换的表示。一个向量经过矩阵作用:
\boldsymbol{y}=A\boldsymbol{x}可以理解为图形发生了旋转、缩放、投影、拉伸或对称等变化。
例如,旋转矩阵可以改变向量的方向,缩放矩阵可以改变图形的大小,投影矩阵可以把空间中的对象压到某个平面或子空间上。行列式可以表示面积或体积的缩放倍数,特征向量则表示在线性变换后方向保持不变的特殊方向。
光照计算同样离不开解析几何。一个物体表面的明暗程度,往往与光线方向和表面法向量之间的夹角有关。如果光线方向与法向量越接近,表面通常越亮;如果夹角越大,表面就会变暗。这个过程背后常常用到内积:
\boldsymbol{n}\cdot \boldsymbol{l}其中 表示表面法向量, 表示光线方向。屏幕上看似自然的三维画面,其实背后有大量解析几何的计算。角色移动、镜头旋转、物体碰撞、阴影变化、模型投影,都离不开点、向量、平面、距离、夹角和矩阵变换。
在大模型时代,解析几何的思想又被推广到了更抽象的高维空间。现实中能够直观看到的是二维和三维空间,但在计算机中,一张图片、一段文字、一段声音,甚至一个用户的兴趣偏好,都可以被表示为高维向量。

例如,一段文字经过模型编码后,可能变成一个几百维甚至上千维的向量。这个向量并不是现实空间中的箭头,却仍然可以计算距离、夹角和相似度。在这种高维空间中,“距离近”往往表示对象之间更加相似;“方向接近”则可能表示它们具有相近的语义或特征。
文本检索、图像识别、推荐系统和机器学习分类,都可以从这种几何角度理解。一个简单的分类模型,常常可以看作在高维空间中寻找一个超平面:
\boldsymbol{w}\cdot\boldsymbol{x}+b=0这个超平面将不同类别的数据点分开。它与三维空间中的平面方程
Ax+By+Cz+D=0
在形式和思想上都十分相似,只是被推广到了更高维的空间中。
这说明,解析几何并不是只研究纸面上能画出来的图形。它真正重要的地方在于提供了一套理解空间结构的方法。这个空间可以是平面中的坐标系,可以是现实中的三维空间,也可以是计算机中的高维数据空间。
解析几何的现代意义并不局限于求直线方程、平面方程或点到平面的距离。它更重要的价值在于,让复杂对象能够被放入一个可计算的空间中,使原本抽象的关系变得可以度量、可以分析、可以处理。


