一点数学:向量
Contents
线性代数是一门处理多维数据的数学分支。维度(dimension)是一个几何学概念,一个平面是二维的,一个立方体是三维的。向量(vector)是线性代数中基本概念,一个向量是多维空间中的一个点,例如一个 $$n$$ 维向量可以表示为 $$(x_1, x_2, …, x_n)$$。
我们的日常都发生在三维空间,因而很难具象化超过三维的物体,但需要用到多维的概念的地方并不少见,物理学通常将时间作为第四个维度,数据科学中数据集的维度更是往往远多于三维,例如电商平台想构建用户画像,数据的维度可以是浏览的商品、点击、停留、ip 属地、搜索词等数据组成的多维数据集)。借助向量,我们就可以轻易地描述高维。
我们从易于可视化和计算的二维向量开始展开对向量的探讨。
二维平面(plane)中,我们定义一个原点(origin)作为参考点,其它的点的位置就可以通过和原点的相对位置来确定,而二维平面中的点也就是二维向量。对于原点以外的点,我们也可以用起始于原点终止于该点的带箭头的直线来表示该点对应的二维向量。
当用平面直角坐标系表示二维平面时,原点就是 $$(0, 0)$$。
向量加法运算是把两个向量的各个维度分别相加,得到的结果是一个新向量。向量加法的另一种描述是把第二个向量进行平移,使其尾部(tail)和第一个向量的头部(tip)重合,相加的到的向量就是第一个向量的尾部和平移后的第二个向量的头部的连线。这种加法也叫作 tip-to-tail addition。用这种方式去理解,二维向量相加的平行四边形法则就很容易推导得到。
如果用走路去类比,两个向量相加可以看成沿着第一个向量的方向走过第一个向量代表的距离,再沿着第二个向量的方向走过第二个向量代表的距离,最终走过的距离和指向的方向就可以用两个向量相加得到的向量来表示。
一个向量也可以拆分成 $$x$$ 和 $$y$$ 两个部分,例如 $$(4, 3) = (4, 0) + (0, 3)$$。向量的长度就是原点到该向量表示的点的距离,拆分成 $$x$$ 和 $$y$$ 两个部分,可以用勾股定理求出向量长度。
向量乘上数字的结果是对被乘向量的伸缩,这样的乘法称为标量乘法(scalar multiplication),乘上的数字通常称为标量(scalar),相乘的过程就是把向量的各个维度都乘上标量。
向量 $$\boldsymbol {v}$$ 的反向向量是 $$\boldsymbol {-v}$$,它与 $$\boldsymbol {v}$$ 长度相等、方向相反。
利用反向向量,我们可以把向量的减法变换成向量的加法,得到的结果是一个长度等于这两个向量的 tail 之间的距离、方向指向被减向量的向量。
References