- 矩阵力量:线性代数全彩图解+微课+Python编程
- 姜伟生
- 1305字
- 2024-12-27 22:14:20
2.6 向量内积:结果为标量
向量内积(inner product),又叫标量积(scalar product)、点积(dot product)、点乘。注意,向量内积的运算结果为标量,而非向量。
给定a和b两个等行数列向量,即
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P53_1258693.jpg?sign=1739558897-O65BYnA3IN5Vl1ucW7BDCj75zcxnCsmg-0-0dbfa6ac9ec09f14aeaae2d2feae1716)
列向量a和b的内积定义为
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P54_1260168.jpg?sign=1739558897-cXbMWZJDgtJ22AhTa7mzThKPaK4StiJt-0-bfa9a039f6857e9aaf0261e6f871751e)
式(2.34)也适用于两个等列数行向量计算内积。注意,向量内积也是一种“向量→标量”的运算规则。
图2.16所示的两个列向量a和b的内积为
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P54_1260169.jpg?sign=1739558897-fprCXFlzXBrxFsJuTLtnISwVNL9hrChS-0-8dafa77cd8dc6b7e7595a5fa9e5de05f)
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P54_1260170.jpg?sign=1739558897-gud3OttoQWGuNFMJIdhSU7cS1uDHWwWR-0-afd25c88de25bd46f2bb3a3657950a10)
图2.16 a和b两个平面向量
Bk4_Ch2_06.py计算上述向量内积。此外,还可以用numpy.dot()计算向量内积。值得注意的是,如果输入为一维数组,则numpy.dot()输出结果为内积。
如果输入为矩阵,则numpy.dot()输出结果为矩阵乘积,相当于矩阵运算符@,如Bk4_Ch2_07.py给出的例子。
numpy.vdot()函数也可以计算两个向量内积。如果输入是矩阵,则矩阵会按照先行后列顺序展开成向量之后,再计算向量内积。Bk4_Ch2_08.py给出相关示例。
常用的向量内积性质如下:
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P54_1260171.jpg?sign=1739558897-OTajzF6voqwW6bIKljJwcjLlBmBm7jfm-0-e79312bdd4d16ca945081a1f8d6e76db)
请读者格外注意以下几个向量内积运算和Σ求和运算的关系:
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P55_1266082.jpg?sign=1739558897-f4ZU7D0GBwRRSCFw7Gq8qSPjtA7805uB-0-2c10f83c8ea56f3ea9e94c8d03dcb8dc)
其中
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P55_1266083.jpg?sign=1739558897-GmvWjl02QnLPYk6saVWSrpSaL7soJFpv-0-5b89ec117d4a65c6c94d7f9de997b4f8)
本书第5章还会从矩阵乘法角度介绍更多求和运算。
几何视角
如图2.16所示,从几何角度看,向量内积相当于两个向量的模(L2范数)与它们之间夹角余弦值三者之积,即
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P55_1266084.jpg?sign=1739558897-t6mxtM7yJ0yv6QcFcm01bWwKD8QjjueT-0-7c32fd40453452ec9da63a503fd16738)
注意:式(2.39)中θ代表向量a和b的“相对夹角”。
此外,向量内积还可以从投影(projection)角度来解释,这是本书第9章要介绍的内容。
a的L2范数也可以通过向量内积求得,即有
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P55_1266086.jpg?sign=1739558897-ZS3wkPheMxWjg1f7hoUZHkLYPuu6sYj8-0-5bcc782a9a52808e3041bc6ca8f24d4b)
左右等式平方得到
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P55_1266087.jpg?sign=1739558897-9M7leynhMOwErkpXvv46f6U5EL9beVZB-0-3073a3c8a23545d411f49698065763d6)
式(2.41)相当于“距离的平方”。
柯西-施瓦茨不等式
观察,我们可以发现cosθ的取值范围为[−1, 1],因此a和b内积的取值范围为
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P55_1266088.jpg?sign=1739558897-sxdfdkFMMLicWNH29nTEkzVawV5r4b51-0-673d1df761d0a0158fa937f9cf7318cf)
图2.17所示为7个不同向量的夹角状态。
θ=0°时,cosθ=1,a和b同向,此时向量内积最大;θ=180°时,cosθ=−1,a和b反向,此时向量内积最小。
平面上,非零向量a与b垂直,a与b夹角为90°,两者向量内积为0,即
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P55_1266089.jpg?sign=1739558897-jt7vmhtliI0MAJLAjcs0UKCgTZyvXjqs-0-6609b2d63d5366b5766637e5e5f4ec7a)
多维向量a与b向量内积为0,我们称a与b正交(orthogonal)。本书上一章提到,正交是线性代数的概念,是垂直的推广。
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P56_1268010.jpg?sign=1739558897-Z2HopRFeSFV4by4nKYMaeJDBat3zJCon-0-c64a405686fe7ab630ccd6f35d696ae7)
图2.17 向量夹角
有了以上分析,我们就可以引入一个重要的不等式——柯西-施瓦茨不等式(Cauchy–Schwarz inequality)
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P56_1268011.jpg?sign=1739558897-w07BHOlVvjYSevxQC5GG68xPoSWQCC44-0-556352ad2a6ec59977903139c085d407)
即
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P56_1268012.jpg?sign=1739558897-oHntg5gjlD4aFKHLLsdmBGwRGOiCpkJ5-0-642dd18df7b09142e4207b08613a679c)
其中:为a与b向量内积的绝对值。
用尖括号来表达向量内积,可以写成
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P56_1268014.jpg?sign=1739558897-ns5pdxgstS1hdY6cyYNgp0D6eeRDSRBl-0-4beace4d92da2a064ec0bf43e379a284)
即
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P56_1268015.jpg?sign=1739558897-Dt5z9DtfyG9WRCCC7eCIcHt5CZw2pdu5-0-8cd5e86cf9ebf08af37f3ce5c3369b6c)
在空间中,上述不等式等价于
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P56_1268018.jpg?sign=1739558897-K5sKXpkoWpwx24oPEQ61D1jGEbV2NDcZ-0-017460a3bdbf84b56913f3de12815072)
余弦定理
回忆丛书第一本书讲解的余弦定理(law of cosines)
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P57_1269532.jpg?sign=1739558897-F4GJaXMhYkHGNvV3tnYgx7oHaiiyu4Nt-0-b0f0019ab0ac28b189423deba769a9e4)
其中:a、b和c分别为图2.18所示三角形的三边的边长。下面,我们用余弦定理来推导式(2.39)。
如图2.18所示,将三角形三个边视作向量,将三个向量长度代入式(2.49),可以得到
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P57_1269533.jpg?sign=1739558897-e9F8XF8bUFFHv5rZ1PMuCK38Yaq2FrIV-0-0b1cadda93e32d6664c7f5b55d6c367a)
向量a和b之差为向量c,即
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P57_1269535.jpg?sign=1739558897-pUzz7x63VrLkC2umqBgwHCbqYdNvh9gj-0-61e60632833b0fafb0dabde5af649aff)
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P57_1269537.jpg?sign=1739558897-Y9lWzdmsTeIcXJvOEIQ1dUjTll4OlLga-0-a2782c7dd123a7bff71cf3531cb71b10)
图2.18 余弦定理
式(2.51)等式左右分别和自身计算向量内积,得到等式
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P57_1269539.jpg?sign=1739558897-kOYewetZIeDyAiKC20wCyM6N7CXXueCX-0-19a2f4e84b49d8936de444946ebd1d16)
整理得到
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P57_1269541.jpg?sign=1739558897-HmzSQLtTUZELYdhUClcyRfpAApamBots-0-2ef381e8ffd08bdb2555e9062eef58eb)
利用式(2.41),式(2.53)可以写作
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P57_1269542.jpg?sign=1739558897-LSTMhx8CCSgHJP9jnsi6SC5Y9QqQgNH6-0-1a585a4326fec2a24c49620c54e494eb)
比较式(2.50)和式(2.54),可以得到
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P57_1269543.jpg?sign=1739558897-oU8qn1kcqGvn6Xer6XP1mdnue7ZZSX9L-0-f52467e3c643d636bfa8de8465410e16)
在概率统计、数据分析、机器学习等领域,向量内积无处不在。下面举几个例子。
在多维空间中,给定A和B坐标为
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P58_1274347.jpg?sign=1739558897-6rpkfUru0pRZbKEfggTcUBWodHygYQbS-0-a7e8dcdc12bc27e619d29f7f23ab5747)
计算A和B两点的距离AB为
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P58_1274348.jpg?sign=1739558897-XZefdvOwROO5aNUREj8eP73KmZG3kPwW-0-4db30c404cc4d0039ff29194a31949bf)
用起点位于原点的向量a和b分别代表A和B点,AB距离就是a−b的L2范数,也就是欧几里得距离
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P58_1274349.jpg?sign=1739558897-usX0y2hJN5pTmf2b9210CiZSnHzgLR2S-0-5ab129ed204d411c019876b5a5aa525e)
回忆《数学要素》一册中介绍的样本方差公式,具体为
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P58_1274350.jpg?sign=1739558897-dglgg2Rc7HdOxag73vN3PjvmuvY1XWea-0-fa540d006340449318b52723d493c3da)
注意:对于总体方差,式(2.59)分母中的n–1应改为n。还默认X为有n个相等概率值的平均分布。
令x为
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P58_1274352.jpg?sign=1739558897-iAjp5W8D9kPnP4vqYdLHDdjPCgmxE4TV-0-5409396a40c6da46e762efd988ebe4ea)
式(2.59)可以写成
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P58_1274353.jpg?sign=1739558897-AS2v9yxZe076UPnL0OErioITju2ZSe5i-0-d7faa6c15e4dd44ee0e884697e6ce314)
根据广播原则,x−µ相当于向量x的每一个元素分别减去µ。
回忆总样本协方差公式
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P58_1274354.jpg?sign=1739558897-Ru3jNIE23RG4xgXPq718rCRpv3eMRmcq-0-6de6c8735fd10de188ea9ea5d1805107)
同样,对于总体协方差,式(2.62)分母中的n–1改为n即可。
同样利用向量内积运算法则,式(2.62)可以写成
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P58_1274355.jpg?sign=1739558897-iMShGKBjUcO24UOHSEU5uGdX1pAR4p6z-0-10c12bcd1d8ff5881e56bff9b12233e3)
本书第22章将从线性代数角度再和大家探讨概率统计的相关内容。