爱因斯坦求和约定

维基百科,自由的百科全书
跳转至: 导航搜索

數學裏,特別是將線性代數套用到物理時,愛因斯坦求和約定Einstein summation convention)是一種標記的約定,又稱為愛因斯坦標記法Einstein notation),在處理關於坐標的方程式時非常有用。這約定是由阿爾伯特·愛因斯坦於1916年提出的[1]。後來,愛因斯坦與友人半開玩笑地說[2]:「這是數學史上的一大發現,若不信的話,可以試著返回那不使用這方法的古板日子。」

按照愛因斯坦求和約定,當一個單獨項目內有標號變數出現兩次,一次是上標,一次是下標時,則必須總和所有這單獨項目的可能值。通常而言,標號的標值為1、2、3(代表維度為三的歐幾里得空間),或0、1、2、3(代表維度為四的時空閔可夫斯基時空)。但是,標值可以有任意值域,甚至(在某些應用案例裏)無限集合。這樣,在三維空間裏,

 y = c_i x^i\,\!

的意思是

 y = \sum_{i=1}^3 c_i x^i = c_1 x^1 + c_2 x^2 + c_3 x^3\,\!

請特別注意,上標並不是指數,而是標記不同坐標。例如,在直角坐標系裏,x^1\,\!x^2\,\!x^3\,\!分別表示x\,\!坐標、y\,\!坐標、z\,\!坐標,而不是x\,\!一次方、x\,\!二次方、x\,\!三次方。

簡介[编辑]

愛因斯坦標記法的基本點子是餘向量向量可以形成純量

 y = c_1 x^1+c_2x^2+c_3x^3+ \cdots + c_nx^n\,\!

通常會將這寫為求和公式形式:

 y = \sum_{i=1}^n c_ix^i\,\!

基底變換之下,純量保持不變。當基底改變時,一個向量的線性變換可以用矩陣來描述,而餘向量的線性變換則需用其逆矩陣來描述。這樣的設計為的是要保證,不論基底為何,伴隨餘向量的線性函數(即上述總和)保持不變。由於只有總和不變,而總和所涉及的每一個項目都有可能會改變,所以,愛因斯坦提出了這標記法,重複標號表示總和,不需要用到求和符號

 y = c_i x^i \,\,\!

採用愛因斯坦標記法,餘向量都是以下標來標記,而向量都是以上標來標記。標號的位置具有特別意義。請不要將上標與指數混淆在一起,大多數涉及的方程式都是線性,不超過變數的一次方。在方程式裏,單獨項目內的標號變數最多只會出現兩次,假若多於兩次,或出現任何其它例外,則都必須特別加以說明,才不會造成含意混淆不清。

向量的表示[编辑]

線性代數裏,採用愛因斯坦標記法,可以很容易的分辨向量和餘向量(又稱為1-形式)。向量的分量是用上標來標明,例如,a^i\,\!。給予一個n\,\!維向量空間\mathbb{V}\,\!和其任意基底\mathbf{e}=(\mathbf{e}_1,\mathbf{e}_2,\dots,\mathbf{e}_n)\,\!(可能不是標準正交基),那麼,向量\mathbf{a}\,\!表達為

\mathbf{a}= a^i \mathbf{e}_i= \begin{bmatrix}a^1\\a^2\\\vdots\\a^n\end{bmatrix}\,\!

餘向量的分量是用下標來標明,例如,\alpha_i\,\!。給予\mathbb{V}\,\!對偶空間\mathbb{V}^*\,\!和其任意基底\boldsymbol{\omega}=(\boldsymbol{\omega}^1,\boldsymbol{\omega}^2,\dots,\boldsymbol{\omega}^n)\,\!(可能不是標準正交基),那麼,餘向量\boldsymbol{\alpha}\,\!表達為

\boldsymbol{\alpha}= \alpha_i \boldsymbol{\omega}^i= \begin{bmatrix}\alpha_1 & \alpha_2 & \cdots & \alpha_n\end{bmatrix}\,\!

採用向量的共變和反變術語,上標表示反變向量(向量)。對於基底的改變,從\mathbf{e}\,\!改變為\overline{\mathbf{e}}\,\!,反變向量會變換為

\overline{a}^{\,i}= \frac{\partial \overline{x}^{\,i}}{\partial x^j} a^j\,\!

其中,\overline{a}^{\,i}\,\!是改變基底後的向量的分量,\overline{x}^{\,i}\,\!是改變基底後的坐標,x^j\,\!是原先的坐標,

下標表示共變向量(餘向量)。對於基底的改變,從\boldsymbol{\omega}\,\!改變為\overline{\boldsymbol{\omega}}\,\!,共變向量會會變換為

\overline{\alpha}_i= \frac{\partial x^i}{\partial \overline{x}^{\,j}} \alpha_j\,\!

一般運算[编辑]

矩陣A\,\!的第m\,\!橫排,第 n\,\!豎排的元素,以前標記為A_{mn}\,\!;現在改標記為A_n^m\,\!。各種一般運算都可以用愛因斯坦標記法來表達如下:

內積[编辑]

給予向量\mathbf{a}\,\!和餘向量\boldsymbol{\alpha}\,\!,其向量和餘向量的內積為純量:

\mathbf{a}\cdot\boldsymbol{\alpha}=a^i \alpha_i\,\!

向量乘以矩陣[编辑]

給予矩陣A\,\!和向量\mathbf{a}\,\!,它們的乘積是向量\mathbf{b}\,\!

b^i=A^i_j a^j\,\!

類似地,矩陣A\,\!轉置矩陣B=A^\mathrm{T}\,\!,其與餘向量\boldsymbol{\alpha}\,\!的乘積是餘向量\boldsymbol{\beta}\,\!

\beta_j=B^i_j \alpha_i=\alpha_i B^i_j\,\!

矩陣乘法[编辑]

矩陣乘法表達為

C^i_k = A^i_j \, B^j_k \,\!

這表達式等價於較冗長的普通標記法:

 C_{ik} = (A \, B)_{ik} = \sum_{j=1}^N A_{ij} B_{jk}\,\!

[编辑]

給予一個方塊矩陣A^i_j\,\!,總和所有上標與下標相同的元素A^i_i\,\!,可以得到這矩陣的t\,\!

t=A^i_i\,\!

外積[编辑]

M維向量\mathbf{a}\,\!和N維餘向量\boldsymbol{\alpha}\,\!外積是一個M×N矩陣A\,\!

A= \mathbf{a} \, \boldsymbol{\alpha} \,\!

採用愛因斯坦標記式,上述方程式可以表達為

A^i_j = a^i \, \alpha_j\,\!

由於i\,\!j\,\!代表兩個不同的標號,在這案例,值域分別為M和N,外積不會除去這兩個標號,而使這兩個標號變成了新矩陣A\,\!的標號。

向量的內積[编辑]

一般力學工程學會用互相標準正交基基底向量\hat{\mathbf{i}}\,\!\hat{\mathbf{j}}\,\!\hat{\mathbf{k}}\,\!來描述三維空間的向量。

\mathbf{u} = u_x\hat{\mathbf{i}} + u_y\hat{\mathbf{j}} + u_z\hat{\mathbf{k}}\,\!

直角坐標系的基底向量\hat{\mathbf{i}}\,\!\hat{\mathbf{j}}\,\!\hat{\mathbf{k}}\,\!寫成\hat{\mathbf{e}}_1\,\!\hat{\mathbf{e}}_2\,\!\hat{\mathbf{e}}_3\,\!,所以一個向量可以寫成:

\mathbf{u} = u_1 \hat{\mathbf{e}}_1 + u_2 \hat{\mathbf{e}}_2 + u_3 \hat{\mathbf{e}}_3
 = \sum_{i = 1}^3 u_i \hat{\mathbf{e}}_i\,\!

根據愛因斯坦求和约定,若單項中有標號出現兩次且分別位於上標及下標,則此項代表著所有可能值之總和:

 \mathbf{u} =u^i \hat{\mathbf{e}}_i = \sum_{i = 1}^3 u^i \hat{\mathbf{e}}_i \,\!

由於基底是標準正交基,\mathbf{u}\,\!的每一個分量u^i= u_i \,\!,所以,

 \mathbf{u}= \sum_{i = 1}^3 u_i \hat{\mathbf{e}}_i \,\!

兩個向量\mathbf{u}\,\!\mathbf{v}\,\!内积

\mathbf{u} \cdot \mathbf{v} = (u^i\hat{\mathbf{e}}_i) \cdot (v^j
  \hat{\mathbf{e}}_j) = \left( \sum_{i = 1}^3 u_i\hat{\mathbf{e}}_i \right) \cdot \left(
   \sum_{j = 1}^3 v_j \mathbf{e}_j \right)=\sum_{i = 1}^3 \sum_{j = 1}^3 u_i v_j ( \hat{\mathbf{e}}_i \cdot \hat{\mathbf{e}}_j )  \,\!

由於基底是標準正交基,基底向量相互正交歸一:

 \hat{\mathbf{e}}_i \cdot   \hat{\mathbf{e}}_j = \delta_{ij} \,\!

其中,\ \delta_{ij}\,\!就是克羅內克函數。當i=j\,\!時,則\delta_{ij}=1\,\!,否則\delta_{ij}=0\,\!

邏輯上,在方程式內的任意項目,若遇到了克羅內克函數\ \delta_{ij}\,\!,就可以把方程式中的標號i\,\!轉為j\,\!或者把標號j\,\!轉為i\,\!。所以,

\mathbf{u} \cdot \mathbf{v} =\sum_{i = 1}^3 \sum_{j = 1}^3 u_i v_j\delta_{ij}= \sum_{i = 1}^3 u_i v_i \,\!

向量的叉積[编辑]

採用同樣的標準正交基\hat{\mathbf{e}}_1\,\!\hat{\mathbf{e}}_2\,\!\hat{\mathbf{e}}_3\,\!,兩個向量\mathbf{u}\,\!\mathbf{v}\,\!叉積,以方程式表達為

 \mathbf{u} \times \mathbf{v}= (u^j \hat{\mathbf{e}}_j ) \times (v^k
   \hat{\mathbf{e}}_k)= \left( \sum_{j = 1}^3 u_j \hat{\mathbf{e}}_j \right) \times
   \left( \sum_{k = 1}^3 v_k \hat{\mathbf{e}}_k \right) \,\!
=\sum_{j = 1}^3 \sum_{k = 1}^3 u_j v_k (\mathbf{e}_j \times \mathbf{e}_k ) = \sum_{j = 1}^3 \sum_{k = 1}^3 u_j v_k\epsilon_{ijk} \mathbf{e}_i
   \,\!

注意到

 \hat{\mathbf{e}}_j \times \hat{\mathbf{e}}_k = \epsilon_{ijk} \hat{\mathbf{e}}_i\,\!

其中,張量\ \epsilon_{ijk}\,\!列维-奇维塔符号,定義為

 \epsilon_{ijk} =  \epsilon^{ijk}\ \stackrel{def}{=}
\begin{cases}
+1 \\
-1 \\
0
\end{cases} \,\! ,若(i,j,k)=\,\! \{1,2,3\}\,\!\{2,3,1\}\,\!\{3,1,2\}\,\! (偶置換
,若(i,j,k)=\,\! \{3,2,1\}\,\!\{2,1,3\}\,\!\{1,3,2\}\,\!(奇置換)
,若 i=j\,\!j=k\,\!i=k\,\!

所以,

 \mathbf{u} \times \mathbf{v} = (u^2 v^3 - u^3 v^2) \hat{\mathbf{e}}_1 + (u^3 v^1 - u^1 v^3) \hat{\mathbf{e}}_2 + (u^1 v^2 - u^2 v^1) \hat{\mathbf{e}}_3\,\!

設定 \mathbf{w} = \mathbf{u} \times \mathbf{v}\,\!,那麼,

 w^i \hat{\mathbf{e}}_i= \epsilon^{ijk} u_j v_k\hat{\mathbf{e}}_i  \,\!

所以,

\ w^i = \epsilon^{ijk} u_j v_k \,\!

向量的共變分量和反變分量[编辑]

歐幾里得空間\mathbb{V}\,\!裏,共變向量和反變向量之間的區分很小。這是因為能夠使用內積運算從向量求得餘向量;對於所有向量\mathbf{b}\,\!,通過下述方程式,向量\mathbf{a}\,\!唯一地確定了餘向量\boldsymbol{\alpha}\,\!

\boldsymbol{\alpha}(\mathbf{b})=\mathbf{a}\cdot\mathbf{b}\,\!

逆過來,通過上述方程式,每一個餘向量\boldsymbol{\alpha} \,\!唯一地確定了向量\mathbf{a}\,\!。由於這向量與餘向量的相互辨認,我們可以提到向量的共變分量和反變分量;也就是說,它們只是同樣向量對於基底和其對偶基底的不同表現。

給予\mathbb{V}\,\!的一個基底\mathfrak{f}=(X_1,X_2,\dots,X_n)\,\!,則必存在一個唯一的對偶基底\mathfrak{f}^{\sharp}=(Y^1,Y^2,\dots,Y^n)\,\!,滿足

Y^i \cdot X_j = \delta^i_j\,\!

其中,張量\delta^i_j\,\!克羅內克函數

以這兩種基底,任意向量\mathbf{a}\,\!可以寫為兩種形式

\begin{align}
\mathbf{a} &= \sum_i a^i[\mathfrak{f}]X_i =  \mathfrak{f}\,\mathbf{a}[\mathfrak{f}]\\
&=\sum_i a_i[\mathfrak{f}]Y^i = \mathfrak{f}^\sharp\,\mathbf{a}[\mathfrak{f}^\sharp]
\end{align}
\,\!

其中,a^i[\mathfrak{f}]\,\!是向量\mathbf{a}\,\!對於基底\mathfrak{f}\,\!的反變分量,a_i[\mathfrak{f}]\,\!是向量\mathbf{v}\,\!對於基底\mathfrak{f}\,\!的共變分量,

歐幾里得空間[编辑]

將向量\mathbf{a}\,\! 投影於坐標軸\mathbf{e}^i\,\!,可以求得其反變分量a^i\,\!;將向量\mathbf{a}\,\!投影於坐標曲面法線\mathbf{e}_i\,\!,可以求得其共變分量a_i\,\!

歐幾里得空間\mathbb{R}^3\,\!裏,使用內積運算,能夠從向量求得餘向量。給予一個可能不是標準正交基的基底,其基底向量為\mathbf{e}_1\,\!\mathbf{e}_2\,\!\mathbf{e}_3\,\!,就可以計算其對偶基底的基底向量:

 \mathbf{e}^1 = \frac{\mathbf{e}_2 \times \mathbf{e}_3}{\tau} ; \qquad \mathbf{e}^2 = \frac{\mathbf{e}_3 \times \mathbf{e}_1}{\tau}; \qquad \mathbf{e}^3 = \frac{\mathbf{e}_1 \times \mathbf{e}_2}{\tau}\,\!

其中,\tau=\mathbf{e}_1\cdot(\mathbf{e}_2 \times \mathbf{e}_3)\,\!是基底向量\mathbf{e}_1\,\!\mathbf{e}_2\,\!\mathbf{e}_3\,\!共同形成的平行六面體的體積。

反過來計算,

 \mathbf{e}_1 = \frac{\mathbf{e}^2 \times \mathbf{e}^3}{\tau'} ; \qquad \mathbf{e}_2 = \frac{\mathbf{e}^3 \times \mathbf{e}^1}{\tau'}; \qquad \mathbf{e}_3 = \frac{\mathbf{e}^1 \times \mathbf{e}^2}{\tau'}\,\!

其中,\tau'=\mathbf{e}^1\cdot(\mathbf{e}^2 \times \mathbf{e}^3)=1/\tau\,\!是基底向量\mathbf{e}^1\,\!\mathbf{e}^2\,\!\mathbf{e}^3\,\!共同形成的平行六面體的體積。

雖然\mathbf{e}_i\,\!\mathbf{e}^j\,\!並不相互標準正交,它們相互對偶:

\mathbf{e}_i \cdot \mathbf{e}^j = \delta_i^j\,\!

雖然\mathbf{e}^i\,\!\mathbf{e}_j\,\!並不相互標準正交,它們相互對偶:

\mathbf{e}^i \cdot \mathbf{e}_j = \delta^i_j\,\!

這樣,任意向量\mathbf{a}\,\!的反變分量為

 a^1 = \mathbf{a} \cdot \mathbf{e}^1; \qquad a^2 = \mathbf{a} \cdot \mathbf{e}^2; \qquad a^3 = \mathbf{a} \cdot \mathbf{e}^3\,\!

類似地,共變分量為

 a_1 = \mathbf{a} \cdot \mathbf{e}_1; \qquad a_2 = \mathbf{a} \cdot \mathbf{e}_2; \qquad a_3 = \mathbf{a} \cdot \mathbf{e}_3\,\!

這樣,\mathbf{a}\,\!可以表達為

\mathbf{a} = a_i \mathbf{e}^i = a_1 \mathbf{e}^1 + a_2 \mathbf{e}^2 + a_3 \mathbf{e}^3  \,\!

或者,

\mathbf{a} = a^i \mathbf{e}_i = a^1 \mathbf{e}_1 + a^2 \mathbf{e}_2 + a^3 \mathbf{e}_3\,\!

綜合上述關係式,

 \mathbf{a} = (\mathbf{a} \cdot \mathbf{e}_i) \mathbf{e}^i = (\mathbf{a} \cdot \mathbf{e}^i) \mathbf{e}_i \,\!

向量\mathbf{a}\,\!的共變分量為

a_i = \mathbf{a}\cdot \mathbf{e}_i = (a^j \mathbf{e}_j)\cdot \mathbf{e}_i = (\mathbf{e}_j\cdot\mathbf{e}_i) a^j=g_{ji}a^j\,\!

其中,g_{ji}=\mathbf{e}_j\cdot\mathbf{e}_i\,\!度規張量

向量\mathbf{a}\,\!的反變分量為

a^i = \mathbf{a}\cdot \mathbf{e}^i = (a_j \mathbf{e}^j)\cdot \mathbf{e}^i = (\mathbf{e}^j\cdot\mathbf{e}^i) a_j =g^{ji}a_j\,\! ;

其中,g^{ji}=\mathbf{e}^j\cdot\mathbf{e}^i\,\!共軛度規張量

共變分量的標號是下標,反變分量的標號是上標。假若共變基底向量組成的基底是標準正交基,或反變基底向量組成的基底是標準正交基,則共變基底與反變基底相互等價。那麼,就沒有必要分辨共變分量和反變分量,所有的標號都可以用下標來標記。

抽象定義[编辑]

思考維度為n\,\!的向量空間\mathbb{V}\,\!。給予一個可能不是標準正交基的基底(\mathbf{e}_1,\mathbf{e}_2,\dots,\mathbf{e}_n)\,\!。那麼,在\mathbb{V}\,\!內的向量\mathbf{v}\,\!,對於這基底,其分量為v^1\,\!v^2\,\!、...v^n\,\!。以方程式表達,

\mathbf{v} = v^i\mathbf{e}_i.\,\!

在這方程式右手邊,標號i\,\!在同一項目出現了兩次,一次是上標,一次是下標,因此,從i\,\!等於1\,\!n\,\!,這項目的每一個可能值都必須總和在一起。

愛因斯坦約定的優點是,它可以應用於從\mathbb{V}\,\!張量積對偶性建立的向量空間。例如,\mathbb{V}\otimes \mathbb{V}\,\!\mathbb{V}\,\!與自己的張量積,擁有由形式為\mathbf{e}_{ij} = \mathbf{e}_i \otimes \mathbf{e}_j\,\!的張量組成的基底。任意在\mathbb{V}\otimes \mathbb{V}\,\!內的張量\mathbf{T}\,\!可以寫為

\mathbf{T} = T^{ij}\mathbf{e}_{ij}\,\!

向量空間\mathbb{V}\,\!對偶空間\mathbb{V}^*\,\!擁有基底(\mathbf{e}^1,\mathbf{e}^2,\dots,\mathbf{e}^n)\,\!,遵守規則

\mathbf{e}^i \cdot\mathbf{e}_j = \delta^i_j\,\!

其中, \delta^i_j\,\!克羅內克函數

範例[编辑]

為了更明確地解釋愛因斯坦求和約定,在這裏給出幾個簡單的例子。

  • 思考四維時空,標號的值是從0到3。兩個張量,經過張量縮併tensor contraction)運算後,變為一個純量:
c=a^\mu b_\mu = a^0 b_0 + a^1 b_1 + a^2 b_2 + a^3 b_3\,\!
  • 方程式的右手邊有兩個項目:
c^\nu=a^{\mu\nu} b_\mu +f^\nu= a^{0\nu} b_0 + a^{1\nu} b_1 + a^{2\nu} b_2 + a^{3\nu} b_3+f^\nu\,\!
由於運算結果與標號\mu\,\!\nu\,\!無關,可以被其它標號隨意更換,所以,\mu\,\!\nu\,\!稱為傀標號
自由標號是沒有被總和的標號。自由標號應該出現於方程式的每一個項目裏,而且在每一個項目裏只出現一次。在上述方程式裏,\nu\,\!是自由標號,每一個項目都必須有同樣的自由標號。注意到在項目a^{\mu\nu} b_\mu\,\!裏,標號\mu\,\!出現了兩次,一次是上標,一次是下標,所以,這項目的所有可能值都必須總和在一起。稱\mu\,\!求和標號
ds^2=g_{ij}dx^i dx^j=g_{0j}dx^0 dx^j+g_{1j}dx^1 dx^j+g_{2j}dx^2 dx^j+g_{3j}dx^3 dx^j\,\!。請將這兩種標號跟自由變量和約束變量相比較。
進一步擴展,
ds^2=g_{00}dx^0 dx^0+g_{10}dx^1 dx^0+g_{20}dx^2 dx^0+g_{30}dx^3 dx^0\,\!
\qquad +g_{01}dx^0 dx^1+g_{11}dx^1 dx^1+g_{21}dx^2 dx^1+g_{31}dx^3 dx^1\,\!
\qquad +g_{02}dx^0 dx^2+g_{12}dx^1 dx^2+g_{22}dx^2 dx^2+g_{32}dx^3 dx^2\,\!
\qquad +g_{03}dx^0 dx^3+g_{13}dx^1 dx^3+g_{23}dx^2 dx^3+g_{33}dx^3 dx^3\,\!
注意到ds^2\,\!ds\,\!乘以ds\,\!,是(ds)^2\,\!,而不是(s^2)\,\!坐標的微小元素。當有疑慮時,可以用括號來分歧義。

參閱[编辑]

參考文獻[编辑]

  1. ^ Einstein, Albert, The Foundation of the General Theory of Relativity (PDF), Annalen der Physik, 1916 [2006-09-03] 
  2. ^ Byron, Frederick; Fuller, Robert, Mathematics of classical and quantum physics, Courier Dover Publications, pp. 5, 1992, ISBN 9780486671642 

外部連結[编辑]