3. Orthogonality

3.1 Orthogonal Vectors and Subspaces

Orthogonality

기하학적으로 생각하면 basis는 space를 이루는 coordinate axes로 볼 수 있다.
일반적으로 봐왔던 x-y plane이나 3-dimensional space의 axes처럼 수직을(perpendicular) 이루고 있는 basis를 **orthogonal**하다고 한다.
Orthogonal한 basis로 계산을 보다 쉽게 할 수있다.

Orthogonal Vectors

그럼 어떤 vector가 orthogonal한 벡터일까.

두 벡터 $x$ , $y$ 가 orthogonal한지 확인하려면 가장 먼저 vector의 길이를 알이야한다.

Length of Vector

Vector x의 길이(lentgh)는 $‖ x ‖$ 로 나타내고 그 제곱을 다음과 같이 나타낼 수 있다.

$‖ x ‖^{2} = \sum_{i = 1}^{n} {x_{i}}^{2} = x^{T} x (x^{T} x : i n n e r p r o d u c t)$

Orthogonal vectors

orthogonal한 두 basis vector $x$ , $y$ 는 right triangle을 형성하고 삼각형 각 변을 이루는 vector의 크기를 피타고라스 정리를 이용해서 표현하면 다음과 같다.

$‖ x ‖^{2} + ‖ y ‖^{2} = ‖ x - y ‖^{2}$

위 식의 vector 크기를 내적을 이용해서 나타내면

$\begin{matrix} x^{T} x + y^{T} y & = & {(x - y)}^{T} (x - y) \\ = & x^{T} x - y^{T} x - x^{T} y + y^{T} y \end{matrix}$

$x^{T} y + y^{T} x = 0$

vector $x$ 와 $y$ 를 내적한 값은 scalar값이므로 transpose를 취해도 그 값이 같다.

즉, $x^{T} y = (x^{T} y)^{T} = y^{T} x$ 이므로

$x^{T} y = y^{T} x = 0$ 이다.

$x^{T} y$ 의 값이 zero이면 $x$ 와 $y$ 는 orthogonal 하다.
$x^{T} y$ is zero if and only if $x$ and $y$ are orthogonal vectors.

$x$ 와 $y$ 를 내적할 때

$x^{T} y = 0$ for Orthogonal (right angle)
$x^{T} y < 0$ for angle > $90 \deg$
$x^{T} y > 0$ for angle < $90 \deg$

Orthogonality and Linearly Independent

nonzero vercor $v_{1}, v_{2} \dots, v_{k}$ 가 mutually orthogonal하면 (모든 verctor가 서로 수직) 이 vectors들은 linearly independent하다.

Proof

$c_{1} v_{1} + c_{2} v_{2} + \dots + c_{k} v_{k} = 0$ 일 때,

임의의 $v_{i}$ 에 대해 ${v_{i}}^{T} (c_{1} v_{1} + c_{2} v_{2} + \dots + c_{k} v_{k}) = {v_{i}}^{T} \cdot 0 = c_{i} ‖ v_{i} ‖^{2} = 0$

$∵ v_{i} v_{j} = 0 (i \neq j)$

nonzero $v_{i}$ 에 대해 $c_{i} ‖ v_{i} ‖^{2} \neq 0$ 이므로
모든 $c_{i} = 0$

Orthonormal

Basis vector $v_{1}, v_{2} \dots, v_{k}$ 가 orthogonal 하면서 $v_{i}$ 의 length가 $‖ v_{i} ‖ = 1$ 일 때 vector $v_{i}$ 는 orthonornal 하다.

Orthonormal한 basis vector $v_{1}, v_{2} \dots, v_{k}$ 가 이루는 vector space $V$ 안의 임의의 벡터 $x$ 에 대해서 $x$ 는 $v_{i}$ 의 linear combination으로 나타낼 수 있다.

$x = \sum_{i = 1}^{k} c_{i} v_{i}$

이 때, Basis vector가 orthonormal하면 linear coefficient $c_{i}$ 를 보다 쉽게 구할 수 있다.

$v_{i} \cdot x = c_{i} ‖ v_{i} ‖^{2}$

for orthonormal $v_{i}$ , $‖ v_{i} ‖^{2} = 1$

$c_{i} = v_{i} \cdot x$

Orthogonal Subspaces

동일한 space $R$ 의 두 개의 subspace $V$ 와 $W$ 에 대해서 $V$ 의 모든 vector $v$ 가 $W$ 의 모든 vector $w$ 에 orthogonal하면 두 subspace $V$ 와 $W$ 는 orthogonal하다. $v^{T} w = 0$ for all $v$ and $w$ .

{0}는 모든 subspace에 orthogonal하다.
$R^{3}$ 의 subspace는 원점을 지나는 line(1-dimension)이나 plane(2-dimension)으로 나타낼 수 있으며 line과 line 혹은 line과 plane 사이에 orthogonality가 성립할 수 있다.

Orthogonal Subspace in Four Fundamental Subspace

어떤 Space의 orthogonal subspace는 항상 두 개가 동시에 존재한다*.

그리고 fundamental subspaces가 orthogonal subspace를 이루기 때문에 orthogonal subspace는 항상 존재한다 (unavoidable).

* 생각해보면 subspace가 '수직'을 이루려면 당연히 두 개가 존재해야한다.

m by n matrix에 $A$ 에 대해서,
Row space는 $R^{n}$ 에서 nullspace와 orthogonal 하다.
Column space는 $R^{m}$ 애서 left nullspace와 orthogonal 하다.

proof 1

nullspace의 vector $x$ 에 대해서 $A x = 0$ 이고 이 system의 m개의 equation을 다음과 같이 표현할 수 있다.

$A x = [\begin{matrix} r o w 1 \\ r o w 2 \\ ⋮ \\ r o w m \end{matrix}] [\begin{matrix} x_{1} \\ x_{2} \\ ⋮ \\ x_{n} \end{matrix}] = [\begin{matrix} 0 \\ 0 \\ ⋮ \\ 0 \end{matrix}]$

A의 각 row는 $x$ 와 orthogonal하기 떄문에 $x$ 는 rows의 어떤 combination이라도 orthogonal하다. $(r o w)^{T} \cdot x = 0$

Nullspace의 vector x는 모든 row space의 vector에 orthogonal하므로 nullspace는 row space에 orthogonal하다. $N (A) ⊥ C (A^{T})$

Left nullspace의 vector $y$ 역시 $A^{T} y = 0$ 혹은 $y^{T} A = 0$ 이고 이 system을 다음과 같이 나타낼 수 있다.

$y^{T} A = [\begin{matrix} y_{1} & \dots & y_{m} \end{matrix}] [\begin{matrix} c & c \\ o & o \\ l & l \\ u & \dots & u \\ m & m \\ n & n \\ 1 & n \end{matrix}] = [\begin{matrix} 0 & \dots & 0 \end{matrix}]$

Vector $y$ 는 모든 column에 orthogonal 하므로 column의 모든 combination에 orthogonal하다.

Left nullspace의 vector $y$ 는 column space의 모든 vector에 orthogonal하므로 left nullspace는 column space에 orthogonal하다. $N (A^{T}) ⊥ C (A)$

Proof 2
coordinate-free proof

$x$ 가 $A x = 0$ 를 만족하는 nullspace일 때 $v$ 가 row space의 vector라면 $v$ 는 A의 row들의 combination으로 나타낼 수 있다. $v = A^{T} z$ ( $z$ 는 coefficients).

이 경우 $x$ 와 $v$ 는 다음을 만족한다.

$v^{T} = (A^{T} z)^{T} x = z^{T} A x = z^{T} 0 = 0$

Null space $⊥$ Row space

Example

Rank가 1인 matrix A에 대해서

$A = [\begin{matrix} 1 & 3 \\ 2 & 6 \\ 3 & 9 \end{matrix}]$

row는 $(1, 3$ 의 상수배이기 때문에 nullspace는 $A$ 의 모든 row에 orthogonal한 $x = (3, - 1)$ 를 포함한다.
nullspace와 row space는 $R^{2}$ 안의 수직한 line이다.
column space는 $(1, 2, 3)$ 을 지나는 line이므로 left nullspace는 그에 수직인 plane인 $y_{1} + 2 y_{2} + 3 y_{3} = 0$ 이다.

Orthogonal Complement

위의 예시에서 처음 두 개의 sub spaces (two lines)는 $R^{2}$ 안에서 $1 + 1 = 2$ 의 dimension을 갖는다. 두 번쨰 sub spaces (line and plane)는 $R^{3}$ 안에서 $1 + 2 = 3$ 의 dimension을 갖는다.

이를 일반적으로 적용하면,

dimension of (row space) + (nullspace) = $r + (n - r) = n$ (number of columns) in $R^{n}$
dimension of (column space) +(left nullspace) = $r + (m - r) = m$ (number of rows) in $R^{m}$

이 처럼 subspace 사이에 orthogonal 하면서 dimension에 보완 관계가 있는 경우 orthogonal complement라고 한다.

$R^{n}$ 의 sub space $V$ 에 대해서 $V$ 에 orthogonal한 모든 vector를 $V$ 의 orthogonal complement라고 하고 $V^{⊥} = V$ perp 라고 표시한다.

row space $⊥$ nullspace: $C (A^{T}) = (N (A))^{⊥}$
column space $⊥$ left nullspace: $C (A) = (N (A^{T}))^{⊥}$

결과적으로 four fundamental subspaces의 관계를 정리하면 다음과 같다.

nullspace는 $R^{n}$ 에서 row space의 orthogonal complement이며 row space의 vector에 orthogonal한 모든 vector를 포함한다.
left nullspace는 $R^{m}$ 에서 column space의 orthogonal complement이며 column space의 vector에 orthogonal한 모든 vector를 포함한다.

Ax = b

Column space와 left nullspace의 orthogonal complement를 이루는 성질을 $A x = b$ 에 이용할 수 있다.

$A x = b$ 의 solution이 존재하기 위해서는 $b$ 가 $A$ 의 column space에 있어야 한다. ( $b$ 가 column space의 linear combination)
즉 $b$ 가 $A$ 의 left nullspace에 perpendicular 해야한다.

$A x = b$ 는 $y^{T} A = 0$ 일 때, $y^{T} b = 0$ 이면 해가 존재한다.
$A x = b$ is solvable if and only if $y^{T} b = 0$ whenever $y^{T} A = 0$

The Matrix and the Subspaces

Orthogonal complement와 orthogonal은 다르다.

Dimension이 작은 경우 orthogonal하지만 orthogonal complement는 아닐 수 있다.

Example

$V$ 가 (0, 1, 0)이 span한 line이고 $W$ 가 (0, 0, 1)이 span한 line인 경우, $V$ 와 $W$ 는 orthogonal하지만 $V$ 가 $W^{⊥}$ 는 아니다.

$W$ 의 orthogonal complement는 2-dimensional한 plane이어야 하고 위의 line은 $W^{⊥}$ 의 일부분일 뿐이다.

Dimension이 충분하면(right) orthogonal sub space들은 무조건 orthogonal complement를 이룬다.

$W = V^{⊥}$ 이면 $V = W^{⊥}$ 이고 $d i m V + d i m W = n$ 이다.

즉, $V^{⊥⊥} = V$ 이고 이는 $V$ 와 $W$ 의 dimension이 충분하면 whole space $R^{n}$ 은 두 개의 수직한 부분으로 나눠진다는 것을 의미한다.

Summary of Fundamental Theorem of Linear Algebra

What is happening inside the multiplication $A x$

Nullspace는 zero vector로 이동.
모든 $A x$ 는 $A$ 의 column space안에 존재.
그 어느 것도 left nullspace로는 이동하지 않음.

일반적으로 $x$ 는 "row space compoment"와 "null space component"로 나눌 수 있다. $x = x_{r} + x_{n}$

$x$ 에 $A$ 를 곱하면, $A x = A x_{r} + A x_{n}$
Nullspace component는 zero로 간다: $A x_{n} = 0$
Row space component는 column space로 간다: $A x_{r} = A x$

$x_{r}$ 은 $x$ 를 row space로, $x_{n}$ 은 $x$ 를 nullspace로 projection한 것이다 → Projections

Transpose, Pseudoinverse

추후에 작성

3.2 Cosines and Projections onto Lines

Vector의 inner product를 vector가 이루는 각과 연결시키기 위함.
Vector가 이루는 각이 right angle이 아니고 그 inner product 값도 zero가 아닌 경우.

Projection

Vector $b$ 의 point에서 $a$ 방향으로 향하는 가장 직선 거리.

Line $a$ 의 위에 있는 point 중 $b$ 와 가장 가까운 point $p$ 를 찾으면
$b$ 와 $p$ 를 연결하는 직선은 $a$ 에 수직이다.

Line이 아니라 plane이나 임의의 subspace $S$ 가 주어져도 상황은 동일하다.

point $p$ 는 $b$ 를 subspace로 projection한 것이다.

기하학적으로 projection은 point $b$ 와 subspace $S$ 의 거리와 같지만,

Linear system에서는 overdetermined system의 least-squares solution을 구하는데 사용할 수 있다.

즉, $A x = b$ 의 solution이 없는 경우, projection을 이용해서 least-squares method로 구한 $p$ 가 가장 근접하게 $b$ 를 대체할 수 있다.

Inner Products and Cosines

Inner product는 각이 아니지만 각의 cosine값은 inner product와 직결된다.

위의 그림에서 $c o s θ$ 는 다음과 같다.

$c o s θ = \frac{a^{T} b}{‖ a ‖ ‖ b ‖}$

벡터를 삼각형으로 보고 law of cosines를 이용해도 동일한 결과를 구할 수 있다.

$L a w o f C o s i n e s {‖ b - a ‖}^{2} = ‖ b ‖^{2} + ‖ a ‖^{2} - 2 ‖ b ‖ ‖ a ‖ c o s θ$

vector의 length를 모두 inner product로 바꿔서 식을 정리하면
$\begin{matrix} {‖ b - a ‖}^{2} & = & ‖ b ‖^{2} + ‖ a ‖^{2} - 2 ‖ b ‖ ‖ a ‖ c o s θ \\ (b - a)^{T} (b - a) & = & b^{T} b + a^{T} a - 2 ‖ b ‖ ‖ a ‖ c o s θ \\ a^{T} b + b^{T} a & = & 2 ‖ a ‖ ‖ b ‖ c o s θ \end{matrix}$

$a^{T} b = b^{T} a$ 이므로 동일한 $c o s θ$ 값을 구할 수 있다.

Projection onto a Line

Projection point $p$ 를 구해보자.

$p$ 는 주어진 vector $a$ 를 이용해서 나타낼 수 있다: $p = \hat{x} a$

point $b$ 에서 $p$ 로의 line은 vector $a$ 와 수직하므로

$(b - \hat{x} a) ⊥ a, o r a^{T} (b - \hat{x} a) = 0, o r \hat{x} = \frac{a^{T} b}{a^{T} a}$

를 이용해서 $\hat{x}$ 를 구할 수 있다.

projection onto a line $p$ 를 구하면

$p = \hat{x} a = \frac{a^{T} b}{a^{T} a} a$

Schwarz inequality

projection식을 이용해서 Schewarz inequality를 이끌어낼 수 있다.

위의 Figure에서 $‖ e ‖^{2} = ‖ b - p ‖^{2}$ 가 음수가 될 수 없음을 이용하면,

$‖ b - \frac{a^{T} b}{a^{T} a} a ‖^{2} = b^{T} b - 2 \frac{(a^{T} a)^{2}}{a^{T} a} + (\frac{a^{T} b}{a^{T} a})^{2} a^{T} a = \frac{(b^{T} b) (a^{T} a) - (a^{T} b)^{2}}{(a^{T} a)} \geq 0$

이로부터 $(b^{T} b) (a^{T} a) \geq (a^{T} b)^{2}$ 임을 알 수 있다.

모든 vector $a$ 와 $b$ 는 $R^{n}$ 에서 $| c o s θ | \leq 1$ 인 Schwarz inequality를 만족한다.
$| a^{T} b | \leq ‖ a ‖ ‖ b ‖$

Example

$b = (1, 2, 3)$ 을 $a = (1, 1, 1)$ 를 지나는 line으로 projection해서 $\hat{x}$ 와 $p$ 를 구함.

$\hat{x} = \frac{a^{T} b}{a^{T} a} = \frac{6}{3} = 2, p = \hat{x} a = (2, 2, 2)$

$a$ 와 $b$ 사이의 각도는

$c o s θ = \frac{a^{T} b}{‖ a ‖ ‖ b ‖} = \frac{6}{\sqrt{3} \sqrt{14}}$

$6 \leq \sqrt{3} \sqrt{14}$ 로 Schwarz ineqality를 만족한다.

Projection Matrix of Rank 1

이전에 표기하던 $p = \hat{x} a$ 에 약간의 변화를 줘서 표기해볼 수 있다: $p = a (a^{T} b / a^{T} a)$

이처럼 $\hat{x}$ 와 $a$ 의 순서를 바꾸면 line으로의 projection을 Proejction matrix $P$ 를 이용해서 나타낼 수 있다. $P$ 는 vector $b$ 와 곱해져서 $p$ 를 만드는 matrix이다.

$p = a \frac{a^{T} b}{a^{T} a} = \frac{a a^{T}}{a^{T} a} b, P = \frac{a a^{T}}{a^{T} a}$

Example

$a = (1, 1, 1)$ 을 지나는 line으로 project하는 matrix

$P = \frac{a a^{T}}{a^{T} a} = \frac{1}{3} [\begin{matrix} 1 \\ 1 \\ 1 \end{matrix}] [\begin{matrix} 1 & 1 & 1 \end{matrix}] = [\begin{matrix} \frac{1}{3} & \frac{1}{3} & \frac{1}{3} \\ \frac{1}{3} & \frac{1}{3} & \frac{1}{3} \\ \frac{1}{3} & \frac{1}{3} & \frac{1}{3} \end{matrix}]$

예시에서 두 가지 성질을 발견할 수 있다.

$P$ 는 symmetric matrix이다
Matrix를 제곱하면 자기 자신이 나온다. $P^{2} = P$

$b$ 를 두 번 projection 하면 $P^{2} b$ 로 나타낼 수 있고 이는 $P b$ 를 projection하는 것과 같다. $P b$ 는 이미 line위에 있으므로 $P^{2} b = P b$ 이다.

Projection matrix를 나타내는 식으로 계산해도 동일한 결과를 얻을 수 있다.

$P^{2} = \frac{(a a^{T}) (a a^{T})}{(a^{T} a) (a^{T} a)} = \frac{a (a^{T} a) a^{T}}{(a^{T} a) (a^{T} a)} = \frac{a a^{T}}{a^{T} a} = P$

$P$ 를 four fundamental subspaces의 관점에서 볼 수도 있다. 위의 예시에서 $P$ 는:

$a = (1, 1, 1)$ 을 지나는 line으로 이루어진 column space
$a$ 에 수직인 plane으로 이루어진 nullspace 이고
rank $r = 1$ 이다.

$b$ satisfying $P b = 0$

$p = 0$ 으로 project하는 $b$ 를 별도로 다뤄보면: $P b = 0$

$P$ 의 모든 column이 $a$ 의 multiple이므로 $p = 0$ 로 project하는 $b$ 는 $a^{T} b = 0$ 을 만족한다.

이는 $p = 0$ 으로 project하는 $b$ 는 $a$ 의 nullspace (=perpendicular plane)에 놓여있다는 것을 의미한다: $b ⊥ a$

Remark on Scaling

Projection matrix는 scaling에 영향을 받지 않는다.

위의 예시에서 $a$ 를 double해도 결과는 같다.

$a = [\begin{matrix} 2 \\ 2 \\ 2 \end{matrix}], P = \frac{a a^{T}}{a^{T} a} = \frac{1}{12} [\begin{matrix} 2 \\ 2 \\ 2 \end{matrix}] [\begin{matrix} 2 & 2 & 2 \end{matrix}] = [\begin{matrix} \frac{1}{3} & \frac{1}{3} & \frac{1}{3} \\ \frac{1}{3} & \frac{1}{3} & \frac{1}{3} \\ \frac{1}{3} & \frac{1}{3} & \frac{1}{3} \end{matrix}]$

Example: Project onto $θ$ -line

$a = (c o s θ, s i n θ)$ 으로 project하는 projection matrix를 구해보면

$P = \frac{a a^{T}}{a^{T} a} = \frac{[\begin{matrix} c \\ s \end{matrix}] [\begin{matrix} c & s \end{matrix}]}{[\begin{matrix} c & s \end{matrix}] [\begin{matrix} c \\ s \end{matrix}]} = [\begin{matrix} c^{2} & c s \\ c s & s^{2} \end{matrix}]$

$c = c o s θ$ , $s = s i n θ$
분모의 $c^{2} + s^{2} = 1$

Transposes from Inner Products

Transpose는 matrix의 diagonal을 기준으로 reflection 시킨 것이다: $A_{i j}^{T} = (A)_{j i}$

Transpose를 inner product랑 연결시키면 transpose에 대한 좀 더 추상적(abstract)한 정의를 얻을 수 있다:

$A x$ 와 $y$ 를 inner product한 것은 $x$ 와 $A^{T} y 를$ inner product한 것과 같다.
$(A x)^{T} y = x^{T} a^{T} y = x^{T} (A^{T} y)$

동일한 방법으로 $(A B)^{T} = B^{T} A^{T}$ 역시 보일 수 있다.

$(A x)^{T} y = x^{T} A^{T} y = x^{T} (A^{T} y)$

'공부를 합니다 > 수학 (mathematics)' 카테고리의 다른 글

선형대수(HYU)_13-14 QR 분할과 함수공간 (0)	2020.06.06
선형대수(HYU)_11-12 벡터투영과 최소제곱법 (0)	2020.05.15
선형대수(HYU)_09 선형변환과 행렬 (0)	2020.04.22
선형대수(HYU)_08 벡터공간의 차원과 네 가지 부벡터공간 (0)	2020.03.12
선형대수(HYU)_07 벡터의 선형독립과 기저벡터 (0)	2020.03.12

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

야채크래커의 부스러기

선형대수(HYU)_10 벡터의 직교성과 직선투영

3. Orthogonality

3.1 Orthogonal Vectors and Subspaces

Orthogonality

Orthogonal Vectors

Length of Vector

Orthogonal vectors

Orthogonality and Linearly Independent

Orthonormal

Orthogonal Subspaces

Orthogonal Subspace in Four Fundamental Subspace

Orthogonal Complement

Ax = b

The Matrix and the Subspaces

Summary of Fundamental Theorem of Linear Algebra

Transpose, Pseudoinverse

3.2 Cosines and Projections onto Lines

Projection

Inner Products and Cosines

Projection onto a Line

Schwarz inequality

Projection Matrix of Rank 1

$b$ satisfying $P b = 0$

Remark on Scaling

Example: Project onto $θ$ -line

Transposes from Inner Products

'공부를 합니다 > 수학 (mathematics)' 카테고리의 다른 글

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역

선형대수(HYU)_10 벡터의 직교성과 직선투영

3. Orthogonality

3.1 Orthogonal Vectors and Subspaces

Orthogonality

Orthogonal Vectors

Length of Vector

Orthogonal vectors

Orthogonality and Linearly Independent

Orthonormal

Orthogonal Subspaces

Orthogonal Subspace in Four Fundamental Subspace

Orthogonal Complement

Ax = b

The Matrix and the Subspaces

Summary of Fundamental Theorem of Linear Algebra

Transpose, Pseudoinverse

3.2 Cosines and Projections onto Lines

Projection

Inner Products and Cosines

Projection onto a Line

Schwarz inequality

Projection Matrix of Rank 1

b satisfying Pb=0

Remark on Scaling

Example: Project onto θ-line

Transposes from Inner Products

'공부를 합니다 > 수학 (mathematics)' 카테고리의 다른 글

'공부를 합니다/수학 (mathematics)' Related Articles

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역

$b$ satisfying $P b = 0$

Example: Project onto $θ$ -line