4.2 Linear transformation (1)

2022-04-03 5 분 소요

이번 포스트에서는 Linear transformation에 대해서 알아보겠습니다.

1) Linear Transformation

(1) Transformation

Transformation은 다음과 같이 정의됩니다.

Definition : Transformation

Transformation is a function whose inputs and outputs are vectors

\[T : \mathbb R^n \rightarrow \mathbb R^m\]

A transformation

\[T : \mathbb R^n \rightarrow \mathbb R^n\]

is called operator on $\mathbb R^n$

Transformation이란, input과 output이 vector인 함수입니다. 고등학교에서 배운 함수는 input과 output이 실수인, 또는 input이 벡터지만 output이 실수인 경우만 다루었다면, transformation은 이에서 확장하여 input과 output이 모두 vector인 경우를 뜻합니다. 또한, input과 output이 $\mathbb R^n$으로 같다면, 해당 transformation은 operator가 됩니다. Transformation 또한 함수이기 때문에, 기존의 함수에서 사용했던 개념인 정의역(domain), 공역(codomain), 치역(image) 또한 똑같이 정의됩니다.

Example

$T$ : transformation that maps a vector $\boldsymbol{x}=(x_1, x_2)$ in $\mathbb R^2$ into the vector $2\boldsymbol{x} = (2x_1, 2x_2)$ in $\mathbb R^2$

input과 output 모두 $\mathbb R^2$에 속하는 함수입니다. 따라서 $T$는 transformation입니다. 또한, input과 output이 모두 $\mathbb R^2$에 속하므로, operator입니다.

(2) Linear transformation

Definition : Linear transformation

A function $T : \mathbb R^n \rightarrow \mathbb R^m$ is called a linear transformation from $\mathbb R^n$ to $\mathbb R^m$ if following two properties hold for all vectors $\boldsymbol{u, v}$ in $\mathbb R^n$ and for all scalars $c$.

$T(c\boldsymbol u) = cT(\boldsymbol{u})$
$T(\boldsymbol{u+v}) = T(\boldsymbol{u}) + T(\boldsymbol{v})$

If $n=m$, then the linear transformation $T$ is called linear operator.

Linear transformation이 정의되기 위해서는 transformation이 scalar multiplication, vector addition에 대한 조건을 만족하여야 합니다. 또한 input과 output이 $\mathbb R^n$인 linear transformation을 linear operator라고 정의합니다. 어떤 transformation이 linear transformation임을 확인하기 위해서는 정의역에 존재하는 임의의 벡터에 해대서 위 두 조건을 만족하는지 확인하면 됩니다.

example

$T$ : transformation that maps a vector $\boldsymbol{x}=(x_1, x_2)$ in $\mathbb R^2$ into the vector $2\boldsymbol{x} = (2x_1, 2x_2)$ in $\mathbb R^2$

위 transformation이 linear transformation을 만족하는지 확인해봅시다.

$\boldsymbol{u, v} \in \mathbb R^2, T(\boldsymbol{u+v}) = 2(\boldsymbol{u+v}) = 2\boldsymbol{u}+2\boldsymbol{v} = T(\boldsymbol{u}) + T(\boldsymbol{v})$,
$\boldsymbol u \in \mathbb R^2, c \in \mathbb R, T(c\boldsymbol{u})=2c\boldsymbol{u}=c2\boldsymbol{u}=cT(\boldsymbol{u})$

$\mathbb R^2$에 속하는 임의의 vector와 scalar에 대해서 두 조건이 성립하기 때문에, 위 transformation은 linear transformation입니다. 또한 정의역과 공역이 $\mathbb R^2$이므로 linear operator입니다.

Linear transformation의 특징을 파악하기 위해서는 matrix transformation이 필요합니다.

Definition : Matrix transformation

If $A$ is $m \times n$ matrix, and if $\boldsymbol{x}$ is a column vector in $\mathbb R^n$, then the product $A\boldsymbol x$ is a vector in $\mathbb R^m$. Therefore, the transformation

\[T_A = \mathbb R^n \rightarrow \mathbb R^m \\ T_A(\boldsymbol{x}) = A\boldsymbol{x}\]

is called the multiplication by $A$ or the transformation $A$

즉 matrix product로 이루어지는 transformation을 matrix transformation이라고 합니다.

example

\[A = \begin{bmatrix}1 & -1 \\ 2 & 5 \\ 3 & 4 \end{bmatrix}, \boldsymbol{b} = \begin{bmatrix}7 \\ 0 \\ 7 \end{bmatrix}\]

이 때, $T_A(\boldsymbol x) = A\boldsymbol{x}$가 됩니다. $T(\boldsymbol{x}) =\boldsymbol{b}$를 만족시키는 $\boldsymbol{x}$는 $A\boldsymbol{x} = \boldsymbol{b}$를 만족합니다. 따라서 matrix equation을 풀면 $\boldsymbol{x} = \begin{bmatrix} 6 \\ -1 \end{bmatrix}$ 이 됩니다.

example

$T_0$ : Zero transformation

output이 0인 transformation 또한 matrix transformation입니다. Zero matrix를 이용하여 transformation을 정의할 수 있습니다. $T_0 : \mathbb R^n \rightarrow \mathbb R^m \\ T(\boldsymbol{x}) = 0\boldsymbol{x} = 0$

example

$T_I$ : Identity transformation

Output이 input과 같도록 만드는 transformation 또한 matrix transformation입니다. Identity matrix를 이용하여 transformation을 정의할 수 있습니다. $T_I = \mathbb R^n \rightarrow \mathbb R^n \\ T_I(\boldsymbol{x}) = I\boldsymbol{x} = \boldsymbol{x}$

이 때, 위 transfromation은 operator이기도 합니다.

다음은 linear transformation과 matrix transformation 사이의 관계를 알아봅시다. 사실, 두 transformation은 같은 transformation입니다.

Theorem

All linear transformation are matrix transformation

Let $T : \mathbb R^n \rightarrow \mathbb R^m$ be a linear transformation. If $\boldsymbol{e_1, e_2, …, e_n}$ are standard unit vectors in $\mathbb R^n$, and $\boldsymbol{x}$ is any vector in $\mathbb R^n$, then $T(\boldsymbol{x})$ can be represented as

\[T(\boldsymbol{x}) = Ax \\ where \ A =\begin{bmatrix}T(\boldsymbol{e_1}) & T(\boldsymbol{e_2})&...&T(\boldsymbol{e_n}) \end{bmatrix}\]

$A$ : Standard matrix for $T$ and $A=\begin{bmatrix}T\end{bmatrix}$

즉 모든 linear transformation은 matrix transformation으로 나타낼 수 있습니다. 또한 matrix tranformation은 linear transformation이므로, 사실상 두 transformation은 같은 transfromation임을 알 수 있습니다.

example

\[T : \mathbb R^3 \rightarrow \mathbb R^2 \\ T : \begin{bmatrix}x_1 \\ x_2\\x_3 \end{bmatrix} \rightarrow \begin{bmatrix}x_1 + x_2 \\ x_2 - x_3\end{bmatrix}\]

먼저 위 transformation이 linear transformation인지 확인해봅시다.

$\boldsymbol{u, v} \in \mathbb R^3, \boldsymbol{u} = \begin{bmatrix}u_1 \ u_2 \ u_3 \end{bmatrix}, \boldsymbol{v} = \begin{bmatrix}v_1 \ v_2 \ v_3 \end{bmatrix}$

$T(\boldsymbol{u+v}) = \begin{bmatrix}(u_1+v_1) + (u_2 + v_2) \ (u_2+v_2)-(u_3+v_3)\end{bmatrix} = \begin{bmatrix}u_1 + u_2 \ u_2-u_3\end{bmatrix} + \begin{bmatrix}v_1 + v_2 \ v_2-v_3\end{bmatrix} = T(\boldsymbol{u}) + T(\boldsymbol{v})$
$c \in \mathbb R$

$T(c\boldsymbol u) = \begin{bmatrix}cu_1 +cu_2 \ cu_2 - cu_3 \end{bmatrix} = c\begin{bmatrix}u_1 +u_2 \ u_2 - u_3 \end{bmatrix} = cT(\boldsymbol{u})$

따라서 위 transformation은 linear transformation입니다. 위 linear transformation의 standard matrix를 찾기 위해 unit vector을 이용하면

$T(\begin{bmatrix}1 \\0 \\0 \end{bmatrix}) = \begin{bmatrix}1 \\ 0\end{bmatrix}, \ \ T(\begin{bmatrix}0 \\1 \\0 \end{bmatrix}) = \begin{bmatrix}1 \\ 1 \end{bmatrix}, \ \ T(\begin{bmatrix}0 \\0 \\1 \end{bmatrix}) = \begin{bmatrix}0 \\ -1 \end{bmatrix}$ 따라서

$[T] = \begin{bmatrix}1 & 1 & 0 \\ 0 & 1 & -1 \end{bmatrix}$ 임을 알 수 있습니다.

지금까지 transformation과 linear transformation을 알아보았습니다. 다음 포스트에서는 kernel과 range에 대해서 알아보도록 하겠습니다. 질문이나 오류 있으면 댓글 남겨주세요! 감사합니다!

Appendix : Proof of Theorem

Linear tranformation과 matrix transformation의 관계에 대한 정리에 대한 증명입니다.

Theorem

\[T(\boldsymbol{x}) = Ax \\ where \ A =\begin{bmatrix}T(\boldsymbol{e_1}) & T(\boldsymbol{e_2})&...&T(\boldsymbol{e_n}) \end{bmatrix}\]

$A$ : Standard matrix for $T$ and $A=\begin{bmatrix}T\end{bmatrix}$

Proof

$\boldsymbol x \in \mathbb R^n$이라고 하면

\[\boldsymbol{x} = \begin{bmatrix}x_1 \\ x_2 \\ \vdots \\ x_n \end{bmatrix} = x_1\begin{bmatrix}1 \\ 0 \\ \vdots \\ 0 \end{bmatrix} + x_2 \begin{bmatrix} 0 \\ 1 \\ \vdots \\ 0 \end{bmatrix} + \cdots + x_n \begin{bmatrix} 0 \\ 0 \\ \vdots \\ 1\end{bmatrix} = x_1\boldsymbol{e_1} + x_2\boldsymbol{e_2} + \cdots + x_n\boldsymbol{e_n}\]

, 즉 standard unit vector의 linear combination으로 표현됩니다.

$T$가 linear transformation이므로, $T(\boldsymbol{x})$은 다음과 같이 표현됩니다.

\[T(\boldsymbol{x}) =T(x_1\boldsymbol{e_1} + x_2\boldsymbol{e_2} + \cdots + x_n\boldsymbol{e_n}) = x_1T(\boldsymbol{e_1}) + x_2T(\boldsymbol{e_2}) + \cdots + x_nT(\boldsymbol{e_n})\]

이는 matrix product에 따라

\[x_1T(\boldsymbol{e_1}) + x_2T(\boldsymbol{e_2}) + \cdots + x_nT(\boldsymbol{e_n}) = \begin{bmatrix}T(\boldsymbol{e_1}) & T(\boldsymbol{e_2}) & \cdots & T(\boldsymbol{e_n}) \end{bmatrix}\begin{bmatrix}x_1 \\ x_2 \\ \vdots \\ x_n\end{bmatrix}\]

이 되어, 다음 matrix $[T] =\begin{bmatrix}T(\boldsymbol{e_1}) & T(\boldsymbol{e_2}) & \cdots & T(\boldsymbol{e_n}) \end{bmatrix}$

의 transformation이 됩니다. 즉

\[T : \mathbb R^n \rightarrow \mathbb R^m \\ T(\boldsymbol{x}) = [T]\boldsymbol{x}\]

따라서, linear transformation은 matrix transformation이고, standard unit vector를 통해 standard matrix를 구할 수 있습니다.

Twitter Facebook LinkedIn

Twolions

4.2 Linear transformation (1)

1) Linear Transformation

(1) Transformation

(2) Linear transformation

Appendix : Proof of Theorem

공유하기

댓글남기기

참고

Numpy

이웃 기반 협업 필터링 (4)

이웃 기반 협업 필터링 (3)

이웃 기반 협업 필터링 (2)