정수론부터 RSA까지

2025.11.01 00:12

RSA는 대표적인 비대칭 암호화 방식 중 하나이다.

RSA의 기반이 되는 정수론 개념과 암호화 원리를 알아보자.

군

RSA를 이해하기 위해선 우선 군(group)이 무엇인지 알아야 한다.
오늘날 RSA를 비롯한 많은 암호화 방식이 군론을 기반으로 한다. 개념은 어렵지 않다.

군이란, 아래 규칙에 맞게 원소의 집합과 연산(덧셈, 곱셈)을 정의한 것이다.

닫힘: 집합 안의 두 원소를 연산했을 때, 그 결과가 군 안에 속해야 한다.
결합법칙: 여러 원소에 대한 연산을 임의의 순서로 수행할 수 있다. (e.g. (a+b)+c = a+(b+c))
항등원: 특정 원소와 항등원을 연산한 결과가 그 원소 자신이 되어야 한다. (e.g. a+0=a, 이 경우 항등원 0이 군 내에 존재함)
역원: 두 원소를 연산한 결과가 항등원이 되는 특정 원소가 군 내에 존재한다. 그 원소를 역원이라 부른다. (e.g. a+(-a)=0, 이 경우 역원인 -a가 군에 존재함)

군은 어떤 연산을 사용하느냐에 따라 덧셈 군, 곱셈 군으로 칭하기도 한다.

덧셈 군: 연산은 덧셈(+), 항등원은 0, 역원은 음수
- 예: a + (-a) = 0
곱셈 군: 연산은 곱셈(×), 항등원은 1, 역원은 곱셈 역원
- 예: a × a⁻¹ = 1

양의 정수끼리 그냥 연산한 결과는 n보다 큰 수가 될 수 있으니, 군의 성질을 만족시키기 위해 연산을 모듈러 n으로 정의한다. 덧셈은 (a+b)%n, 곱셈은 (ab)%n로 계산한다. 여기서 %는 모듈러 연산자이고 n으로 나눈 나머지값을 결과로 한다.

특정 모듈러스 n에서 군에 속한 원소의 개수를 군의 크기 또는 위수(order)라고 부른다.

모듈러 역원

이렇게 모듈러 정수군에서 덧셈, 뺄셈, 곱셈을 쉽게 할 수 있다. 하지만 나눗셈을 하기 위해선 생각이 필요하다.

실수에서는 ÷ 2는 × 1/2와 같다. 하지만 정수군에는 1/2가 없으므로, 2를 나누는 대신 모듈러 곱셈에서의 역원을 곱해줄 수 있다.

예를 들어 mod 10에서, 3의 곱셈 역원은 7이다. 따라서 mod 10에서 어떤 수를 3으로 나누는 것은 7을 곱하는 것과 같다. 모듈러 연산에서의 곱셈 역원이므로, 모듈러 역원으로도 부른다.

3 × 7 = 21
21 % 10 = 1이기 때문

3 × 7 ≡ 1 (mod 10)
모듈러 결과가 같으면, 두 값이 합동이라고도 한다. 기호는 ≡

모듈러 역원은 언제 존재할까: 베주 항등식

그런데 이 역원이 항상 존재하는 건 아니다. 쉬운 예로 mod 10에서 5를 생각해보면, 5에 어떤 수를 곱해도 결과가 일의 자리수가 1이 되는 경우는 없으니까 말이다.

만약 a에 대한 역원 x가 존재한다고 가정하면

ax ≡ 1 (mod m)
ax = 1 + my (어떤 정수 y에 대해)

이므로 ax - my = 1 가 성립해야 한다.

여기서 a와 m이 서로소이면 x와 y가 항상 존재한다. 왜냐하면..

집합 S = {ax + by > 0 | x, y는 정수}를 생각해보자.
- S는 공집합이 아니다.
  - y=0, x=1이면: a×1 + b×0 = a
  - a가 양수면 그대로, 음수면 |a| (x=-1로 조정)
  - 따라서 S는 최소한 하나의 원소를 가진다.
- S에 있는 가장 작은 원소를 d라고 부르자.
a를 d로 나누면 몫 q와 나머지 r로 표현할 수 있다. (나머지 정리)
```
a = dq + r  (0≤r<d)
```
여기서 만약 r이 0보다 크다면
```
r = a - dq
= a - (as + bt)q
= a(1-sq) + b(-tq)
```
이므로 r도 S의 원소라는 뜻인데, r < d이므로 d가 최소원소라는 것에 모순된다.
따라서 r = 0이어야 한다. 즉, a는 d로 나누어 떨어진다.
같은 방법으로 b도 d로 나누어 떨어지는 것을 알 수 있다.
d는 a와 b의 공약수이면서, d = as + bt이다.

만약 다른 공약수 c가 있다고 하면, c에 어떤 정수 l이나 k를 곱한 것이 a, b와 각각 같을 것이다.
- a = c × l
- b = c × k
따라서 이렇게 표현할 수 있다.
```
d = as + bt
= c×l×s + c×k×t
= c × (ls + kt)
```
즉, c는 d의 약수이다.
모든 공약수 c는 d의 약수여야하므로 d는 가장 큰 공약수, 다시 말해 최대공약수(gcd)이다.
집합 S = {ax + by > 0 | x, y는 정수}의 가장 작은 원소 d는 a, b의 최대공약수이다.
따라서 ax + by = gcd(a, b)를 성립하는 x, y는 항상 존재한다.
(이 식을 베주 항등식 Bézout’s Identity 이라 부른다.)

이런 이유 때문이다.

이제 다시 모듈러 역원으로 돌아가자. a에 대한 역원 x가 존재한다고 가정하면, ax - my = 1을 만족하는 어떤 정수 y가 있어야 한다. a와 m이 서로소이면 (최대공약수가 1이면) ax - my = gcd(a, m) = 1을 성립하는 x, y가 항상 존재하므로, 역원도 항상 존재한다.

특히 m이 소수이면, 0이 아닌 모든 원소 a에 대해 m과 항상 서로소이므로, 모든 수에 대해 모듈러 역원이 존재한다.

곱셈 군과 오일러 피 함수 φ(n)

베주 항등식을 통해 우리는 중요한 사실을 알게 되었다. mod n에서 어떤 수 a의 모듈러 역원이 존재하는 필요충분조건은 a와 n이 서로소인 것이다.

그런데 군의 정의를 떠올려보면, 군에 속한 모든 원소는 역원을 가져야 한다. 따라서 mod n의 곱셈 군은 1부터 n-1까지 중 n과 서로소인 수들로만 구성되어야 한다.

예를 들어 n = 15일 때:

mod 15에서:
15와 서로소인 수: {1, 2, 4, 7, 8, 11, 13, 14} → 8개

곱셈 군의 크기는 n과 서로소인 수의 개수와 같다. 이 개수를 φ(n)으로 표기하며, 오일러 피 함수(Euler’s totient function)라고 한다. 위 예시에서 φ(15) = 8이다.

n이 소수 p인 경우, 1부터 p-1까지 모든 수가 p와 서로소이므로 φ(p) = p - 1이다.

모듈러 역원 찾는 법: 확장 유클리드 호제법

모듈러 역원이 존재하는 조건을 알고 곱셈군을 구성했다. 그렇다면 모듈러 역원은 실제로 어떻게 찾을 수 있을까?

여기서 확장 유클리드 호제법이 필요하다. 확장 유클리드 알고리즘(Extended Euclidean Algorithm)은 유클리드 호제법을 수행하면서 베주 항등식의 x, y 를 함께 계산하는 방법이다.

a·x + b·y = g

유클리드 호제법에서 베주 항등식 찾기

유클리드 호제법의 과정을 보며 생각해보자.

유클리드 호제법의 과정

a를 b로 나누면 몫 q와 나머지 r로 표현할 수 있다. 유클리드 호제법에 따라 gcd(a, b) = gcd(b, r₀)이므로 원래 문제를 더 작은 문제로 바꿀 수 있다.
```
a = bq₀ + r₀   (0 ≤ r₀ < b)
-> b = r₀q₁ + r₁   (0 ≤ r₁ < r₀)
```
이 과정을 나머지가 0이 될 때까지 계속한다.
```
a = bq₀ + r₀
b = r₀q₁ + r₁
r₀ = r₁q₂ + r₂
⋯
r₍ₖ₋₂₎ = r₍ₖ₋₁₎qₖ + rₖ
r₍ₖ₋₁₎ = rₖq₍ₖ₊₁₎ + 0
```
마지막에 나온 나머지 rₖ가 바로 gcd(a, b)이다.

각 단계의 나머지 r을 a와 b의 선형 결합 as + bt 형태로 나타낼 수 있다.

r₀ = a - b·q₀

r₁ = b - r₀·q₁
   = b - (a - b·q₀)·q₁
   = -q₁·a + (1 + q₀·q₁)·b

r₂ = r₀ - r₁·q₂
   ...
   = (1 + q₁·q₂)·a - (q₀ + q₂ + q₀·q₁·q₂)·b

따라서 모든 나머지 rᵢ는 항상 다음과 같이 쓸 수 있다:

rᵢ = sᵢ·a + tᵢ·b

마지막 단계의 나머지 rₖ가 gcd(a, b)이므로, 그때의 계수 sₖ와 tₖ가 바로 베주 항등식의 해가 된다.
```
rₖ = gcd(a, b) = sₖ·a + tₖ·b

따라서 x = sₖ, y = tₖ
```

a×c ≡ 1 (mod n)을 만족하는 c를 찾는 것은 a×c - n×k = 1을 만족하는 정수 c, k를 찾는 것과 같다.

이는 베주 항등식 a×c + n×(-k) = 1과 똑같은 형태다. 따라서 a와 n이 서로소이면 확장 유클리드 호제법으로 이 식을 만족하는 c를 구할 수 있고, 이 c가 바로 a의 모듈러 n에서의 역원이다.

암호화의 아이디어

이제 우리는 모듈러 역원을 구할 수 있다. 이 개념을 어떻게 암호화에 활용할 수 있을까? 암호화에서 기본적으로 필요한 건, 메시지를 어떤 방법으로 변환하고 다시 역변환으로 돌릴 수 있어야 한다는 것이다.

여기서 모듈러 연산의 재밌는 성질 하나를 알아보자. mod 5에서 2를 계속 거듭제곱해보면:

2¹ mod 5 = 2
2² mod 5 = 4
2³ mod 5 = 3
2⁴ mod 5 = 1  ← 다시 1로
2⁵ mod 5 = 2  ← 처음부터 반복
2⁶ mod 5 = 4
... (반복)

2⁴ ≡ 1이 되고, 그 이후로는 같은 패턴이 반복된다.

왜 하필 4번일까? mod 5에서 곱셈 군의 크기 φ(5) = 4 (1~5 중 5와 서로소인 수의 갯수)이기 때문이다. 어떤 원소든 군의 크기만큼 거듭제곱하면 1로 돌아온다. 이 성질을 암호화에 활용할 수 있다.

메시지 m을 거듭제곱해서 암호문을 만든다고 했을 때,

c = m^e mod n

이 암호문 c를 다시 원래 메시지 m으로 되돌리려면 어떻게 해야 할까? 다른 지수 d로 거듭제곱해서

c^d = (m^e)^d = m^(e·d) ≡ m (mod n)

가 되게 하면 된다.

정확히는, e·d ≡ 1 (mod φ(n))가 되도록 d를 선택하면 암호화/복호화가 작동한다.
(왜 정확히 이게 작동하는지는 오일러 정리에서 다시 살펴보자.)

e·d ≡ 1 (mod φ(n))를 만족하는 d는 e의 모듈러 φ(n)에서의 역원이다. 앞에서 배운 확장 유클리드 호제법으로 구할 수 있다. 즉, 공개 지수 e와 φ(n)을 알면, 누구나 비밀 지수 d를 계산할 수 있다.

RSA는 두 개의 큰 소수 p, q를 선택하고, 그 곱 n = p × q를 모듈러스로 사용한다. 이렇게 하면 n을 공개해도 안전하다. n을 알아도 p와 q를 찾는 것, 즉 소인수분해하는 것이 매우 어렵기 때문이다.

p, q를 모르면 φ(n)을 계산할 수 없고, 따라서 비밀 지수 d도 계산할 수 없다. 하지만 우리가 암호화 키를 만들려면 φ(n)을 알아야 한다. 그렇다면 n = p × q일 때 φ(n)은 어떻게 계산할까?

합성수의 φ(n) 계산하기

앞에서 φ(n)은 n과 서로소인 수의 개수라고 배웠다. n이 소수일 때는 간단히 φ(p) = p - 1이다.

하지만 RSA에서는 두 소수의 곱 n = p × q를 사용한다. 이 경우 φ(n)을 어떻게 계산할까?

1. 직관적 계산

n = p × q일 때, 1부터 n까지 중 n과 서로소가 아닌 수는 p의 배수이거나 q의 배수인 수들이다.

p의 배수: p, 2p, 3p, …, (q-1)p → q-1개 (pq는 제외)
q의 배수: q, 2q, 3q, …, (p-1)q → p-1개 (pq는 제외)
p와 q의 공배수: pq = n → 1개

p의 배수와 q의 배수는 겹치지 않는다 (p, q가 서로 다른 소수이므로). 따라서 n과 서로소가 아닌 수는 (q-1) + (p-1) + 1 = p + q - 1개이다. n과 서로소인 수는

φ(n) = n - (p + q - 1)
     = pq - p - q + 1
     = (p - 1)(q - 1)

이다.

2. 엄밀한 증명 (중국인의 나머지 정리)

k가 mn과 서로소일 필요충분조건은 k가 m과도 서로소이고 n과도 서로소인 것이다.

중국인의 나머지 정리에 따르면, m과 n이 서로소일 때 0 ≤ k < mn인 모든 정수 k는 순서쌍 (k mod m, k mod n)과 일대일 대응된다.

유일성: k₁ ≡ k₂ (mod m)이고 k₁ ≡ k₂ (mod n)이면, k₁ - k₂는 m의 배수이면서 n의 배수다. m과 n이 서로소이므로 k₁ - k₂는 mn의 배수다. 따라서 0 ≤ k₁, k₂ < mn이면 k₁ = k₂다.
존재성: 임의의 순서쌍 (a, b)에 대해 k ≡ a (mod m)이고 k ≡ b (mod n)을 만족하는 k가 항상 존재한다.

따라서 {0, 1, …, mn-1}의 원소들은 {0, 1, …, m-1} × {0, 1, …, n-1}의 순서쌍들과 정확히 일대일 대응된다.

이제 mn과 서로소인 k를 세어보자.

k가 mn과 서로소
↔ k가 m과 서로소이면서 n과도 서로소
↔ (k mod m, k mod n)에서 양쪽 성분 모두 서로소

따라서:

mn과 서로소인 k의 개수
= m과 서로소인 나머지 개수 × n과 서로소인 나머지 개수
= φ(m) × φ(n)

즉, φ(mn) = φ(m) × φ(n)이다.

이 곱셈적 성질로부터:

φ(pq) = φ(p) × φ(q)
      = (p - 1) × (q - 1)

예를 들어 p = 61, q = 53이면

n = 61 × 53 = 3233
φ(n) = 60 × 52 = 3120

이다.

이 φ(n)이 바로 RSA의 핵심이다. n은 공개되지만, φ(n)은 비밀이다. φ(n)을 계산하려면 n을 p와 q로 소인수분해해야 하는데, 이게 매우 어렵기 때문이다.

오일러 정리

이제 우리는 합성수 n = p × q에 대해 φ(n) = (p-1)(q-1)을 계산할 수 있게 되었다. 하지만 암호화의 아이디어 섹션에서 미뤄뒀던 중요한 질문이 남아있다.

왜 e·d ≡ 1 (mod φ(n))이면 m^(e·d) ≡ m (mod n)이 성립할까?

이 질문에 답하는 것이 바로 오일러 정리다. 18세기 수학자 오일러는 n과 서로소인 임의의 수 a에 대해

a^φ(n) ≡ 1 (mod n)

을 발견했다. 증명해보자.

n과 서로소인 모든 수 {a₁, a₂, ..., a_φ(n)}을 생각하자.
이들에 각각 a를 곱하면 {a×a₁, a×a₂, ..., a×a_φ(n)}이 되는데, 이것도 여전히 n과 서로소인 수들이고, 모두 서로 다르다. 따라서 두 집합은 같다. 순서만 다를 뿐이다.

양쪽을 모두 곱하면

a₁ × a₂ × ... × a_φ(n) ≡ a^φ(n) × (a₁ × a₂ × ... × a_φ(n)) (mod n)

좌변은 n과 서로소이므로 약분할 수 있고, a^φ(n) ≡ 1 (mod n)을 얻는다.

이 정리가 왜 중요할까?

a^φ(n) ≡ 1 이므로, 어떤 정수 k에 대해서도

a^(k·φ(n) + 1) ≡ a (mod n)

이 성립한다.

a^(k·φ(n) + 1) = (a^φ(n))^k × a ≡ 1^k × a ≡ a (mod n)

자 이제 암호화로 돌아가서, 우리는 m^e로 암호화하고, c^d로 복호화하고 싶다. 그러려면

(m^e)^d = m^(e·d) ≡ m (mod n)

이어야 한다. 위의 오일러 정리를 쓰면, e·d = k·φ(n) + 1이 되게만 하면 된다!

다시 말해

e·d ≡ 1 (mod φ(n))

이면 된다. d는 e의 모듈러 φ(n)에서의 역원이다.

예를 들어 p = 61, q = 53이면 n = 3233이고 φ(n) = 3120이다. 공개 지수로 e = 17을 선택했다면, 비밀 지수 d는

17 · d ≡ 1 (mod 3120)

을 만족해야 한다. 확장 유클리드 호제법으로 계산하면 d = 2753이다.

검증해보자.

17 × 2753 = 46801 = 15 × 3120 + 1

따라서 임의의 메시지 m에 대해

(m^17)^2753 = m^(17×2753)
            = m^(15×3120 + 1)
            = (m^3120)^15 × m
            ≡ 1^15 × m
            ≡ m (mod 3233)

좋다!

이제 우리는

공개 키: (e, n) = (17, 3233)
개인 키: (d, n) = (2753, 3233)

를 가지게 되었다.

RSA

지금까지 우리가 배운 것을 되돌아보자.

군론으로 시작해서, 모듈러 역원과 베주 항등식으로 역원의 존재를 증명했다. 확장 유클리드 호제법으로 역원을 실제로 계산하는 법을 배웠다. 암호화의 기본 아이디어를 살펴보고, 소수 대신 합성수를 써야 하는 이유를 알았다. 오일러 피 함수로 합성수의 군 차수를 계산했고, 오일러 정리로 암호화와 복호화가 왜 작동하는지 증명했다.

음. 이제 모든 준비가 끝났다. RSA 암호화 시스템의 전체 과정을 정리해보자.

키 생성

앨리스가 키를 생성한다고 하자.

두 개의 큰 소수 p, q를 선택한다. (예: p = 61, q = 53)
n = p × q를 계산한다. (n = 3233)
φ(n) = (p-1) × (q-1)을 계산한다. (φ(n) = 3120)
1 < e < φ(n)이고 φ(n)과 서로소인 e를 선택한다. (e = 17)
확장 유클리드 호제법으로 e·d ≡ 1 (mod φ(n))인 d를 계산한다. (d = 2753)

이제 앨리스는

공개 키: (e, n) = (17, 3233)
개인 키: (d, n) = (2753, 3233)

를 가지게 된다. 공개 키는 모두에게 알려주고, 개인 키는 비밀로 보관한다. p, q, φ(n)은 안전하게 폐기한다.

암호화

밥이 앨리스에게 메시지 m = 42를 보내고 싶다면, 앨리스의 공개 키 (e, n)을 사용하여

c = m^e mod n
  = 42^17 mod 3233
  = 2557

을 계산하고, 이 암호문 c = 2557을 앨리스에게 전송한다.

복호화

앨리스는 자신의 개인 키 (d, n)을 사용하여

m = c^d mod n
  = 2557^2753 mod 3233
  = 42

를 계산하고, 원래 메시지 42를 복원한다.

위에서 증명했듯이

c^d = (m^e)^d = m^(e·d) = m^(k·φ(n)+1) ≡ m (mod n)

이기 때문에 성립한다.

보안의 원리

RSA의 보안은 소인수분해의 어려움에 기반한다. RSA에서 공개 키 (e, n)는 모두가 알고 있다. 개인 키 d를 계산하려면 φ(n)이 필요하고, φ(n) = (p-1)(q-1)을 계산하려면 n을 p와 q로 소인수분해해야 한다.

하지만 n이 충분히 크면 소인수분해는 사실상 불가능하다. 위의 예시에서 n = 3233은 작은 수라 쉽게 분해할 수 있지만, 실제 RSA에서는 n이 2048비트 이상이다. 이는 약 600자리 십진수이고, 현재 컴퓨터로는 연산에 수십 년이 걸린다.

반대로 p와 q를 알고 있으면 φ(n)을 즉시 계산할 수 있고, 확장 유클리드 호제법으로 d도 빠르게 구할 수 있다. 이것이 바로 RSA의 비대칭성이다.

실제 사용

실제로 RSA를 사용할 때는 몇 가지 주의사항이 있다.

키 크기는 최소 2048비트 이상이어야 한다. 보안이 중요한 경우 3072비트나 4096비트를 사용한다. 공개 지수 e는 보통 65537 = 2^16 + 1을 사용한다. 이진수로 10000000000000001이므로 분할 정복 거듭제곱이 효율적이다.

실제로는 평문을 직접 암호화하지 않고 OAEP같은 패딩을 사용한다. 이렇게 하면 같은 평문도 매번 다른 암호문으로 암호화된다.

RSA는 암호화 외에도 디지털 서명에도 사용된다. 개인 키로 서명을 만들고, 누구나 공개 키로 검증할 수 있다.

정리

RSA를 이해하기 위해 여러 수학 개념을 차례로 살펴봤다.

군론에 대해 알아보고, 곱셈 군이 성립하려면 모든 원소가 역원을 가져야 한다는 것을 알았다.
베주 항등식은 역원이 존재하는 조건이 “서로소”임을 보여줬다. 따라서 mod n의 곱셈 군은 n과 서로소인 수들로 구성된다.
- 오일러 피 함수는 n과 서로소인 수의 갯수를 나타내는 함수이다: φ(n)
오일러 정리 a^φ(n) ≡ 1 (mod n)는 거듭제곱이 순환한다는 것을 보장한다.
RSA의 n은 매우 큰 두 소수의 곱 n = pq이며, φ(n) = (p-1)(q-1)이다.
e·d ≡ 1 (mod φ(n))이면 m^(ed) ≡ m이 성립하므로, e로 암호화한 것을 d로 복호화할 수 있다. 여기서 e는 공개하고 d는 비밀로 유지한다.
n을 공개해도 p와 q를 모르면 φ(n)을 계산할 수 없고, φ(n)을 모르면 e로부터 d를 구할 수 없다. 하지만 p와 q를 아는 사람은 확장 유클리드 호제법으로 d를 빠르게 계산한다. n의 소인수분해가 어렵다는 것이 전체 시스템의 안전성을 보장한다.

읽어주셔서 감사합니다. 글 내용에 틀린 점이 있다면 지적 환영합니다.

참고 자료

https://www.mathhm.com/previous_test/html/summary/algebra/101.php
베주 항등식
- 자연수의 정렬성: https://proofwiki.org/wiki/Well-Ordering_Principle
- https://ko.wikipedia.org/wiki/%EB%B2%A0%EC%A3%BC_%ED%95%AD%EB%93%B1%EC%8B%9D
페르마의 소정리
RSA
- 리얼월드 암호학 - 데이비드 웡 저 임지순 역
- https://ko.wikipedia.org/wiki/RSA_%EC%95%94%ED%98%B8
- https://www.math.ucdavis.edu/~anne/SQ2014/thematic_tutorials/numtheory_rsa.html
- https://math.mit.edu/~goemans/18310S15/modarithm-algebra-notes.pdf
밑부터 시작하는 비트코인 (Programming Bitcoin by Jimmi Song, O’Reilly)

공부eBPF로 서버 성능 Profiling하는 법: Pyroscope의 구현 살펴보기 공부spot 인스턴스에서 서버 가용성 개선하기 공부strace로 shaka-packager 버그 추적 공부strace로 shaka-packager의 간헐적 실패 버그 추적하기 embeddingembedding and chunking embedding임베딩