샴 쌍둥이 네트워크(Siamese Neural Network)

머신러닝

샴 쌍둥이 네트워크(Siamese Neural Network)

jsBae 2025. 2. 2. 22:10

Siamese Neural Network?

샴 쌍둥이 네트워크(Siamese Neural Network)는 두 개의 동일한 신경망을 공유 가중치로 구성하여 두 입력 간의 유사성을 학습하도록 설계된 신경망 구조이다. 일반적으로 두 입력의 특성을 추출하고, 이 특성 간의 거리를 계산하여 두 입력이 얼마나 유사한지를 평가하는 데 사용된다.

옛날 옛적, 마을에 두 명의 똑같이 생긴 쌍둥이 탐정(형제)이 살고 있었다. 이들은 서로 매우 닮았을 뿐만 아니라, 같은 사고방식과 분석 능력을 가지고 있어 사건을 해결하는 능력이 뛰어났다.

어느 날, 마을에서는 두 개의 미스터리한 편지가 발견되었다. 사람들은 궁금해했다.

"이 두 편지가 같은 사람이 쓴 걸까?"
"아니면 완전히 다른 사람이 쓴 걸까?"

마을 사람들은 누구에게 의뢰해야 할지 고민하다가, 결국 쌍둥이 탐정에게 사건을 맡겼다.

쌍둥이 탐정의 조사 방법

편지 분석
- 쌍둥이 탐정은 편지 1장을 각각 하나씩 가져가서 똑같은 방법으로 분석하기 시작했다.
- 글씨체, 문장의 길이, 단어 선택, 필체의 압력 등 여러 가지 특성을 조사했다.
정보 비교
- 쌍둥이 탐정은 서로 분석 결과를 비교했다.
- 만약 두 편지가 아주 비슷한 특징을 가지고 있다면, 같은 사람이 썼을 가능성이 높다고 결론을 내렸다.
- 반대로 두 편지가 매우 다르면, 다른 사람이 썼을 확률이 높다고 판단했다.
거리 측정
- 탐정들은 결과를 수치로 변환하여 유사도를 평가했다.
- 만약 두 편지의 특징 점수 차이가 작다면, 즉 "거리가 가깝다면" 같은 사람의 작품일 확률이 높다.
- 반대로, 점수 차이가 크다면 "거리가 멀다"고 판단하여 다른 사람의 작품일 가능성이 높다고 보았다.

샴 쌍둥이 네트워크와의 관계

쌍둥이 탐정의 행동 방식이 샴 쌍둥이 네트워크와 매우 유사하다.

같은 신경망(쌍둥이 탐정)
- 두 개의 입력 데이터(편지)를 동일한 신경망 구조로 분석한다.
- 신경망은 텍스트, 이미지 등 다양한 데이터를 처리할 수 있다.
특징 추출(편지의 특징 분석)
- CNN(합성곱 신경망)이나 LSTM(순환 신경망) 같은 기술을 활용하여 입력 데이터에서 특징을 추출한다.
유사성 비교(탐정들의 비교 과정)
- 두 입력 데이터에서 추출된 특징 벡터를 비교하여 유사성을 계산한다.
- 유클리드 거리 또는 코사인 유사도를 활용한다.
거리 기반 분류(판단)
- 두 데이터가 비슷하면 같은 그룹(예: 같은 사람이 작성한 글)으로 판단한다.
- 다르면 다른 그룹(예: 다른 사람이 작성한 글)으로 분류한다.

샴 쌍둥이 네트워크의 실제 활용 사례

얼굴 인식 : 두 사진이 같은 사람인지 비교 (예: 스마트폰 얼굴 잠금 해제)
문서 표절 검사 : 두 개의 문서가 얼마나 유사한지 비교하여 표절 여부 판별
자동 채점 시스템 (ROFT 자동 채점과 연결) : 학생의 답안과 모범 답안을 비교하여 유사도 측정 후 점수 부여
추천 시스템 : 사용자의 취향과 유사한 상품을 추천 (예: 넷플릭스 추천 알고리즘)

샴 쌍둥이 네트워크는 "비슷한지 다른지"를 판단하는 데 특화된 머신러닝 모델이다.
두 개의 데이터를 같은 신경망을 통해 분석하고, 비교하여 유사도를 계산하는 방식으로 동작한다.

마치 쌍둥이 탐정이 사건을 해결하는 것처럼, 샴 쌍둥이 네트워크도 두 개의 입력을 동일한 방법으로 분석하고, 비교하여 결과를 내는 것이다.

샴 쌍둥이 네트워크는 두 개의 데이터를 동일한 신경망을 통해 분석하고, 유사도를 계산하는 머신러닝 모델과 같다.

샴과 네트 = 동일한 신경망 구조
그림 분석 = 특징 추출 과정
마법의 돌 = 거리 함수(유클리드 거리, 코사인 유사도 등)
95% 유사 = 예측 결과 값

1. 입력 쌍

두 개의 입력 데이터가 네트워크에 주어진다. 예를 들어, 이미지 쌍, 텍스트 쌍, 또는 기타 데이터 쌍 등이 될 수 있다.

2. 공유 신경망

두 입력 데이터는 동일한 신경망 구조를 통과한다. 이 신경망은 동일한 가중치를 공유하며 입력 데이터를 특성 벡터로 변환한다.
예: 합성곱 신경망(CNN)을 이미지에 적용하거나, 순환 신경망(RNN)을 텍스트 데이터에 적용.

3. 거리 함수

두 입력 데이터에서 추출된 특성 벡터의 유사성을 계산하기 위해 거리 함수가 사용된다.
주로 사용되는 거리 함수:
- 유클리드 거리(Euclidean Distance)
- 코사인 유사도(Cosine Similarity)
- 맨해튼 거리(Manhattan Distance)

4. 출력

출력은 입력 쌍 간의 유사도를 나타낸다. 이를 통해 두 입력이 같은 클래스인지 여부를 판단하거나, 유사성 점수를 계산한다.

5. 손실 함수

주로 대조적 손실(Contrastive Loss)을 사용하여 학습한다. 이 손실 함수는 같은 클래스일 때 거리 함수를 최소화하고, 다른 클래스일 때 거리를 최대화하는 방향으로 네트워크를 훈련시킨다.

728x90