Links

문자열 매칭 AI

문자열 매칭 AI가 필요한 이유

개인의 신원을 확인하는 데 있어 가장 중요한 요소인 이름은 아래 이미지와 같이 하나를 여러 방법으로 표기할 수 있다는 특징을 지닙니다.
이름이 가진 이러한 특징은 KYC와 AML 과정 곳곳에서 예상치 못한 문제의 원인이 되기도 합니다.
대표적으로 '이 두 사람이 동일 인물이 맞는지'를 판단해야 할 때 문제가 되는데, AML 스크리닝과 중복 승인 방지가 필요한 시점이 대표적인 예라고 할 수 있습니다.
예를 들어 거래소에서 KYC 인증 이벤트 등을 진행 한다고 하면, 한 사람이 한 번만 KYC를 인증하는 것이 가장 좋은 시나리오일 것입니다.
그런데 만약 위의 이미지에서처럼 한 사람이 한 번은 자국어로 이름이 표기되어 있는 로컬 신분증, 한 번은 알파벳으로 이름이 표기되어 있는 여권으로 KYC를 진행한다고 하면, 이 두 사람이 동일 인물이라는 사실을 어떻게 알 수 있을까요?
이 문제를 해결하기 위해 아르고스는 '문자열 매칭 AI'를 이용하여 이름을 비교합니다.

문자열 매칭 AI란?

문자열 매칭 AI를 한 마디로 정의하자면, 두 텍스트가 얼마나 유사한지를 점수로 나타내주는 알고리즘이라고 할 수 있습니다. 이 AI를 통해 오타, 닉네임, 이니셜, 직책 등의 문제를 해결할 수 있으며, 이를 위해 14개 언어 번역과 15가지 매칭 로직을 적용합니다.

지원하는 언어(문자)

Arabic
Burmese
Chinese, Simplified
German
English
French
Chinese, Traditional
Greek
Hebrew
Hungarian
Italian
Japanese
Khmer
Korean
Pashto
Persian
Portuguese
Russian
Spanish
Thai
Urdu
Vietnamese

매칭 로직 예시

발음 유사성
Jesus ↔ Heyzeus ↔ Haezoos
번역 철자 차이
Abdul Rasheed ↔ Abd al-Rashid
닉네임
William ↔ Will ↔ Bill ↔ Billy
공백 또는 하이픈
MaryEllen ↔ Mary Ellen ↔ Mary-Ellen
직함 혹은 존댓말
Dr. ↔ Mr. ↔ Ph.D.
성별
Jon Smith ↔ John Smith (but not Joan Smith)
생략된 이름
McDonalds ↔ McDonald ↔ McD
이름 누락
Phillip Charles Carr ↔ Phillip Carr
이름 순서 변경
Diaz, Carlos Alfonzo ↔ Carlos Alfonzo Diaz
이니셜
J. E. Smith ↔ James Earl Smith
이름 분리
Dick Van Dyke ↔ Dick Van . Dyke
다국어 번역
Mao Zedong ↔ Мао Цзэдун ↔ 毛泽东 ↔ 毛澤東
의미적 유사성
Eagle Pharmaceuticals, Inc. ↔ Eagle Drugs, Co.
의미적 유사성 다국어 번역
Nippon Telegraph and Telephone Corporation ↔ 日本電信電話株式会社
조직의 별칭
IBM ↔ Big Blue

문자열 매칭 AI를 활용한 ARGOS KYC

아르고스는 다년간의 축적된 KYC 노하우를 통해 글로벌 신원인증을 위해 무엇보다 중요한 사용자의 이름을 더 잘 확인할 수 있는 방법을 찾았습니다. 이를 통해 아르고스는 두 가지 가치를 고객에게 전하려고 합니다.
첫 번째는 KYC 프로세스의 자동화입니다. 오타 등으로 인해 OCR AI가 신분증을 통해 얻은 데이터와 사용자가 제출한 데이터가 달라지는 경우에도, 매뉴얼 검수를 기다릴 필요 없이 바로 결과를 얻을 수 있습니다.
두 번째는 신원인증의 중요한 요소 중 하나인 중복된 사용자를 확인할 수 있다는 것입니다. 신분증의 종류가 달라지거나, 이름이 다른 언어로 쓰여있더라도 동일 인물인지를 판단할 수 있습니다.