문자열 매칭 AI
개인의 신원을 확인하는 데 있어 가장 중요한 요소인 이름은 아래 이미지와 같이 하나를 여러 방법으로 표기할 수 있다는 특징을 지닙니다.

이름이 가진 이러한 특징은 KYC와 AML 과정 곳곳에서 예상치 못한 문제의 원인이 되기도 합니다.
대표적으로 '이 두 사람이 동일 인물이 맞는지'를 판단해야 할 때 문제가 되는데, AML 스크리닝과 중복 승인 방지가 필요한 시점이 대표적인 예라고 할 수 있습니다.
예를 들어 거래소에서 KYC 인증 이벤트 등을 진행 한다고 하면, 한 사람이 한 번만 KYC를 인증하는 것이 가장 좋은 시나리오일 것입니다.

그런데 만약 위의 이미지에서처럼 한 사람이 한 번은 자국어로 이름이 표기되어 있는 로컬 신분증, 한 번은 알파벳으로 이름이 표기되어 있는 여권으로 KYC를 진행한다고 하면, 이 두 사람이 동일 인물이라는 사실을 어떻게 알 수 있을까요?
이 문제를 해결하기 위해 아르고스는 '문자열 매칭 AI'를 이용하여 이름을 비교합니다.
문자열 매칭 AI를 한 마디로 정의하자면, 두 텍스트가 얼마나 유사한지를 점수로 나타내주는 알고리즘이라고 할 수 있습니다. 이 AI를 통해 오타, 닉네임, 이니셜, 직책 등의 문제를 해결할 수 있으며, 이를 위해 14개 언어 번역과 15가지 매칭 로직을 적용합니다.

Arabic | Burmese | Chinese, Simplified | German |
English | French | Chinese, Traditional | Greek |
Hebrew | Hungarian | Italian | Japanese |
Khmer | Korean | Pashto | Persian |
Portuguese | Russian | Spanish | Thai |
Urdu | Vietnamese | | |
발음 유사성 | Jesus ↔ Heyzeus ↔ Haezoos |
번역 철자 차이 | Abdul Rasheed ↔ Abd al-Rashid |
닉네임 | William ↔ Will ↔ Bill ↔ Billy |
공백 또는 하이픈 | MaryEllen ↔ Mary Ellen ↔ Mary-Ellen |
직함 혹은 존댓말 | Dr. ↔ Mr. ↔ Ph.D. |
성별 | Jon Smith ↔ John Smith (but not Joan Smith) |
생략된 이름 | McDonalds ↔ McDonald ↔ McD |
이름 누락 | Phillip Charles Carr ↔ Phillip Carr |
이름 순서 변경 | Diaz, Carlos Alfonzo ↔ Carlos Alfonzo Diaz |
이니셜 | J. E. Smith ↔ James Earl Smith |
이름 분리 | Dick Van Dyke ↔ Dick Van . Dyke |
다국어 번역 | Mao Zedong ↔ Мао Цзэдун ↔ 毛泽东 ↔ 毛澤東 |
의미적 유사성 | Eagle Pharmaceuticals, Inc. ↔ Eagle Drugs, Co. |
의미적 유사성 다국어 번역 | Nippon Telegraph and Telephone Corporation
↔ 日本電信電話株式会社 |
조직의 별칭 | IBM ↔ Big Blue |
아르고스는 다년간의 축적된 KYC 노하우를 통해 글로벌 신원인증을 위해 무엇보다 중요한 사용자의 이름을 더 잘 확인할 수 있는 방법을 찾았습니다. 이를 통해 아르고스는 두 가지 가치를 고객에게 전하려고 합니다.
첫 번째는 KYC 프로세스의 자동화입니다. 오타 등으로 인해 OCR AI가 신분증을 통해 얻은 데이터와 사용자가 제출한 데이터가 달라지는 경우에도, 매뉴얼 검수를 기다릴 필요 없이 바로 결과를 얻을 수 있습니다.
두 번째는 신원인증의 중요한 요소 중 하나인 중복된 사용자를 확인할 수 있다는 것입니다. 신분증의 종류가 달라지거나, 이름이 다른 언어로 쓰여있더라도 동일 인물인지를 판단할 수 있습니다.
Last modified 22d ago