AI VIDEO BRIEFING

AI 사기 탐지 앙상블: 예측형 ML과 인코더 LLM이 결합하는 방식

은행은 200밀리초 안에 거래의 사기 여부를 판단해야 한다. 예측형 머신러닝과 BERT 같은 인코더 LLM을 묶은 앙상블이 어떻게 정확도와 속도를 함께 끌어올리는지 IBM 설명을 정리했다.

출처: IBM Technology2025년 8월 20일AI 보조 요약

AI 두 모델을 묶어 사기를 잡는다 — 예측형 ML과 인코더 LLM 앙상블의 원리 영상 대표 이미지

핵심 메시지

모든 결제·송금·청구는 보통 200밀리초 안에 '사기인가 아닌가'를 통과해야 하고, 그래서 은행은 빠른 AI 모델에 의존한다.
1차 방어선은 로지스틱 회귀·결정트리·랜덤포레스트·그래디언트 부스팅 같은 예측형 ML로, 구조화된 데이터(금액·시간·위치·가맹점·소비이력)로 위험점수를 낸다.
예측형 ML은 알려진 지표를 건드리지 않는 새롭고 미묘한 수법과 자유 텍스트·이미지 같은 비구조 데이터를 놓친다.
2차로 BERT·RoBERTa 같은 인코더 LLM이 텍스트의 맥락·긴급성·스푸핑 단서를 읽어 애매한 거래를 재평가한다.
앙상블은 확신이 높은 거래는 곧장 처리하고 경계선(저확신) 거래만 비싼 LLM으로 보내 효율과 정확도를 동시에 잡는다.

쉽게 이해하기

결제·송금·보험청구는 돈이 움직이기 전 단 한 가지 질문, '사기냐 아니냐'를 통과해야 한다. 주어진 시간은 대개 200밀리초 미만이다. 사람이 일일이 볼 수 없기에 은행은 패턴을 학습해 빠르게 결정하는 AI에 의존하고, 모델이 확신하지 못하면 사람 검토로 넘긴다.

오늘날 대다수 사기 탐지 플랫폼의 1차 방어선은 '예측형 ML'이다. 로지스틱 회귀, 결정트리, 랜덤포레스트, 그래디언트 부스팅 같은 알고리즘이 과거 거래의 라벨링된 대규모 데이터로 학습한다. 거래 금액·시각·위치·가맹점 분류·소비 이력 등 수십 개의 구조화된 특징을 보고 위험점수를 출력한다. 그러나 알려진 지표를 건드리지 않는 새로운 수법은 빠져나가고, 자유 형식 텍스트나 이미지 같은 비구조 데이터는 아예 무시한다. 그래서 애매한 건은 수작업 검토로 넘어간다.

여기서 두 번째 모델, 인코더 LLM이 등장한다. 프롬프트로 새 콘텐츠를 만드는 디코더 LLM(챗봇 등)과 달리, BERT·RoBERTa 같은 인코더 LLM은 자연어 '이해'에 특화돼 텍스트 분류·개체명 인식·감성 분석을 잘한다. 송금 설명에 '초과 납부 환불, 급히 부탁합니다' 같은 문구가 있으면 사기 시나리오 특유의 긴급성을 잡아 위험점수를 올리고, 가맹점명·주소에서 스푸핑이나 알려진 사기 연관 단서를 찾아낸다. 전통 모델이 못 보는 부분이다.

두 모델은 상호 보완적이다. 예측형 ML은 구조화된 숫자에 강해 카드 부재(card-not-present) 거래 급증, 소비 폭증, 불가능한 이동 같은 신호를 마이크로초 지연·저비용·간단한 확장·명확한 감사 추적으로 잡는다. 반면 인코더 LLM은 행간을 읽어 거짓양성을 줄이지만, 수백만~수십억 개의 파라미터를 가져 GPU 가속이 필요한 무거운 연산이다. 새 표현을 쓴 사기에 약한 패턴 의존형 ML의 약점을, 맥락을 이해하는 LLM이 메운다.

그래서 앙상블 워크플로는 이렇게 흐른다. 모든 거래는 먼저 예측형 모델을 통과해 점수와 확신도를 받는다. 확신이 높으면(명백한 정상 또는 명백한 사기) 곧장 자동 승인 또는 사기 플래그로 간다. 경계선의 저확신 거래만 BERT 같은 인코더 LLM으로 올라가, 원래의 구조화 특징에 더해 거래 설명 텍스트·고객 프로필 메모 같은 비구조 데이터까지 함께 분석한 뒤 최종 결정엔진이 종합한다. 자연재해 후 청구가 한꺼번에 쏟아지는 보험 사례에서는 LLM이 손상 사진·청구 사유·긴급성을 읽고 예측형 모델이 자동 분류·우선순위화해 심사역의 야근 부담을 던다. 단, 이 모든 걸 밀리초 안에 돌리려면 온칩 AI 가속 같은 전용 하드웨어가 받쳐줘야 한다.

주요 인사이트

앙상블의 핵심은 '모든 걸 LLM에 넣지 않는' 것이다. 비싼 LLM을 경계선 사례에만 호출해 효율과 정확도를 동시에 얻는다.
디코더 LLM(생성)과 인코더 LLM(이해)의 구분이 중요하다. 사기 탐지엔 새 문장을 만드는 능력이 아니라 텍스트를 정확히 이해·분류하는 인코더가 맞다.
구조화 데이터(숫자·열)와 비구조 데이터(텍스트·이미지)는 서로 다른 모델이 잘 다룬다. 둘을 묶어야 사각지대가 줄어든다.
모델 성능만큼 인프라가 중요하다. 밀리초 단위 추론을 데이터가 있는 곳에서 돌리려면 AI 가속 하드웨어가 필수다.
거짓양성을 줄이는 것이 곧 비용 절감이다. LLM이 '왜 수상한지' 맥락을 이해하면 정상 거래가 잘못 차단되는 일이 줄어든다.

자주 묻는 질문

왜 사기 탐지에 AI가 필요한가?

결제·송금은 돈이 움직이기 전 보통 200밀리초 안에 사기 여부를 판단해야 하는데, 사람이 일일이 처리할 수 없어 패턴을 학습해 빠르게 결정하는 AI 모델에 의존한다.

인코더 LLM은 챗봇 같은 생성형 AI와 무엇이 다른가?

디코더 LLM은 프롬프트로 새 콘텐츠를 만드는 생성형이고, 인코더 LLM은 생성하지 않고 자연어 이해에 집중해 텍스트 분류·개체명 인식·감성 분석을 한다. BERT, RoBERTa가 대표적이다.

모든 거래를 LLM으로 검사하지 않는 이유는?

인코더 LLM은 수백만~수십억 파라미터라 GPU 가속이 필요한 무거운 연산이다. 그래서 예측형 모델이 확신하지 못하는 경계선 거래에만 LLM을 호출해 비용과 지연을 아낀다.

예측형 ML이 놓치는 것은 무엇인가?

알려진 지표를 건드리지 않는 새롭고 미묘한 수법과, 자유 형식 텍스트·이미지 같은 비구조 데이터를 잡지 못한다.

원문과 출처

이 글은 원본 영상의 자막을 바탕으로 한국어 독자를 위해 요약했습니다. 전체 맥락과 최신 정보는 원문에서 확인하세요.

YouTube 원본 영상 보기 ↗