AI VIDEO BRIEFING

ML 연구를 프로덕션으로: 연구-개발 핸드오프를 빠르게 만드는 3단계

주택 설계 스타트업 Higharc의 연구 엔지니어가 최신 ML 연구를 실제 제품으로 옮길 때 쓰는 세 가지 방법(연구 문서화, 코드 구조, 분해와 리뷰)을 설명한다.

프런티어 ML 연구를 제품으로 옮기는 3가지 지렛대: Higharc의 현장 노하우 영상 대표 이미지

핵심 메시지

  • ML 연구자와 소프트웨어 엔지니어 사이의 '바통 넘기기'를 시스템·프로세스 문제로 보고 속도를 높인다.
  • 연구 프로토타입을 위한 전용 기술 설계 문서(RPT)로 연구 결과를 누구나 이해할 수 있게 만든다.
  • 연구자 한 명당 마이크로서비스 하나를 두는 모노레포로 코드 베이스를 미리 준비해 둔다.
  • 거대한 프로토타입을 의존성에 따라 잘게 쪼개 비동기 PR 리뷰로 프로덕션에 올린다.

쉽게 이해하기

발표자는 주택 설계·건축 스타트업 Higharc의 랩스(R&D) 팀에서 일하는 시니어 연구 엔지니어다. 이 팀은 손으로 그린 평면도를 읽는 컴퓨터 비전, 사용자를 이끄는 추론 에이전트, 자체 트랜스포머, 이미지 생성용 디퓨전 모델 등 AI/ML 전 영역을 제품에 활용한다. 문제는 이런 최신 연구를 안정적인 프로덕션 코드로 옮기는 일이다.

그 과정에서 연구자와 엔지니어는 서로 다른 강점을 가진다. 백엔드·플랫폼 엔지니어는 견고한 프로덕션 코드에 능숙하지만 컴퓨터 비전이나 LLM 학습 방법론에는 익숙하지 않고, ML 연구자는 최신 논문을 자유롭게 다루지만 프로덕션급 API를 책임져 본 경험이 적다. 발표의 핵심은 이 둘 사이의 핸드오프를 어떻게 생산적으로 만드느냐다.

첫 번째 지렛대는 '연구 가독성'이다. Higharc는 모든 연구 프로토타입에 대해 RPT(연구 프로토타입 분류 문서)를 요구한다. 소프트웨어의 기술 설계 문서(TDD)를 ML에 맞게 변형한 것으로, 도메인 맥락과 데이터 표현 방식, 비즈니스 목표, 타입 계약, 영속성 계층, 시스템 아키텍처, 그리고 어떻게 병합·분해할지를 담는다.

두 번째 지렛대는 코드 구조다. 핵심 제품 저장소와 분리된 파이썬 모노레포에 깔끔하게 분리된 마이크로서비스를 담고, 연구자 한 명이 하나의 서비스를 맡는다. 게이트웨이가 요청을 라우팅하고 각 서비스는 API·비즈니스 로직·데이터의 계층형 구조와 FastAPI로 구성된다. CI에서 모델 가중치를 가져오고, GPU 연산은 Modal 위의 주피터 노트북에서 돌린다.

세 번째 지렛대는 분해와 PR 리뷰 계획이다. 거대한 단일 프로토타입을 의존성 그래프에 따라 어떤 축으로 자를지 설계한 뒤, Graphite의 스택 디프로 잘게 나눠 비동기로 리뷰한다. 잘게 쪼갠 PR마다 해당 분야 전문가를 붙여 프로덕션 준비 상태를 확인한다.

주요 인사이트

  • 연구를 코드로 옮기기 전에 '문서로 정렬'하는 단계를 강제하면, 새로 합류한 엔지니어가 어디에 집중해야 할지 명확해진다.
  • 연구자 1명 = 마이크로서비스 1개라는 단순한 비율이 서비스 간 결합을 끊고 독립적인 반복 개발을 가능하게 한다.
  • 에이전트가 저장소를 탐색할 수 있도록 명세를 깔끔하게 문서화하면 ML 연구자의 작업 속도가 빨라진다.
  • 팀이 연구를 프로덕션으로 옮기는 일정과 담당 전문가를 일관되게 예측하지 못한다면, 핸드오프 과정이나 코드 베이스에 손볼 곳이 있다는 신호다.

자주 묻는 질문

RPT(연구 프로토타입 분류 문서)에는 무엇이 들어가나?

도메인 맥락과 데이터 표현 방식, 비즈니스 목표, 핵심 제품 저장소와 ML 저장소 간 타입 계약, 영속성 계층, 전체 시스템 아키텍처, 그리고 병합·분해 방법이 담긴다.

마이크로서비스는 어떻게 구성되나?

API 계층, 비즈니스 로직, 데이터 계층으로 이뤄진 단순한 계층형 구조이며 FastAPI 애플리케이션으로 노출된다. 클라이언트는 게이트웨이를 거쳐 적절한 서비스로 라우팅되고, 각 서비스는 Dockerfile과 의존성, poetry/uv 락 파일을 갖춘 독립 애플리케이션이다.

왜 Graphite를 쓰나?

스택 디프로 거대한 프로토타입을 잘게 분해하고 비동기 리뷰가 가능하기 때문이다. 한 PR을 작업하는 동안 다른 전문가가 별도의 PR을 검토할 수 있다.

원문과 출처

이 글은 원본 영상의 자막을 바탕으로 한국어 독자를 위해 요약했습니다. 전체 맥락과 최신 정보는 원문에서 확인하세요.

YouTube 원본 영상 보기 ↗

관련 AI 소식