AI VIDEO BRIEFING

천문학과 AI: 천체물리학자가 인공지능을 활용하는 4가지 방법

분류, 이상 탐지, 데이터 추론, 시뮬레이션 모사까지. 천체물리학자가 거대한 관측 데이터를 다루는 데 AI를 어떻게 쓰는지, 그리고 왜 아직 학문 자체를 바꾸지는 못했는지 정리했다.

천체물리학자들이 AI를 쓰는 네 가지 방법 영상 대표 이미지

핵심 메시지

  • 여기서 말하는 AI는 의식을 가진 인공지능이 아니라, 사람이 시킨 특정 작업을 수행하는 기계학습·딥러닝 단계에 머물러 있다.
  • 천체물리학 데이터는 양이 엄청나고(유클리드 망원경은 6년간 하루 100GB 전송), 여러 파장이 섞여 있으며, 결측·복잡한 잡음·라벨 부재 등으로 일반적인 ‘기성품 AI’를 그대로 쓰기 어렵다.
  • 활용 방식은 크게 데이터 분류, 이상 탐지, 데이터 추론, 시뮬레이션 모사의 네 가지다.
  • 갤럭시 주 같은 시민 과학 프로젝트가 만든 사람의 분류 데이터가 기계학습 학습 자료가 되고, AI가 쉬운 것을 먼저 거른 뒤 어려운 것만 사람에게 넘기는 협업이 이뤄진다.
  • AI는 천체물리학자의 일하는 방식을 바꿨지만, 알파폴드가 생물학을 바꾼 것처럼 학문 자체를 바꾸지는 ‘아직’ 못했다는 것이 발표자의 진단이다.

쉽게 이해하기

인공지능은 어느 분야에서나 피하기 어려운 유행어가 됐고, 천체물리학도 예외가 아니다. AI 도구를 쓰거나 언급하는 논문이 꾸준히 늘고 있다. 다만 발표자는 먼저 AI가 무엇인지부터 정리한다. 지금의 AI는 기계가 스스로 의식을 갖고 다음 행동을 정하는 단계가 아니라, 사람이 정해 준 특정 작업을 수행하는 기계학습·딥러닝 수준이다. 챗봇도 누군가 질문을 먼저 던져야 답한다.

천문학 데이터에는 고유한 어려움이 있다. 우선 규모가 비현실적으로 크다. 유클리드 우주망원경은 하늘의 3분의 2를 훑으며 6년간 하루 100GB의 데이터를 보내고, 베라 루빈 천문대는 10년간 200억 개의 천체를 검출하며 매일 밤 약 1000만 건의 변화를 포착할 것으로 추정된다. 게다가 데이터는 가시광·자외선·엑스선·적외선 등 여러 파장에 걸쳐 있고, 일부가 비어 있거나 대기를 지나며 생긴 복잡한 잡음이 섞이기도 한다. 또 관측한 빛의 양을 별의 질량 같은 물리량으로 바꾸려면 물리 모델이 필요하다.

첫 번째 활용은 데이터 분류다. 한 명의 연구자가 수백만~수십억 개의 천체를 일일이 살피는 것은 불가능하다. 그래서 갤럭시 주처럼 대중이 은하의 모양을 분류하는 시민 과학이 큰 역할을 해 왔고, 이렇게 사람이 분류·라벨링한 자료가 기계학습 알고리즘의 학습 데이터가 된다. 갤럭시 주에는 ‘주봇(Zoobot)’이라는 AI가 먼저 쉬운 이미지를 분류하고, 확신이 낮은 것만 사람에게 넘겨 그 결과로 다시 학습하는 사람-기계 협업 구조가 들어 있다.

두 번째는 이상 탐지다. 비정상적으로 밝거나 어둡거나 색이 이상한, 미리 알지 못했던 희귀 천체를 찾는 일이다. 이때는 사전 지식으로 편향을 주지 않기 위해 라벨 없이 데이터를 군집화하는 비지도 학습을 자주 쓴다. 루빈 천문대가 매일 밤 쏟아 낼 1000만 건의 알림 속에서, 밤새 실시간으로 이상 신호를 걸러 아침에 천문학자에게 보고하는 도구도 개발되고 있다.

세 번째는 데이터 추론이다. 대표적 사례가 사건지평선망원경(EHT)이 찍은 은하 M87 중심 블랙홀의 첫 이미지다. 지구 곳곳의 망원경을 합쳐 지구만 한 망원경을 만들지만, 디스코볼처럼 군데군데 거울이 빠진 상태여서 비어 있는 데이터를 기계학습으로 추론해 그림을 완성했다. 네 번째는 시뮬레이션 모사다. 오래 걸리는 시뮬레이션을 매번 다시 돌리지 않고, 입력값에 따른 결과의 패턴을 학습한 AI가 결과를 예측해 준다. 은하 충돌이나 우주 전체 시뮬레이션처럼 계산이 무거운 연구에서 특히 유용하다.

주요 인사이트

  • 천문학의 거대 데이터는 라벨이 없는 경우가 많아, 기성 ‘블랙박스 AI’를 그대로 쓰기보다 직접 맞춤형으로 만들고 신중히 적용해야 한다.
  • 시민 과학(갤럭시 주)이 모은 사람의 분류 결과가 AI 학습의 토대가 되고, AI가 다시 사람의 수고를 덜어 주는 선순환이 작동한다.
  • 이상 탐지에 비지도 학습을 쓰는 이유는, 우리가 미처 찾을 줄도 몰랐던 희귀하고 새로운 천체를 편향 없이 발견하기 위해서다.
  • EHT의 블랙홀 이미지는 비어 있는 관측 데이터를 AI로 메워 완성했으며, 여러 종류의 데이터로 학습해도 결과가 크게 달라지지 않음을 확인했다.
  • 발표자는 천문학에서 AI가 아직은 사람이나 전통 알고리즘도 할 수 있던 일을 더 빠르고 효율적으로 해 줄 뿐, 알파폴드가 생물학을 바꾼 것처럼 학문의 새 길을 연 단계는 아니라고 본다.

자주 묻는 질문

천체물리학 데이터에 일반적인 AI 도구를 그대로 쓰기 어려운 이유는 무엇인가요?

데이터 양이 지나치게 크고, 여러 파장이 섞인 다차원 자료인 데다 일부가 비어 있거나 복잡한 잡음이 끼어 있고, 무엇보다 ‘이것은 무엇이다’라는 라벨이 붙어 있지 않은 경우가 많기 때문입니다. 또 관측값을 물리량으로 바꾸려면 별도의 물리 모델도 필요합니다. 그래서 기성품을 그대로 쓰기보다 맞춤형으로 만들어 신중하게 적용합니다.

천체물리학자가 AI를 쓰는 네 가지 방법은 무엇인가요?

첫째는 방대한 천체를 자동으로 나누는 데이터 분류, 둘째는 미리 알지 못한 희귀 천체를 찾는 이상 탐지, 셋째는 비어 있는 관측을 메우는 데이터 추론(예: 사건지평선망원경의 블랙홀 이미지), 넷째는 오래 걸리는 계산을 다시 돌리지 않고 결과를 예측하는 시뮬레이션 모사입니다.

AI가 천체물리학을 근본적으로 바꿨나요?

발표자는 아직 아니라고 봅니다. AI는 천체물리학자가 일하는 방식을 바꿨지만, 알파폴드가 단백질 구조 예측으로 생물학에 새로운 연구 분야를 연 것과 달리, 천문학에서는 사람이나 전통 알고리즘도 할 수 있던 일을 더 빠르게 처리하는 수준에 머물러 있습니다. 다만 발전 속도를 보면 앞으로 10년은 ‘아직’이라는 단서를 붙일 만하다고 말합니다.

원문과 출처

이 글은 원본 영상의 자막을 바탕으로 한국어 독자를 위해 요약했습니다. 전체 맥락과 최신 정보는 원문에서 확인하세요.

YouTube 원본 영상 보기 ↗

관련 AI 소식

#천문학#천체물리학#인공지능#기계학습#블랙홀