AI VIDEO BRIEFING
AI 생산성 앱 7가지 - 음성 받아쓰기·퍼플렉시티 검색·노트북LM·자동화 활용법
음성 받아쓰기(Whisper), 퍼플렉시티 음성 검색, 유튜브·팟캐스트 요약, 맞춤 GPT 언어 학습, 예약 작업 자동화, 그리고 코드 없이 앱을 만드는 바이브 코딩까지 실제 생산성 워크플로를 정리했습니다.

핵심 메시지
쉽게 이해하기
발표자는 자신의 LLM 기반 생산성 워크플로를 소개하며, 어떤 회사의 후원도 받지 않았다고 밝힌다. 핵심은 음성 받아쓰기, 빠른 검색, 영상·팟캐스트 요약, 일본어 학습, 그리고 지역 행사 주간 요약 같은 자동화다.
음성 입력에는 세 가지 앱을 쓴다. Whisper Flow는 순수 받아쓰기 도구로, 단축키를 누르고 말하면 현재 사용 중인 앱을 인식해 형식까지 맞춰 준다(예: Gmail에서 이메일 형식). Super Whisper는 사용자가 정의한 프롬프트로 음성을 가공해, 더듬거리며 말해도 읽기 좋게 정리해 주며 인터넷 없이 동작하는 로컬 모델도 제공한다.
검색에는 Perplexity를 쓴다. 단축키 한 번으로 음성 질문이 가능하고, 발표자가 찾은 음성 모델 중 가장 정확하고 빠르다고 평한다. 또 유튜브·레딧 같은 소셜, 학술 논문, 일반 웹을 나눠 검색할 수 있어 ChatGPT보다 더 나은 결과를 얻었다고 말한다.
영상 요약에는 두 가지를 쓴다. 'YouTube Summary AI' 확장 프로그램은 Gemini로 15~20분짜리 영상의 핵심을 빠르게 정리해 준다. 팟캐스트나 강의처럼 아주 긴 자료는 역시 Gemini 기반인 NotebookLM에 여러 자료를 넣어 종합하고 질문하거나, PDF·전자책을 넣어 20분짜리 팟캐스트로 만들 수도 있다.
이 밖에 ChatGPT의 맞춤 GPT로 '센세이'라는 일본어 선생님을 만들어 맥락 속에서 단어를 설명받고, 베타 기능인 예약 작업으로 지역 행사·콘서트 정보를 매주 이메일로 받는 자기만의 뉴스레터를 만든다. 마지막으로 안드레이 카파시가 만든 용어인 '바이브 코딩'을 소개하며, v0.dev로 코드를 한 줄도 쓰지 않고 유튜브 채널 분석 도구나 터미널 스타일 테트리스를 만들어 보인다.
주요 인사이트
- 이메일·메시지 답장이나 LLM과의 긴 대화처럼 길게 입력해야 할 때 음성을 쓰면, 타자보다 훨씬 깊고 길게 질문할 수 있다.
- Super Whisper의 로컬 모델은 오프라인으로 동작하고 서버로 아무것도 보내지 않아, 회의록·작업 절차서 작성 시 프라이버시 면에서 유리하다.
- 맞춤 GPT는 한 가지 일만 하도록 프롬프트를 고정해 두면, 매번 설명을 붙이지 않아도 사용자에 맞춰 답해 언어 학습·프로그래밍·세금 처리 등에 응용할 수 있다.
- 예약 작업은 부동산 매물, 추천 도서·다큐멘터리처럼 계속 갱신되는 정보에 특히 잘 맞아 맞춤 뉴스레터처럼 쓸 수 있다.
- 바이브 코딩에서는 버그가 생겨도 무엇이 문제인지 말로 설명하면 도구가 스스로 고치므로, 코드를 보지 않고도 앱을 다듬어 갈 수 있다.
자주 묻는 질문
AI 음성 받아쓰기가 왜 그렇게 정확한가요?
OpenAI가 공개한 Whisper 모델에 기반하기 때문입니다. 약 100만 시간 분량의 데이터로 학습되어 매우 정확하고 빠르다고 영상은 설명합니다.
긴 팟캐스트나 강의는 어떻게 요약하나요?
Gemini 기반의 NotebookLM에 여러 영상·PDF·전자책을 넣어 정보를 종합하고 질문하거나 깊이 있는 요약, 심지어 20분짜리 팟캐스트까지 만들 수 있습니다. 15~20분짜리 영상은 'YouTube Summary AI' 확장 프로그램으로 빠르게 요약합니다.
바이브 코딩이란 무엇인가요?
안드레이 카파시가 만든 용어로, 코드를 직접 쓰거나 들여다보지 않고 원하는 것을 설명만 해서 앱을 만드는 방식입니다. 발표자는 v0.dev로 코드 한 줄 없이 유튜브 채널 분석 도구와 터미널 테트리스를 만들었습니다.
원문과 출처
이 글은 원본 영상의 자막을 바탕으로 한국어 독자를 위해 요약했습니다. 전체 맥락과 최신 정보는 원문에서 확인하세요.
YouTube 원본 영상 보기 ↗