스피킹 연습하려고 직접 만든 전사기(transcriber): Speaking Practice Aid

문제: chatGPT가 잡아주지 못하는 것
요즘 영어 스피킹 연습을 chatGPT랑 같이 한다. 녹음 기능 켜고 말하면 텍스트로 바꿔주고, 거기에 피드백도 해준다. 꽤 괜찮다.
근데 쓰다 보니 답답한 지점이 생겼다.
스피킹을 잘하려면 지금 뭐가 문제인지 알아야 한다. 내 문제는 명확했다. 말할 때 "um...", "you know..." 같은 필러가 너무 많고, 아무 말도 못 하는 공백 구간이 길다. 이게 고쳐져야 했다.
그런데 chatGPT는 이걸 잡아주지 못했다. 내가 3초 동안 멈춰도, 전사 결과에는 그냥 매끄러운 문장만 남는다. 없던 일이 되어버린다.
다른 전사기도 마찬가지였다. Otter, 클로바노트 다 써봤는데, 필러는 그나마 좀 남기더라도 공백은 전부 생략해버렸다. 무료로 되는 건 없었다.
측정이 안 되면 개선도 못 한다.
해결: 직접 만들어버렸다
그래서 생각했다. 말하기 사이 공백을 측정해주는 전사기를 직접 만들면 되지 않나?
chatGPT한테 먼저 물어봤다. 로컬에서만 돌아가는 간단한 버전, 공백 시간을 잡아내는 transcriber를 만들 수 있는지. 개인 연습용이니까 굳이 배포할 필요는 없었다.
가능하다고 했다.
바로 Antigravity로 만들어봤다. 하루 만에 프로토타입이 나왔고, 며칠 동안 직접 쓰면서 다듬었다. 아주 정확하진 않지만, 얼추 잘 작동한다. 이 정도면 연습용으로 충분하다.
혹시 나와 같은 문제를 가진 사람이 있을까 싶어서 공개 레포지토리에 올려뒀다.
GitHub: https://github.com/evanshlee/speaking-practice
