Speaking Practice Aid 프로젝트 화면
Speaking Practice Aid 프로젝트 화면

문제: chatGPT가 잡아주지 못하는 것

요즘 영어 스피킹 연습을 chatGPT랑 같이 한다. 녹음 기능 켜고 말하면 텍스트로 바꿔주고, 거기에 피드백도 해준다. 꽤 괜찮다.

근데 쓰다 보니 답답한 지점이 생겼다.

스피킹을 잘하려면 지금 뭐가 문제인지 알아야 한다. 내 문제는 명확했다. 말할 때 "um...", "you know..." 같은 필러가 너무 많고, 아무 말도 못 하는 공백 구간이 길다. 이게 고쳐져야 했다.

그런데 chatGPT는 이걸 잡아주지 못했다. 내가 3초 동안 멈춰도, 전사 결과에는 그냥 매끄러운 문장만 남는다. 없던 일이 되어버린다.

다른 전사기도 마찬가지였다. Otter, 클로바노트 다 써봤는데, 필러는 그나마 좀 남기더라도 공백은 전부 생략해버렸다. 무료로 되는 건 없었다.

측정이 안 되면 개선도 못 한다.

해결: 직접 만들어버렸다

그래서 생각했다. 말하기 사이 공백을 측정해주는 전사기를 직접 만들면 되지 않나?

chatGPT한테 먼저 물어봤다. 로컬에서만 돌아가는 간단한 버전, 공백 시간을 잡아내는 transcriber를 만들 수 있는지. 개인 연습용이니까 굳이 배포할 필요는 없었다.

가능하다고 했다.

바로 Antigravity로 만들어봤다. 하루 만에 프로토타입이 나왔고, 며칠 동안 직접 쓰면서 다듬었다. 아주 정확하진 않지만, 얼추 잘 작동한다. 이 정도면 연습용으로 충분하다.

혹시 나와 같은 문제를 가진 사람이 있을까 싶어서 공개 레포지토리에 올려뒀다.

GitHub: https://github.com/evanshlee/speaking-practice

이 녀석이 설명을 더 잘하잖아?
이 녀석이 설명을 더 잘하잖아?