1️⃣ 공개 데이터셋 벤치마크

데이터셋 마고 OpenAI Whisper Google Naver Clova 리턴제로
Avg. CER(%) 3.99 11.39 11.5 9.52 7.79
주요 영역별 회의 4.45 10.49 N/A1 7.88 6.43
회의 4.37 10.16 11.62 8.53 8.85
상담 2.78 7.51 8.37 5.89 5.44
한국어 강의 3.74 10.89 11.48 13.71 8.68
KsponSpeech 4.6 12.06 11.82 10.66 9.74
*자료출처: [<https://github.com/rtzr/Awesome-Korean-Speech-Recognition?tab=readme-ov-file#user-content-fn-2-9ea5a653c97ceb4d58d5c53b8f848eb8>](<https://github.com/rtzr/Awesome-Korean-Speech-Recognition?tab=readme-ov-file>)   

2️⃣ 공개 데이터셋 벤치마크 (방언)

데이터셋 마고 리턴제로
충청도 3.85 -
경상도 3.30 -
강원도 4.17 -
전라도 7.31 -
노인 2.13 -
소아 1.25 -
콩글리시 0.19 -

3️⃣ 마고 vs. Whisper 속도차이

<aside> 💡

비교지표. xRT, 낮을수록 빠른 처리 속도를 의미함, input 파일의 길이가 길어질수록, 처리 속도가 크게 차이남.

</aside>

10초

MAGO Whisper (large) Whisper (turbo)
CPU 1.5 8.8 5.54
GPU 0.25 1.13 0.36

300초

MAGO Whisper (large) Whisper (turbo)
CPU 32.13 498.32 85.87
GPU 1.45 69.32 10.71