File tree Expand file tree Collapse file tree 1 file changed +4
-3
lines changed Expand file tree Collapse file tree 1 file changed +4
-3
lines changed Original file line number Diff line number Diff line change @@ -67,10 +67,11 @@ API로 음성인식을 바로 사용해 볼 수 있는 개발자 사이트입니
6767| -------------------- | ----------- | ---------------- | -------- | -------- | ----------------- | --------------- | ---------------------- | ---------------------- |
6868| OpenAI Whisper | 11.39 | 10.49 | 10.16 | 7.51 | 17.27 | 10.89 | 12.06 | 11.34 |
6969| Google <br > api v2 | 11.50 | N/A[ ^ 1 ] | 11.62 | 8.37 | 14.11 | 11.48 | 11.82 | 11.59 |
70+ | Gemini 2.0 flash | 16.58 | 32.34 | 11.98 | 8.81 | 16.09 | 10.65 | 18.41 | 14.48 |
7071| ETRI | 10.19 | 9.95 | 10.56 | 8.36 | 15.46 | 9.89 | 9.99 | 7.15 |
71- | Naver ClovaSpeech | 9 .52 | 7.88 | 8.53 | 5.89 | 9.09 | 13.71 | 10.66 | 10.86 |
72- | 리턴제로 | ** 6.18 ** | ** 6.78 ** | ** 7.27 ** | ** 3.56 ** | 4.66 | 7.76 | ** 6.61 ** | ** 6.64 ** |
73- | 리턴제로 Whisper[ ^ 2 ] | 6.59 | 6.84 | 8.33 | 4.1 | ** 4.26** | ** 7.11** | 7.78 | 7.73 |
72+ | Naver ClovaSpeech | 7 .52 | 8.38 | 7.63 | 4.91 | 6.49 | ** 7.08 ** | 8.05 | 7.96 |
73+ | 리턴제로 | ** 5.91 ** | ** 5.98 ** | ** 6.74 ** | ** 3.51 ** | 4.40 | 7.35 | ** 6.64 ** | ** 6.77 ** |
74+ | 리턴제로 Whisper[ ^ 2 ] | 6.59 | 6.84 | 8.33 | 4.1 | ** 4.26** | 7.11 | 7.78 | 7.73 |
7475
7576[ ^ 1 ] : Google의 음성인식 파일 크기의 제한으로 생략 ` Request audio can be a maximum of 10485760 bytes, Audio can be of a a maximum of 60 seconds. `
7677[ ^ 2 ] : OpenAI에서 공개한 Whisper 오픈소스 모델에 리턴제로의 데이터를 파인튜닝(fine-tuning)한 모델입니다.
You can’t perform that action at this time.
0 commit comments