欧洲杯体育但在准确性上仍有一定差距-开云(中国)Kaiyun·官方网站 登录入口
IT之家 7 月 4 日音尘欧洲杯体育,科技媒体 9to5Mac 昨日(7 月 3 日)发布博文,对比测试了苹果系统的全新转录 API,合计该 API 在速率上优于 OpenAI 的 Whisper 模子,但在准确性上仍有一定差距。
IT之家注:该媒体使用一段 9to5Mac Daily 的播客音频测试,长度为 7 分 31 秒,对比了苹果的新转录 API、OpenAI 的 Whisper Large v3 Turbo(通过 MacWhisper 哄骗)和英伟达的 Parakeet v2 模子。
测试平台为 M2 Pro 芯片的 MacBook Pro 札记本,配备了 16GB 内存,使用 Metric: cer 和 Metric: wer 两款 Hugging Face Spaces 来分析本色的字符特地率(CER)和单词特地率(WER)。
效果显现,Parakeet v2 的转录本事最短,仅为 2 秒,但 CER 和 WER 较高;Whisper Large V3 Turbo 的准确性最高,但转录本事长达 40 秒;苹果的模子在速率上接近 Parakeet,但准确性优于后者。
模子转录本事字符特地率单词特地率Parakeet v22 seconds5.8.3%Whisper Large V3 Turbo40 seconds0.2%1.5%Apple9 seconds1.9.3%该媒体还使用了 ChatGPT、Claude 和 Gemini 为基线来筹谋 CER 和 WER。效果显现,每个模子的性能齐有所不同,但 Whisper 在准确性上仍跳跃。
ChatGPT (o4-mini-high)
模子转录本事字符特地率单词特地率Parakeet v22 seconds6.0.3%Whisper Large V3 Turbo40 seconds0.4%1.4%Apple9 seconds2.1.2%Claude (Sonnet 4)
模子转录本事字符特地率单词特地率Parakeet v22 seconds8.4.0%Whisper Large V3 Turbo40 seconds0.1%1.0%Apple9 seconds3.5%8.2%Gemini (2.5 Pro)欧洲杯体育
模子转录本事字符特地率单词特地率Parakeet v22 seconds7.6.3%Whisper Large V3 Turbo40 seconds0.3%0.4%Apple9 seconds3.4%5.3%