关闭广告

媒体播放器通用框架 FFmpeg 推出 AI 语音识别功能

IT之家2025-08-14 00:00:013564人阅读

IT之家 8 月 13 日消息,FFmpeg 是一个流行的开源媒体播放器通用框架,现在包含了一个新的 af_whisper 音频工具,可以直接在 FFmpeg 生态系统中实现自动语音识别(ASR)。


该工具使用了 whisper.cpp 库,为媒体处理工作流程添加了一个 AI 模型,允许进行灵活的音频转译文本,包括选择 AI 模型、指定语言以及设置输出格式,如文本、SRT 或 JSON

该工具可以处理预录制的文件和实时音频流,用户还可以使用语音激活检测(VAD)来提高转写的准确性和效率。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

中国家庭,还缺一辆旅行车

虎嗅APP 浏览 555 08-23

捡来的便宜!翻垃圾找到6TB SSD:六块1TB的三星850 Pro

快科技 浏览 480 08-25

牛弹琴:特朗普实在看不下去了 强硬表态要"夺回首都"

映象网 浏览 665 08-11

美军最担的事发生 只要中国需要随时能拿一批"运轰20"

空天力量 浏览 35519 09-19

印度航空两天两起事故:一架飞机起火一架滑出跑道

红星新闻 浏览 9728 07-24

针对细节进行升级 2025款五菱星光S亮相

车质网 浏览 4417 07-29

胡歌、黄晓明、关晓彤齐聚,央视2026片单炸了

手工制作阿歼 浏览 327 01-12

村民要求村委会公开多年收支 被通知要交"23万复印费"

大风新闻 浏览 8364 07-26

瞬间暴跌40%,东方甄选到底怎么了?

财经锐眼 浏览 532 08-21

史上最强财报背后,苹果仍差临门一脚

虎嗅APP 浏览 322 11-01

媒体人:河南成立新篮球俱乐部,CBA未来可能扩军或升降级

懂球帝 浏览 416 09-10

仅靠2名销售,这家AI公司拿下腾讯索尼

态℃ 浏览 10715 08-22

阿萨德垮台,谁将掌权叙利亚?

浏览 8283 07-14

林诗栋3-1击败德国选手晋级WTT瑞典站八强,下轮将再度交手邱党

直播吧 浏览 488 08-22

社保基金最新重仓股揭晓!新进比亚迪、隆基绿能等226只个股!

私募排排网 浏览 312 11-06

德国队2026年世界杯主场球衣曝光,致敬90年和14年夺冠球衣

懂球帝 浏览 6645 07-29

日方:山东舰舰载机"异常接近"日本军机

环球网资讯 浏览 5437 06-13

想和谈?泽连斯基突然松口,打的什么算盘?

浏览 6127 07-14

观众对白百何的评价,明白了当年宋丹丹那番话

娱乐圈笔娱君 浏览 212 11-12

光峰科技“认领”闪极AI显示眼镜S1:采用蜻蜓G1 mini光机

IT之家 浏览 266 01-05

女子患小脑萎缩症加重 前男友复合帮她完成100个心愿

极目新闻 浏览 254 11-25
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11