关闭广告

媒体播放器通用框架 FFmpeg 推出 AI 语音识别功能

IT之家2025-08-14 00:00:013496人阅读

IT之家 8 月 13 日消息,FFmpeg 是一个流行的开源媒体播放器通用框架,现在包含了一个新的 af_whisper 音频工具,可以直接在 FFmpeg 生态系统中实现自动语音识别(ASR)。


该工具使用了 whisper.cpp 库,为媒体处理工作流程添加了一个 AI 模型,允许进行灵活的音频转译文本,包括选择 AI 模型、指定语言以及设置输出格式,如文本、SRT 或 JSON

该工具可以处理预录制的文件和实时音频流,用户还可以使用语音激活检测(VAD)来提高转写的准确性和效率。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

马莱莱笑而不语!阿苏埃三失良机,遭集体炮轰:唯一优点脚头硬

奥拜尔 浏览 319 10-02

NASA局长之争出新番:特朗普重提马斯克盟友

观察者网 浏览 227 11-05

超3100家退出!保险分支机构加速“瘦身”

国际金融报 浏览 200 01-13

熊节:落实务实合作,全球南方亟需搭建多边平台|讲堂176-6⑤

文汇报 浏览 430 08-25

北京现代纯电SUV EO羿欧开启预售 13–15万元

网易汽车 浏览 290 10-17

达达「变身」,京东即时零售有了新阵脚

雷峰网 浏览 10145 07-31

光伏“卖铲人”去年净利腰斩

网易财经 浏览 145 01-09

倪萍太敢说!直怼金鸡奖潜规则

孙镴北漂拍客 浏览 371 09-02

第二款电动车发布时间再推迟 法拉利最新消息曝光

乐选爱车 浏览 955 06-23

传威马汽车已被宝能汽车收购 正在交接生产资质等资产

智车情报局 浏览 442 06-23

今年秋冬最流行的4组搭配,照着穿美出新高度!

LinkFashion 浏览 189 10-29

阿维塔王金海:豪华不止于技术 要让用户每天感到品牌在变好

网易汽车 浏览 160 11-25

加兰:本希望在场上帮助马竞更多,会找一天回去告别

懂球帝 浏览 184 01-07

迪士尼,10亿美元投资OpenAI

中国基金报 浏览 189 12-12

北约对华无理警告:中方严正回应

浏览 10134 07-14

陈天桥抢先押注的脑机接口企业首次公开演示,渐冻症患者用意念操控苹果设备

上观新闻 浏览 5898 08-07

夏天穿衣别太纠结,看看这些日常穿搭就有灵感,显瘦又显身材

静儿时尚达人 浏览 10270 06-26

2727个经销商也卖不动核桃乳,靠“六个核桃”发家的养元饮品上半年营利“双降”

时代周报 浏览 435 08-25

闫学晶品牌终止合作账号被禁 老底全翻出来爆炒

小娱乐悠悠 浏览 188 01-16

分红险转型缓解利差压力 投资驱动二季度利润改善

证券市场周刊 浏览 319 09-11

七七火了!于正抢人!网友:周迅与张柏芝的合体

TVB的四小花 浏览 3411 07-16
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11