关闭广告

媒体播放器通用框架 FFmpeg 推出 AI 语音识别功能

IT之家2025-08-14 00:00:013560人阅读

IT之家 8 月 13 日消息,FFmpeg 是一个流行的开源媒体播放器通用框架,现在包含了一个新的 af_whisper 音频工具,可以直接在 FFmpeg 生态系统中实现自动语音识别(ASR)。


该工具使用了 whisper.cpp 库,为媒体处理工作流程添加了一个 AI 模型,允许进行灵活的音频转译文本,包括选择 AI 模型、指定语言以及设置输出格式,如文本、SRT 或 JSON

该工具可以处理预录制的文件和实时音频流,用户还可以使用语音激活检测(VAD)来提高转写的准确性和效率。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

《财富》世界500强:130家中国公司上榜,华为重回前100

澎湃新闻 浏览 4478 07-30

米体:罗马全力追求卡拉斯科,已向利雅得青年提交首份报价

懂球帝 浏览 261 01-23

文班接受加内特指导 此前曾在少林寺练功夫

罗说NBA 浏览 3300 08-07

黄仁勋减持22.5万股英伟达股票 累计套现近3320万美元

财联社 浏览 1742 06-28

尊界版 QQ 音乐发布:定制皮肤、定制臻品全景声、专属内容专区

IT之家 浏览 6418 08-06

手机回收商闪回科技三闯港交所,四年半亏损超3亿,对赌协议压顶……

国际金融报 浏览 527 08-19

中信证券两保代被自律处罚!案涉北矿检测IPO

深蓝财经 浏览 1438 07-29

谷歌将在2026年关闭Steam for Chromebook测试版,已安装的游戏也不能再运行

超能网 浏览 572 08-11

辛纳0-5落后退赛太意外,阿卡戏剧性夺冠后金大师伟业只差三站

网球之家 浏览 544 08-19

网友称陕西一镇上有狼外逃 当地:系狼犬 已击毙21只

封面新闻 浏览 618 08-26

江苏知名国企总经理卸任,去年人均薪酬约25万元

华美财经 浏览 8338 07-14

小红书高德抖音入局挑战美团,上海成本地生活“必争之地”

上观新闻 浏览 418 09-21

记者:马竞与博塔弗戈直接接触,阿尔马达本人已经同意转会

直播吧 浏览 3126 07-15

一年挣960亿,印钞机都不如它卖力

老斯基财经 浏览 5410 07-12

智元、宇树中标1.2亿元人形机器人订单

澎湃新闻 浏览 7631 07-12

在秦岭失联十余天被找到男子现失温症状 仍未转运出山

新京报 浏览 3928 08-14

冲着陈晓去看《大生意人》,却被满脸狰狞的两位东北跨界演员惊艳

娱乐圈笔娱君 浏览 222 11-27

研究发现:若告知消费者广告是由AI生成的,点击率会减少31%

IT之家 浏览 293 12-21

阿里云计算如何让大语言模型吃得更聪明

科技行者 浏览 271 01-23

具身智能何时实现“ChatGPT时刻”,王兴兴说了个关键前提丨聚焦进博会

红星资本局 浏览 308 11-06

非法收受他人财物数额特别巨大 张效廉被提起公诉

央视新闻客户端 浏览 447 09-10
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11