破解资源 
首页 > 破解资源 > 浏览文章

WhisperDesktop1.8音频转文字软件双向【免费开源】

(编辑:jimmy 日期: 2024/11/14 浏览:3 次 )

可实现本地电脑的音频转文字软件!双向转换,完全免费开源!支持 Windows、macOS、Linux
(目前界面只有英文的,但支持中文的转换)
特征
  • 基于 DirectCompute 的供应商不可知的 GPGPU;该技术的另一个名称是“Direct3D 11 中的计算着色器”
  • 纯 C++ 实现,除了基本的 OS 组件外没有运行时依赖性
  • 比 OpenAI 的实现快得多。
  • 混合 F16 / F32 精度:自 D3D 版本 10.0 起,Windows [color=var(--color-accent-fg)]需要缓冲区 的支持R16_FLOAT
  • 内置性能分析器,可测量单个计算着色器的执行时间
  • 内存使用率低
  • 用于音频处理的媒体基础,支持大多数音频和视频格式(Ogg Vorbis 除外),以及大多数在 Windows 上运行的音频捕获设备(除了一些专业的,它们只实现 ASIO API [color=var(--color-accent-fg)]。
  • 用于音频捕获的语音活动检测。

使用步骤:
下载 WhisperDesktop.zip、ggml-medium 语音模型(官方那里有好多规格如图一,作者推荐1.42G这个模型,下面百度云盘下载链接)
WhisperDesktop1.8音频转文字软件双向【免费开源】

图一


解压WhisperDesktop.zip,打开WhisperDesktop.exe,首先选择要加载的语音模型
WhisperDesktop1.8音频转文字软件双向【免费开源】


加载完成后,就可以进行语音转文了
WhisperDesktop1.8音频转文字软件双向【免费开源】


转换的过程如下图:
WhisperDesktop1.8音频转文字软件双向【免费开源】

WhisperDesktop1.8音频转文字软件双向【免费开源】


结果以文本格式输入。
另外一个功能是允许从麦克风捕获和转录或翻译实时音频
WhisperDesktop1.8音频转文字软件双向【免费开源】

gui-capture.png



ggml-medium 语音模型(官方):
https://huggingface.co/datasets/ggerganov/whisper.cpp/tree/main
作者推荐ggml-medium.bin(大小为 1.42GB)
链接:https://pan.baidu.com/s/1xcemqdg_H5OWMlDx4hzcuQ?pwd=fk2d
提取码:fk2d
蓝奏下载(最小的体验包):https://wwnn.lanzoue.com/iZVcM0wq5lvg 密码:7go1
Whisper :开源项目(官方)
https://github.com/Const-me/Whisper
蓝奏下载 :https://wwnn.lanzoue.com/iDT010wq4q6f 密码:57ko
上一篇:自动鼓 (AutoDrum) v7.0 演奏器软件“自动鼓”, 喜欢作曲的朋友来
下一篇:记忆宫殿APP(记忆训练软件)v1.2.5免费纯净版
一句话新闻
高通与谷歌联手!首款骁龙PC优化Chrome浏览器发布
高通和谷歌日前宣布,推出首次面向搭载骁龙的Windows PC的优化版Chrome浏览器。
在对骁龙X Elite参考设计的初步测试中,全新的Chrome浏览器在Speedometer 2.1基准测试中实现了显著的性能提升。
预计在2024年年中之前,搭载骁龙X Elite计算平台的PC将面世。该浏览器的提前问世,有助于骁龙PC问世就获得满血表现。
谷歌高级副总裁Hiroshi Lockheimer表示,此次与高通的合作将有助于确保Chrome用户在当前ARM兼容的PC上获得最佳的浏览体验。