大写锁定语音识别离线开源？多平台好用的语音识别工具

前截止到此篇文章发布 GITHUB Releases 已经公开发布至1.0版本
目前更新日志：
支持无限时长语音、支持文件转录字幕

功能更新：

通过分段识别和去重，实现了支持无限时长语音的转写
现在客户端可以转写音视频文件为 srt 字幕了，只需将音视频文件拖动到客户端 exe 上打开即可

Windows 端打包说明：

服务端载入模型所用的 onnxruntime 只能在 Windows 10 及以上版本的系统使用
服务端载入模型需要系统内存 4G，只能在 64 位系统上使用
额外打包了 32 位系统可用的客户端，在 Windows 7 及以上版本的系统可用
模型文件较大，单独打包，解压模型后请放入软件目录的 models 文件夹中

因此：

Win10 64 位以上系统，可以使用服务端、客户端，请下载 CapsWriter-Offline-Windows-64bit.zip 和 models.zip
Win7 及以上的 32 位系统，只能使用客户端，只需要下载 CapsWriter-Offline-Windows-32bit-Client.zip ，可以通过连接到局域网内其它机器上正在运行的服务端使用。

GITHUB项目地址：Releases · HaujetZhao/CapsWriter-Offline (github.com)

大写锁定语音识别离线开源？多平台好用的语音识别工具

如上图所示，打开 start_server 端，等待模型载入完全后再打开 start_client 端，如指示框显示连接成功后按住大写锁定键说话，并且在松开大写锁定之后会自动识别并填入您的输入框，该项目已在GITHUB开源并且完全支持离线识别，可以放心使用。

如果有不会的地方可以看下这个UP的视频：有时候，动嘴比动手更快_哔哩哔哩_bilibili

本文来自投稿，不代表本站立场，如若转载，请注明出处：https://www.4kit.cn/post-49.html

大写锁定语音识别离线开源？多平台好用的语音识别工具

相关推荐

RenpyThief - 游戏一键汉化工具实时汉化

ZyperWin++ 一键优化及还原你的windows系统

DevSidecar：高效解决GitHub访问与下载问题，将HTTPS请求代理到国内的加速通道上，有效提升了GitHub的访问速度和稳定性

浅浅OCR - 离线可用，快至毫秒级！

发表评论

动态快讯

本站由剑客云提供站点服务

链接

# 登录

# 剑客网

# 剑客云

# 绫站

# 低熵体的博客

存档

公示栏

站点访问统计