当前位置：首页 > 人工智能 > 正文内容

Insanely Fast Whisper - 一个强大快速的音频转文字工具

二向箔2024-04-09 10:28:21人工智能522

项目功能：音频转文字

项目介绍：一个基于 OpenAI Whisper Large v3（https://huggingface.co/openai/whisper-large-v3）模型的高速音频转文字工具，能够在不到 98 秒的时间内转录 300 分钟（5小时）音频。

适用于多场景，支持 100 种语言的转录并支持翻译功能，提供按词或片段生成时间戳文本，方便字幕制作。

提供命令列界面（CLI），也可以通过 Whisper API 进行线上语音转文字。

线上体验：https://replicate.com/vaibhavs10/incredibly-fast-whisper

GitHub源码：https://github.com/Vaibhavs10/insanely-fast-whisper

扫描二维码推送至手机访问。

本文链接：https://www.erxbo.com/post/1739.html

分享给朋友：

返回列表

上一篇： DDColor - 一个开源的黑白图像上色模型

下一篇：DomoAI 视频人物替换

“Insanely Fast Whisper - 一个强大快速的音频转文字工具 ” 的相关文章

Stability AI 发布开源视频生成模型「Stable Video Diffusion」

用图片生成视频效果很惊艳SVD 支持文本和图像生成视频，还支持物体从单一视角到多视角的转化；目前最高支持生成 14/25 帧、576 x 1024 分辨率的视频尽管 SVD 还处于基础阶段，但是相信未来一定会成为像 SDXL 一样的顶级开源 AI 模型GitHub地址：https://github....

基于GPT-4 和 DALL-E 3，轻松将网页截图转化成代码

截图转代码该项目基于 GPT-4 Vision 和 DALL-E 3，它可以将网页截图转换为 HTML/Tailwind/JS 代码重点：使用需要自备拥有 GPT-4 Vision 权限的 OpenAI APIGitHub开源地址：https://github.com/abi/scree...

Runway 发布视频生成模型 Gen-2 的运动笔刷功能（图片生成视频）

真的是相当牛逼Runway 发布视频生成模型 Gen-2 的运动笔刷功能"Motion Brush/运动笔刷"的发布代表了模型可控性的一个重要里程碑，用户只需绘制一个区域或主题，选择一个方向并为运动添加强度即可。运动笔刷允许您为您的生成添加受控运动，从而更好地控制生成的内容。还可...

Pika Labs 推出视频生成模型 Pika 1.0

以图片生成视频，未来的重量级选手Pika Labs 推出视频生成模型 Pika 1.0Pika 1.0 整体是个重大产品升级，包括一个新的 AI 模型，能够生成和编辑 3D 动画、动漫、卡通和电影等各种风格的视频。允许用户上传自己的视频来局部编辑与重构场景，比如为画面中的人物更换衣物，为视频中的猩猩...

GPT 学术优化 - 一个专注优化论文的 AI 工具

该工具可以为你的论文提供一键润色、一键中英互译、一键代码解释、生成分析报告、PDF翻译等强大功能；内置 ChatGTP 多版本模型以及 Claude2，功能很强大，还可接入国内众多大模型如图中展示的就是让工具分析一个完整的 Python 项目GitHub地址：https://github.com/...

Stability AI 推出了新一代实时生成图像模型「Stable Diffusion XL Turbo」

SDXL Turbo 是 SDXL 1.0 的改进版本现在你只需要在文本框中输入你的想法，SDXL Turbo 就能够迅速响应生成图像，快如闪电但是生成人脸还是有点差强人意，而且中文prompt不太行，虽然生成的很快，但是不能真正理解中文的意思，需要使用英文prompt，生成的会准确一些体验地址1：...

Insanely Fast Whisper - 一个强大快速的音频转文字工具

“Insanely Fast Whisper - 一个强大快速的音频转文字工具 ” 的相关文章