Skip to content

Latest commit

 

History

History
51 lines (43 loc) · 2.41 KB

README.md

File metadata and controls

51 lines (43 loc) · 2.41 KB

Rapid ASR

  • 🎉 推出知识星球RapidAI私享群,这里的提问会优先得到回答和支持,也会享受到RapidAI组织后续持续优质的服务。欢迎大家的加入。
  • Paraformer模型出自阿里达摩院Paraformer语音识别-中文-通用-16k-离线-large-pytorch
  • 本仓库仅对模型做了转换,只采用ONNXRuntime推理引擎。该项目核心代码已经并入FunASR
  • 项目仍会持续更新,欢迎关注。

📖文档导航

📆TODO以及任务认领

  • 参见这里:link

🎨整体框架

flowchart LR

A([wav]) --RapidVad--> B([各个小段的音频]) --RapidASR--> C([识别的文本内容]) --RapidPunc--> D([最终识别内容])
Loading

📣更新日志

详情
  • 2023-02-25
    • 添加C++版本推理,使用onnxruntime引擎,预/后处理代码来自: FastASR
  • 2023-02-14 v2.0.3 update:
    • 修复librosa读取wav文件错误
    • 修复fbank与torch下fbank提取结果不一致bug
  • 2023-02-11 v2.0.2 update:
    • 模型和推理代码解耦(rapid_paraformerresources
    • 支持批量推理(通过resources/config.yamlbatch_size指定)
    • 增加多种输入方式(Union[str, np.ndarray, List[str]]
  • 2023-02-10 v2.0.1 update:
    • 添加对输入音频为噪音或者静音的文件推理结果捕捉。