Forced Alignment Demo (v1.0.0)

This project demonstrates forced alignment between audio and text using PyTorch and Wav2Vec2. It generates synthetic speech from text and aligns it with the transcript, visualizing the alignment process.

Features

Text-to-speech generation using gTTS
Forced alignment using Wav2Vec2
Multiple visualizations:
- Frame-wise class probability
- Alignment path in trellis matrix
- Word segments with spectrogram

Installation

Clone this repository
Install the required dependencies:

Version History

v1.0.0: Initial release
- Basic forced alignment implementation
- Text-to-speech generation
- Visualization of alignment path
- Support for 3-word demo phrase

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
README.md		README.md
forced_alignment_demo.py		forced_alignment_demo.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Forced Alignment Demo (v1.0.0)

Features

Installation

Version History

About

Releases

Packages

Languages

cozec/forced_alignment

Folders and files

Latest commit

History

Repository files navigation

Forced Alignment Demo (v1.0.0)

Features

Installation

Version History

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages