Spaces for Audio / Voices

John6666 's Collections

Papers

Spaces for Games / Entertainments

Spaces for Tagger / Captioner / Prompter

Spaces for Text-to-images (SDXL, Pony, SD1.5, Flux,...)

Spaces for Audio / Voices

Spaces for Generative-AI Chats

Resources for Tagging / Captioning / Prompting / LLM

My Bookmarks

Spaces for Image Upscaler / Upsampler / Resizer

LoRAs / Models (SDXL1.0, Pony, SD1.5, Flux, ...)

Spaces for Model / Space / useful Utilities in Hugging Face

Resources for Sound Processing

Spaces for LLM / VLM / NLP

Spaces for Image-to-Image / Video

日本語スペース (Spaces in Japanese language)

Gradio Themes

updated about 1 hour ago

Upvote

Running on Zero

360

🚀

AICoverGen
Running on Zero

11

👅🎙️🥰

SBV2 Chupa Demo
Running

2

😊🎙️📖

VisualNovel_sbv_demo
Running on CPU Upgrade

611

😊🎙️

Moe TTS
Running

6

🏺

Bert-VITS2 AI Abe&Suga&Kishida
Running

36

🚀

AICoverGen
Build error

13

:🎤

rvc-Blue-archives-hoyogames
Running

39

▶️🎤

VTuber RVC Models
Running

342

👀

RVC Inference HF
Running on Zero

222

🏃

Audio🔹Separator

Vocal and background audio separator
Running

43

📉

BlueArchiveTTS
Running

141

😆🌖😀

Multi Voice TTS(English/Chinese/Japanese)

[中文/English/日本語]multilingual text-to-speech
Running on Zero

380

🔥

Stable Audio Open Zero
Running

142

🍏

Applio

A simple, high-quality voice conversion tool
Running on Zero

1.61k

🗣️

Voice Clone
Running on Zero

151

⚡

RVC⚡ZERO

Voice conversion framework based on VITS
Running

6

🎙🐴

Multilingual Anime TTS
Runtime error

1

🎶

DiffSinger🎶 Diffusion for Singing Voice Synthesis
Running

129

🎵

Ultimate Vocal Remover WebUI
Running

237

🍏😺

Aesthetic RVC Inference HF
Running

64

⚡

Advanced RVC Inference
Running

776

🏃

Vits Models
Running

499

🎙🐴

Multilingual Anime TTS
Running

32

⚡

LoveLive-ShojoKageki VITS
Running

362

🐨

vits-uma-genshin-honkai
Running

3

🏺

おしゃべり晋さんメーカー（Style-Bert-VITS2）
Running

11

😊▶️

Hololive Style-Bert-VITS2
Running on Zero

469

🎼🎶

Midi Music Generator
Running

22

🎼

Japanese Lyric Generator
Running on L4

350

🎙

VALL E X
Running

2

🔥

AI晋さんメーカー
Running

7

📉

BangDream-ShojoKageki Bert VITS2
Running

3

📈

lovelive-ShojoKageki VITS JPZH
Running

17

🌖

Lovelive-nijigasaki-MB-iSTFT-VITS-ZH&JP
Running on T4

2.11k

🐶

Bark
Running

1k

🤗

OpenVoice
Running

273

🤗

OpenVoiceV2
Runtime error

59

🐠

ChatTTS OpenVoice
Running on T4

179

🌍🦜

MassivelyMultilingualTTS
Running on T4

2.24k

🐸

XTTS
Running on A10G

4.69k

🎵

MusicGen
Runtime error

515

📞

Seamless M4T v2
Sleeping

59

📉

Mars5 Space
Running on Zero

9

🎙️💾🔄🗣️

FAcodecV2
Running on A10G

231

👋

TTS x Hallo Talking Portrait

Generate Talking avatars from Text-to-Speech
Running on CPU Upgrade

389

🎤

RVC Genshin Impact
Running on Zero

91

📚

FoleyCrafter
Running

201

🏃

Voice Clone Multilingual

Languages ru,en,zh-cn,ja,de,fr,it,pt,pl,tr,ko,nl,cs,ar,es,hu
Running on Zero

14

🐨

Talkalkai Cover
Running on Zero

460

🎺

Image to Music v2

Get a music sample inspired by the mood of an image
Running

190

🕒

Whisper Timestamped

In-browser speech recognition w/ word-level timestamps
Running on CPU Upgrade

565

🏆

TTS Arena

Vote on the latest TTS models!
Running

19

🥇

TTSDS Benchmark and Leaderboard

Text-To-Speech (TTS) Evaluation using objective metrics.
Runtime error

6

🐨

LAKH MIDI Dataset Search

Search and explore LAKH MIDI dataset with MidiCaps
Running on Zero

23

📈

PicoAudio
Running

15

🏆

Advanced MIDI Search

Search and explore 179k+ MIDI titles
Running on Zero

78

🐠

SenseVoice
Running

227

🗣️

Whisper Speaker Diarization
Running

240

🚀

Faster Whisper Webui
Running on Zero

31

🎤

Vocal Separation SOTA
Running

86

🐠

BangDream-ShojoKageki Bert VITS2
Running

2

🐠

BangDream-ShojoKageki Api
Running

15

🐠

BangDream-ShojoKageki Bert VITS2
Running

13

🔊

Efficient Audio Captioning
Running on Zero

175

🏃

NaturalSpeech3 FACodec
Running

246

🌍

tts Text To Speech
Sleeping

4

🌍

Edge Tts
Runtime error

14

🏆

JA TTS Arena

Vote on the top Japanese TTS models!
Running

10

⚡

MIKU TTS
Running

10

🎮️🎹

Genshin music generation

Genshin Impact Game Style Music Generator
Sleeping

3

⚡

Advanced RVC Inference
Sleeping

🐠

Style Bert VITS2 MT
Paused

3

🎙️

ZeroRVC
Running

13

👁

Edge TTS w/ More Options
Runtime error

33

⚡

EZ Voice Clone
Running

3

⚡

Training Helper Rvc

easy training helper For RVC
Running on Zero

20

🚀

Anitalker
Running

6

:🎤

rvc-Blue-archives
Sleeping

74

🌊

Fish Diffusion (HiFiSinger) Demo
Running

15

🥰

Japanese Ero Voice Classifier
Running

29

😊🎙️📖

Style Bert VITS2 Editor Demo
Running on L4

417

🏆

Fish Speech 1
Running

1

⚡

Rvc Demo

A demo of RVC pip
Running

102

🐶

Bark Voice Cloning
Sleeping

1

🐸

NeonAI Coqui AI TTS Plugin
Running

105

🐸

NeonAI Coqui AI TTS Plugin
Running

149

🌍

Qwen2 Audio Instruct Demo
Running

8

🗣️

StyleTTS 2

Efficient, fast, and natural text to speech with StyleTTS 2!
Runtime error

12

🔥

AICoverGen
Running

11

🔥

Harmonic Melody MIDI Mixer

Harmonize and mix any MIDI melody
Running

7

🎻

MusicGen Riff

Music Generator | Song Maker Free | Lyrics Generator
Runtime error

30

🎵

Ilaria Audio Analyzer
Running on Zero

712

😻

Ilaria RVC
Running

4

🚀 🗿

MDX UVR
Running on Zero

104

🤗

GPT SoVITS V2
Running

7

🗣️

Read My Pdf Outloud
Running

6

⚡

Vocal Remover
Running on Zero

777

🥖

Parler-TTS

High-fidelity Text-To-Speech
Runtime error

3

🥰

Japanese Ero Voice Classifier
Running

3

🐠

GPT-SoVITS-ToneControl_test
Running

19

📊

Umamusume Bert Vits2
Running

1

📈

Animalese Py
Running

2

🔶

Animalese RVC
Build error

4

📊

AI Hanser
Running on Zero

156

💻

Stable Audio Live Multiplayer
Running

485

👁

Edge TTS Text To Speech
Running

15

🐨

Youtube AI Summarizer
Running

4

🚀

AICoverGen
Running

1

💻

Animalese Js
Sleeping

1

💬

ASR Model Comparison
Running

4

🔥

AICoverGenMod
Running

1

🔨

Ilaria Converter
Running

1

👁

RVC UI TES
Running

8

🎤

RVC Genshin Impact
Running

1

🦀

Voice2VoiceChatbot
Sleeping

🌖

RealTimeVoicetoVoiceChatbot
sp-uhh/speech-enhancement-sgmse

Audio-to-Audio • Updated Dec 2, 2024 • 4 • 9
Running

2

🏃

RVC UI

An easy-to-use voice conversion framework based on VITS.
Sleeping

🏃

RVC
Running

🌍

AI Voice Assistance
Running on Zero

1

🗣️

Voice Clone
Sleeping

5

🌍

Optimus
Running

38

👀

Doc To Dialogue

Transform a report or document into an interview/discussion
Running

48

⚡

Voicee

Super fastest Voice Assistant
Running

6

🐟

Fish Audio API Demo
Running on Zero

59

👁

Musicgen Songstarter Demo
Running

81

▶️🐻💿

Hololive Rvc Models V2
Running

24

🎹

Advanced MIDI Renderer

Transform and render any MIDI
Sleeping

3

🚀

Imagen POP Music Medley Diffusion Transformer

Generate POP music medley with Imagen diffusion transformer
Running

2

🔥

Ultimate MIDI Classifier

Classify absolutely any MIDI by genre, song and artist
Running on Zero

4

📚

Intelligent MIDI Comparator

Intelligently compare any pair of MIDIs
Running

91

🌍

ChatTTS Speaker
Running

2

🌖

Bridge Music Transformer

Generate a seamless bridge between two composition parts
Running

57

👀

vits-simple-api
Running

11

🎙️

Bert VITS Umamusume Genshin HonkaiSR
Running on Zero

35

🔊⏫

Audio SR

Fixed fork of the original audio sr!
Running on Zero

171

🎤🔄

Seed Voice Conversion
Running

40

⚡

Mini Omni
Running

4

⚡

Monophonic MIDI Melody Harmonizer

Retrieval augmented harmonization of any MIDI melody
Running

10

⚡

MIDI Melody

Add a unique melody to any MIDI file
Running

3

🔥

MIDI Chords Mixer

Mix chords from one MIDI to another MIDI
Running

2

🏆

Morse To Audio
Sleeping

1

🚀

RCV EASY GUI
Running

1

⚡

Advanced RVC Inference
Running

3

⚡

Lyricsgenius

Get Lyrics from Genius's Link
Sleeping

1

👁

Groq Gradio Voice Assistant
Sleeping

2

🐠

Hex Separator
Running

3

🐠

Groq API Models

Groq API Playground
Running on Zero

16

👁

GPT-SoVITS-V2-NIIMI SORA
Paused

2

🎵

AI Tube Engine MusicGen
Paused

1

🎵

AI Tube Engine MusicGen
Paused

1

🎵

AI Tube Engine MusicGen
Paused

5

🎵

AI Tube Engine MusicGen
Build error

18

📚

GPT-SoVITS-V2-Gakuen Idolmaster
Running on Zero

8

🌖

UTMOSv2
Runtime error

5

⚡

Mini Omni
Build error

10

👁

GPT-SoVITS-V2-misc_models
Configuration error

12

📊

Bench.audio

LMSYS bench for audio agents
Runtime error

78

🌟

Compressed Wav2Lip
Running

81

👄

Gradio Lipsync Wav2lip
Sleeping

7

🐨

EchoMimic
Running

23

🌍

Wav2lip Gpu
Running

1

🏃

Matcha TTS Japanese

Description of Matcha TTS Japanese
Running

89

💩

DeepFilterNet2
Running on Zero

12

🇫🇷🥖

French Parler-TTS

High-fidelity Text-To-Speech
Running on Zero

257

🟣

EzAudio
Running on Zero

14

🔥

Kotoba Whisper Demo
Running

1

🦀

Matcha Tts Onnx Benchmarks

Benchmark load model and tts time
Runtime error

7

⚡

Mini Omni
Running on Zero

2

🐠

AIChat-matcha-tts-onnx-en

Give your space a voice! (Demo)
Running on Zero

13

🌍

GAMA
Running on Zero

4

🏆

GAMA-IT
Sleeping

1

🦀

Sbv2 Py
Running on Zero

216

🎶

OpenMusic
Running

73

🎙️

PodcastGen

Generate a 2-speaker podcast from text input or documents!
Running

3

🐠

Mistral 7B Instruct v0.3 Matcha-TTS English

Enjoy TTS Chat
Sleeping

2

💨

Moshi
Running on Zero

46

🟣

EzAudio ControlNet
Running

3

🐟

Fish Audio API Demo
Runtime error

1

🐠

Whisper En Tiny
Running on Zero

7

🏃

Guided Rock Music Transformer

Controlled source augmented rock music transformer
Running on Zero

21

🎷

Long-form MusicGen

Long-form Musicgen
Running

75

💻

Multilingual TTS
Running

4

🔥

AI岸田文雄メーカー
Running

1

🔥

AI菅義偉メーカー
Running

1

😻

Audio Mouth
Running

390

📚

Pdf2audio
Running on CPU Upgrade

586

🏆

Open ASR Leaderboard
Running on T4

1.02k

🎙️

Open NotebookLM

Personalised Podcasts For All - Available in 13 Languages
Sleeping

4

🔥

Kotoba Whisper Bilingual Demo
Running on T4

405

🗣️

MeloTTS

Fast, efficient, & multilingual text-to-speech
Running on T4

184

🐤

Canary 1b
Running

1

😻

Style Bert VITS2 SW
Runtime error

21

👁

Llama 3.2 3b Voice
Runtime error

1

📚

Pdf2audio
Running on Zero

732

🤯

Whisper Turbo
Running on Zero

286

🤯

Realtime Whisper Turbo

Realtime implementation of Whisper large turbo
Running

141

🚀

Whisper Large V3 Turbo WebGPU

ML-powered speech recognition directly in your browser
Running on T4

260

🐢

Tortoise Tts

ExpressivText-to-Speech
Running

32

💻

Russian Text To Speech
Running

5

📉

Yt-dlp Wav
Running on T4

284

🎼

UnlimitedMusicGen

unlimited Audio generation with a few added features
Runtime error

84

🎶

AudioCraft Plus v2.0.0a (MusicGen + AudioGen)
Runtime error

22

🎼

MusicGen+ V1.2.7 (HuggingFace Version)
Running on Zero

61

🏢

VoiceRestore
Running on Zero

3

⚡

Whisperturbo

whisper3 turbo
Running

34

🎙️

GPT-SoVITS-3s-cloning-free-TTS
Running

4

🏺

おしゃべり石破茂メーカー（Style-Bert-VITS2）
Sleeping

1

🏺

おしゃべり二階俊博メーカー
Runtime error

3

🐠

Text To Meow
Running

4

🔥

Rvc Ui
Running

26

🌍

Reverb ASR Demo
Running

1

😻

Ilaria RVC Mod
Running on T4

303

🚀

Resemble Enhance
Sleeping

2

💻

Openai Whisper Large V3 Turbo
Running

45

💻

RVC PlayGround
Running

52

🚀

Podcastfy.ai - An Open Source alternative to NotebookLM's podcast feature
Running on Zero

68

🎞️🎺

Video to Music

Generate and apply matching music background to video shot
Running

174

👂🎞️

Video SoundFX

Generates a sound effect that matches video shot
Paused

171

👂

Image2SFX Comparison

Generates audio environment from an image
Running on Zero

184

🍏

Applio
Running on Zero

1.62k

🗣️

F5-TTS

F5-TTS & E2-TTS: Zero-Shot Voice Cloning (Unofficial Demo)
Running

1

💜

Heartbeat
Running

153

🤗🏆

TTS Spaces Arena

Vote on the top HF TTS models!
Running on CPU Upgrade

64

🧝‍♀️🧛‍♂️🧚‍♀️

xVASynth TTS

CPU powered, low RTF, emotional, multilingual TTS
Running

284

🎶

— AI Jukebox —

Generate music powered by AI
Running on L40S

325

🐠

TANGO

Co-Speech Gesture Video Generation
Running on Zero

14

🥰🎤📝

Anime Whisper Demo
Running on Zero

62

🏢

Ichigo Llama3.1 S Instruct
Running

6

🚀

Whisper Japanese Phone Demo

Whisper model to transcript japanese audio to katakana.
Running on Zero

120

📈

ClearerVoice-Studio (Speech Enhancement, Separation and Extraction)

Better AI powered platform to purify your speech signal
Running

20

♫🔒

Steganography

Text | Image | Audio | Video to Spectrogram || Steganography
Running

15

🔥

AICoverGenMod
Running

12

🚀

UVR5 UI
Running on Zero

16

🗣️

Diva Realtime Chat
Sleeping

2

👁

Kotoba Whisper Diarization Demo
Running on Zero

11

📚

Synthio Stable Audio Open

Stable audio open model from Synthio paper.
Sleeping

1

🚀

RYO EVC
Runtime error

1

😻

UVR
Running on Zero

35

🌒

Moonshine ASR

Fast & efficient ASR outperforming Whisper!
Running

22

🔊

seewav-gui
Running on Zero

70

🎵

RWKV Music

Generate MIDI music using RWKV v4!
Running

4

💻

MP3 Transcribe

Whisper Transcribe MP3 files, use a GPU to convert faster!
Running

6

🗣️0️⃣

StyleTTS 2 Zero

Efficient, fast, and natural text to speech with StyleTTS 2!
Running on Zero

246

😻

MaskGCT TTS Demo

MaskGCT TTS Demo
Running on Zero

62

🎵

MelodyFlow
Running on Zero

574

🤫

Whisper Large V3
Sleeping

6

🚀

Ultimate Chords Progressions Transformer

Self-correcting multi-instrumental chords transformer
Runtime error

8

🎶♫

Chords Progressions Transformer

Chords-conditioned music transformer
Running on Zero

25

⚡

Fast Whisper Turbo

Ultra-fast Whisper Turbo inference ⚡
Running on A10G

291

🔊

AudioLDM2 Text2Audio Text2Music Generation
Running

2

🗣️👂

Hey Buddy!

In-Browser Audio Wake-Word Spotting
Running

3

🎹

Streamlit Pianoroll

Streamlit pianoroll playback element
Running

9

⚡

Audio-Separator

Audio-Separator by Politrees
Running on Zero

99

🚀

Giant Music Transformer

Fast multi-instrumental music transformer
Sleeping

23

🌖

Omni Mini (WebRTC)
Sleeping

5

🎹

Fortepyan Datasets

Streamlit browser for piano music datasets.
Sleeping

4

🎹

PIANO Dataset

Demo of masking tasks from the PIANO dataset
Running on L40S

132

💬

Fish Agent

An end-to-end (e2e) Voice Language Model by Fish Audio.
Running

7

🎵

Audio to Stems to MIDI Converter
Running

25

🌍

Podcast Generation

Generate podcasts with AI avatars
Sleeping

🐠

ChatTTS OpenVoice
Running

1

📚

OpenVoice
Running on Zero

7

🗣️

F5-TTS

F5-TTS & E2-TTS: Zero-Shot Voice Cloning (Unofficial Demo)
Running

317

📊

Bark with Voice Cloning
Running

27

📉

OuteTTS 0.1 350M Demo
Running on Zero

9

🎼🎶

Midi Music Generator
Sleeping

4

🎵

Audio Lyrics Extractor
Running

10

🤔

Did StyleTTS 2 Generate It?

Did StyleTTS 2 generate that audio?!?
Paused

35

🌍

Hertz Dev

base model for mono-channel completion
Sleeping

7

⚡

Xtts
Running on Zero

225

💬

ChatTTS Forge
Running on Zero

300

❤️

Kokoro TTS

Now in 5 languages!
Running

6

🌖

Pipertts
Running

53

🎧

Nexa Omni Demo
Running on Zero

12

😻

MaskGCT TTS Demo

MaskGCT TTS Demo
Sleeping

20

📚

Video2music
Running on L4

794

🔊

Audioldm Text To Audio Generation
Running

2

🦀

So VITS SVC
Sleeping

2

👀

GPT SoVITS
Running on Zero

272

🗣️

Spanish F5

Spanish finetune for the original F5 model.
Sleeping

1

🎤⚡🎤

Dolce SVC
Running

2

🎤🦊

Dolce TTS
Running

1

⚡

Lipsync
Running

5

☕🐰🎤

Chino TTS
Running

2

🐨

Style Bert VITS2 NO
Running

1

📉

Style Bert VITS2 SU

シャルティアのAI音声合成モデルを作りました。
Running

1

🔥

Style Bert VITS2 MHY

早乙女乱馬（女）のAI音声合成モデルを作りました。
Running

1

🚀

Style Bert VITS2 SAR

ベアトリスのAI音声合成モデルを作りました。
Running on L4

33

⚡

Talk To Ultravox

Talk to Fixie.ai's Ultravox with WebRTC ⚡️
Running

2

🏃

SoundOfWater

Estimate physical properties merely from pouring sound!
Running

9

🐢

Llama Code Editor

Create interactive HTML web pages with your voice
Running on CPU Upgrade

28

🐨

sutra-avatar-v2
Running

1

🌍

Audio Transcriber

Record an audio, then use AI to transcribe and translate it.
Running on Zero

16

🖌️🎶

Inpaint Music Transformer

Large and fast music transformer for pitches inpainting
Running

47

🐠

OuteTTS 0.2 500M Demo
Running

13

🌖

Tsukasa 司 Speech
Running

8

🎵

MusicGen Continuation
Running

5

🚀

Semanticodec Ultra Low Bitrate Audio Codec

Ultra-low bitrate neural audio codec (0.31~1.40 kbps) with a
Running

16

📚

Audiosr Versatile Audio Super Resolution

Versatile audio super resolution (any -> 48kHz) with AudioSR
Running on Zero

2

🐠

OuteTTS 0.2 500M Demo GPU
Running

2

💬

ChatTTS Forge English interface

TTS tool
Running

1

📚

Style Bert VITS2 RU2

short_description: 猫屋敷まゆのAI音声合成モデルを作りました。
Running

11

🥰🎤🤔

Galgame Voice Finder
Sleeping

1

👁

Vad Go
Running on Zero

147

👀

Indic Parler-TTS

A demo of Indic Parler-TTS
Sleeping

1

🐳

Voice Activity Detection
Running

5

👀

Vikhr 4o
Running

1

⚡

Audio Arena

audio-arena
Running

18

🏢

Wespeaker Demo
Running

4

💻

Wesep Tse 2speaker Demo

Target Speaker Extraction with WeSep
Running

13

🐢

Wenet Demo
Runtime error

4

🏆

Open_ASR_Leaderboard
Running

30

🗣️

Text-to-Speech WebGPU

WebGPU text-to-Speech powered by OuteTTS and Transformers.js
Running

12

📈

SpeechScore (Speech Quality Metrics and Evaluation)

A home for scoring speech quality
Running

2

🐠

Fish Speech Benchmark

Non official benchmark by Fish Speech
Running on Zero

6

👅🎙️🥰

Chupa Generator
Running on Zero

5

🌖

Japanese Parler-TTS Mini Demo
Running on Zero

4

🏢

Japanese Parler-TTS Large Demo
Runtime error

3

⚡

Make Anime Emotion Dataset
Running

6

😊😱😠

Anime Speech Emotion Recognition
Running on Zero

443

🔊

MMAudio — generating synchronized audio from video/text
Running on Zero

27

🗣️

Voice Clone
Running on Zero

187

🐠

Sound AI SFX

SText to Audio(Sound SFX) Generator
Runtime error

5

👁

Talk To Moshi

Talk to Kyutai's moshi - powered by Gradio WebRTC!
Running on T4

372

⚡

HierSpeech++ (Zero-shot TTS)
Running

10

🌍

Talk To Gradio Docs Rag

Talk to the Gradio docs! Powered by Pydantic and WebRTC ⚡️
Running

6

📊

Melody Workshop

"One-minute creation by AI Coding Autonomous Agent MOUSE-I"
Running on Zero

11

📉

Text2midi
Running on Zero

106

🔊

Audio Llama

generated sound from video/text and search
Running

2

🐢

VM Sound Classification
Running

2

🪷

Lotus
Running

102

🌙

Moonshine Web

Real-time in-browser speech recognition
Running

8

💻

Openai Realtime Voice

Talk with openAI's new Realtime Voice API
Running on Zero

8

🏆

Fast GeCo
Running on Zero

6

📉

SoloAudio
Running on Zero

2

🐨

SSR Speech
Running

23

🎶

Music Genre Classifier

Music Genre Classifier
Running

2

🪕🎵

Guzheng Playing Tech

Guzheng Performance Technique Recognizer
Running

2

🪕🎶

Chinese Instruments

Chinese Traditional Instrument Sound Retriever
Running

2

🪕🎼

Pentatonic Mode

Chinese Music Pentatonic Mode Detector
Running on T4

16

🚀

Kotoba-Speech Demo
Running

2

🐨

Audio Edit
Paused

4

🔊

MMAudio

Video to Audio
Running

8

🎙️

Audio Transcription
Running

5

📉

Audio 8D

Make your audio to 8D
Running

11

⚡

Audio Separator

Audio-Separator Demo
Running

2

🎤

Real-time Whisper WebGPU (Vue)

Yet another Real-time Whisper with WebGPU, written in Vue
Running

5

🦀

MIDI Identification

Identify any MIDI
Running

2

🌙

Moonshine Web (Vue)

Yet another Real-time in-browser STT, re-implemented in Vue
Running

4

🧸

アイリ VTuber

アイリ VTuber. LLM powered Live2D/VRM living character.
Running

8

🎵🖥️

Figured Bass Calculator

figured bass calculator
Running

135

🚀

Ebook2audiobook V2.0 Beta

Added improvements, 1107+ languages supported
Running

2

🐸📖

Ebook2audiobook_v1.0

V1.0Convert any Ebook to AudioBook with Xtts + VoiceCloning!
Running

9

🪈📖

Ebook2audiobookPiper-tts

Converts Ebooks into audiobooks with piper-tts
Running

5

⚡

Ebook2AudiobookV2.0_Docker_Test

First ebook2audiobook Dockerfile test
Running

10

🎵🔘

Music Vision

Audio Visualization Circle Effect Tool
Running

4

📟

MS1-X Virtual Synth

Ready-to-play synth instrument!
Running

8

🎮️💬

hoyoTTS

Genshin Impact & Honkai Star Rail Game Character Voice TTS
Running

9

🪕

Erhu Playing Tech

Erhu Performance Technique Recognizer
Running

9

🎙

Bel Canto Discriminator

Discriminator of Bel Canto and Chinese Folk Singing
Running

12

🎹

Pianos

Piano Sound Quality Classifier
Running

13

🎤

Chest Falsetto Discriminator

Discriminator of Chest Vocie and Falsetto
Running on L4

116

🥳

CosyVoice2-0.5B
Running on Zero

3

👾

Monster Piano Transformer

Ultra-fast and very well fitted solo Piano music transformer
Running

1

🌖

Style Bert VITS2 IM2

ヘスティアのAI音声合成モデルを作りました。
Sleeping

1

🏃

Style Bert VITS2 YHK2

フレイヤのAI音声合成モデルを作りました。
Paused

2

📻🎙️

Anachrovox V0.1 Emerald (Bugged)

Hands-Free AI Voice Chat with a Retro Vibe
Paused

3

📻🎙️

Anachrovox V0.1 Azure (Bugged)

Hands-Free AI Voice Chat with a Retro Vibe
Paused

2

📻🎙️

Anachrovox V0.1 Amber (Bugged)

Hands-Free AI Voice Chat with a Retro Vibe
Running

67

📉

MIDI-Melody-Generator

"One-minute creation by AI Coding Autonomous Agent MOUSE-I"
Running

2

⚡

Audio Arena

audio-arena
Running on Zero

21

📊

Audio Separator
Running

11

🥇

Open Universal Arabic Asr Leaderboard

A benchmark for open-source multi-dialect Arabic ASR models
Running on Zero

248

🔥

MusicGen Streaming
Running

2.44k

⚡️

Whisper JAX
Running on Zero

25

📝

Parler-TTS Streaming

High-fidelity Text-To-Speech
Running on L4

184

👄

LatentSync

Audio Conditioned LipSync with Latent Diffusion Models
Running on A10G

239

🎼

Singing Voice Conversion
Running

54

🔥

Text To Speech
Running on Zero

3

🔥

DeepfakeDetection

Deepfake Detection
Running

2

🦀

Felguk Audio Edit

Audio edit
Running on Zero

104

🎴

Kokoro TTS Zero

Accelerated Text-To-Speech on Kokoro-82M
Running

3

📚🎧

📚 𝕡𝕕𝕗 𝕥𝕠 𝕊𝕡𝕖𝕖𝕔𝕙 ℂ𝕠𝕟𝕧𝕖𝕣𝕥𝕖𝕣 🎧

Accessibility PDF & pasted text to speech converter w/ gTTs
Running on L4

1.19k

😭

SadTalker
Running

1

😎

OLLAMA TTS CLIENT
Running

7

🚀

Piper TTS Spanish
Running

39

🦀

Audio Visualizer

Audio Visualizer
Running

2

🦀

JARVIS2

2
Running on Zero

235

🚀

TangoFlux

Text to Audio (Sound SFX) Generator
Running

274

🎤

Rvc Models
Running

8

🎼🎶

Karaoke MIDI Search
Running

16

🎵

Semantic Audio Search w/ Transformers.js
Running on Zero

3

⚡

Misaki G2P

G2P

Upvote

Collection guide
Browse collections

Spaces for Audio / Voices

AICoverGen

SBV2 Chupa Demo

VisualNovel_sbv_demo

Moe TTS

Bert-VITS2 AI Abe&Suga&Kishida

AICoverGen

rvc-Blue-archives-hoyogames

VTuber RVC Models

RVC Inference HF

Audio🔹Separator

BlueArchiveTTS

Multi Voice TTS(English/Chinese/Japanese)

Stable Audio Open Zero

Applio

Voice Clone

RVC⚡ZERO

Multilingual Anime TTS

DiffSinger🎶 Diffusion for Singing Voice Synthesis

Ultimate Vocal Remover WebUI

Aesthetic RVC Inference HF

Advanced RVC Inference

Vits Models

Multilingual Anime TTS

LoveLive-ShojoKageki VITS

vits-uma-genshin-honkai

おしゃべり晋さんメーカー（Style-Bert-VITS2）

Hololive Style-Bert-VITS2

Midi Music Generator

Japanese Lyric Generator

VALL E X

AI晋さんメーカー

BangDream-ShojoKageki Bert VITS2

lovelive-ShojoKageki VITS JPZH

Lovelive-nijigasaki-MB-iSTFT-VITS-ZH&JP

Bark

OpenVoice

OpenVoiceV2

ChatTTS OpenVoice

MassivelyMultilingualTTS

XTTS

MusicGen

Seamless M4T v2

Mars5 Space

FAcodecV2

TTS x Hallo Talking Portrait

RVC Genshin Impact

FoleyCrafter

Voice Clone Multilingual

Talkalkai Cover

Image to Music v2

Whisper Timestamped

TTS Arena

TTSDS Benchmark and Leaderboard

LAKH MIDI Dataset Search

PicoAudio

Advanced MIDI Search

SenseVoice

Whisper Speaker Diarization

Faster Whisper Webui

Vocal Separation SOTA

BangDream-ShojoKageki Bert VITS2

BangDream-ShojoKageki Api

BangDream-ShojoKageki Bert VITS2

Efficient Audio Captioning

NaturalSpeech3 FACodec

tts Text To Speech

Edge Tts

JA TTS Arena

MIKU TTS

Genshin music generation

Advanced RVC Inference

Style Bert VITS2 MT

ZeroRVC

Edge TTS w/ More Options

EZ Voice Clone

Training Helper Rvc

Anitalker

rvc-Blue-archives

Fish Diffusion (HiFiSinger) Demo