From 1240bd8834e56c713deac06e60ce34b1192a5d15 Mon Sep 17 00:00:00 2001
From: Han Zhu <1106766460@qq.com>
Date: Wed, 4 Dec 2024 17:43:25 +0800
Subject: [PATCH] Fix the normalized_text in LibriTTS recipe

---
 egs/libritts/TTS/local/prepare_tokens_libritts.py | 11 +----------
 1 file changed, 1 insertion(+), 10 deletions(-)

diff --git a/egs/libritts/TTS/local/prepare_tokens_libritts.py b/egs/libritts/TTS/local/prepare_tokens_libritts.py
index faeb611f5d..cdc39ea6b7 100755
--- a/egs/libritts/TTS/local/prepare_tokens_libritts.py
+++ b/egs/libritts/TTS/local/prepare_tokens_libritts.py
@@ -31,15 +31,6 @@
 from tqdm.auto import tqdm
 
 
-def remove_punc_to_upper(text: str) -> str:
-    text = text.replace("‘", "'")
-    text = text.replace("’", "'")
-    tokens = set("abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789'")
-    s_list = [x.upper() if x in tokens else " " for x in text]
-    s = " ".join("".join(s_list).split()).strip()
-    return s
-
-
 def prepare_tokens_libritts():
     output_dir = Path("data/spectrogram")
     prefix = "libritts"
@@ -72,7 +63,7 @@ def prepare_tokens_libritts():
             for t in tokens_list:
                 tokens.extend(t)
             cut.tokens = tokens
-            cut.supervisions[0].normalized_text = remove_punc_to_upper(text)
+            cut.supervisions[0].normalized_text = text
 
             new_cuts.append(cut)