it-swarm.dev

Přirozeně znějící text na řeč?

Hledám nějaký snadný software pro převod textu na řeč pro Ubuntu, který zní přirozeně. Nainstaloval jsem Festival, Gespeaker atd., Ale nic nezní velmi přirozeně. Vše velmi syntetické a těžko pochopitelné.

Nějaká doporučení tam?

86
I Heart Ubuntu

SpeakIt!

Věřím, že jsem nejlepší bezplatný software TTS našel zdarma pomocí Google Chrome rozšíření s názvem "SpeakIt". Toto funguje pouze v prohlížeči Chrome pro mě na Ubuntu). S Chromiem z nějakého důvodu nefunguje. Mluvíme o dvou ženských hlasech, které znějí velmi realisticky ve srovnání se vším ostatním. Tam jsou uvedeny alespoň další čtyři mužské a ženské hlasy s Chrome rozšíření) pokud prohledáváte internetový obchod Chrome Internetový obchod pomocí výrazu „TTS“).

Použití : Pro použití na webu. zvýrazníte text, který chcete číst, a klikněte pravým tlačítkem myši na ikonu „SpeakIt“ nebo klikněte na ikonu SpeakIt v doku na horním panelu Chrome).


Uživatelé Firefoxu mají také dvě možnosti. V doplňcích Firefoxu proveďte vyhledávání TTS a měli byste najít „Click Speak“ a také „Text to Voice“. Hlasy nejsou tak dobré jako hlasy, které jsou Chrome SpeakIt, ale jsou rozhodně použitelné).

Rozšíření SpeakIt využívá technologii iSpeech a za cenu 20 $ ročně může web převádět text do zvukových souborů MP3. Můžete zadávat text, adresy URL, kanály RSS, stejně jako dokumenty jako TXT, DOC a PDF a výstup do MP3. Můžete vytvářet podcasty, vkládat zvuk atd. Zde je odkaz a kázka jejich zvuk (nevím, jak dlouho bude odkaz trvat).

22
I Heart Ubuntu

SVOX pico2wave

Velmi minimalistický TTS, lépe znějící než espeak nebo mbrola (podle mého názoru). Nějaké informace zde .

Nechápu, proč je pico2wave ve srovnání s espeak nebo mbrola zřídka diskutován. Je to malé, ale zní to opravdu dobře (přirozeně). Bez úprav uslyšíte přirozeně znějící ženský hlas.

A ... ve srovnání s Mbrola, rozpoznává jednotky a mluví správným způsobem!
Například:

  • 2 ° C → dva stupně
  • 2m → dva metry
  • 2 kg → dva kilogramy

Po instalaci jej používám ve skriptu:

#!/bin/bash
pico2wave -w=/tmp/test.wav "$1"
aplay /tmp/test.wav
rm /tmp/test.wav

Poté spusťte požadovaný text:

<scriptname>.sh "hello world"

nebo si přečtěte obsah celého souboru:

<scriptname>.sh "$(cat <filename>)"

To je vše, co má na Ubuntu lehký a stabilní pracovní TTS.

55
user85321

Pico a espeak jsou zábavné a snadno se dostanou do práce, ale nejsou tak dobré. Výchozí hlasy festivalu také nejsou tak dobré. Festival je však schématicky založený řečový rámec, kde řada vědců vytvořila mnohem lepší hlasy plug-inů. Kvalitu pico2wave můžete snadno překonat na skladě Ubuntu, protože jeden z těchto hlasů je k dispozici jako hotový balíček.

Chcete-li, aby festival zněl přirozeně, postupujte následovně:

Sudo apt-get install festival
Sudo apt-get install festvox-us-slt-hts
festival -i
festival> (voice_cmu_us_slt_arctic_hts) 
festival> (SayText "Don't hate me, I'm just doing my job!")

Můžete to udělat z příkazového řádku pomocí -b (nebo --batch) a uvedení každého příkazu do jednoduchých uvozovek:

festival -b '(voice_cmu_us_slt_arctic_hts)' \
    '(SayText "The temperature is 22 degrees centigrade and there is a slight breeze from the west.")'

Z úložiště Nitech můžete získat další docela dobré hlasy, ale jejich instalace je dokonalá a výchozí cesty se změnily, takže je možné, že odkazy na názvy souborů ve svazcích schématických souborů bude nutné ručně upravit, aby fungovaly na skladě Ubuntu.

16
Jon Watte

Simple Google ™ TTS

Aktualizace ze stránky projektu (2019-02) : Tento projekt je v současné době neudržovaný a zůstane tak v dohledné budoucnosti


Kvůli nedostatku lepší alternativy jsem napsal bash skript , který je v rozhraní s skript Perl od Michala Fapso poskytovat TTS přes Google Translate. Z popisu projektu:

Záměrem je poskytnout snadno použitelné rozhraní pro převod textu na řeč pomocí systému syntézy řeči Google. Záložní možnost používající pico2wave automaticky poskytuje syntézu TTS v případě, že není nalezeno žádné připojení k internetu.

Za současného stavu podporuje obálka čtení ze standardního vstupu, soubory prostého textu a výběr X (zvýrazněný text).

Hlavní rysy jsou:

  • online syntéza TTS prostřednictvím překladu Google
  • offline syntéza TTS přes pico2wave
  • podporuje celou řadu různých jazyků
  • umí číst z CLI, textových souborů a zvýrazněného textu
  • podporuje čtení zvýrazněného textu s pevným formátováním (např. PDF))

Instalace a použití jsou dokumentovány na projektová stránka .

Byl bych rád, kdybyste to zkusili. Hlášení chyb a jakákoli jiná zpětná vazba jsou vítány!

13
Glutanimate

Pro Ubuntu, který je vysoce kvalitní, jsem hledal vysoký a nízký text na řeč. Není žádný. Moje hlasové šňůry jsou ochrnuté, takže jsem potřeboval TTS, abych přidal hlasové instrukce k mému videa Ubunt . Můžete získat komerční vysoce kvalitní Linux pro převod textu na řeč zde . Je to prostě opravdu drahé. Nakonec jsem si koupil Natural Reader pro Windows (nefunguje v Ubuntu pod vínem) za 40 $. Možná později dostanu ten Linux.

8
Joe Steiger

Provádím výzkum nejlepších znějících a snadno naladěných textů na řečové hlasy. Níže je uveden seznam toho, co jsem považoval za 5 nejlepších produktů v pořadí podle kvality zvuku. Většina webových stránek přidružených k tomuto produktu má interaktivní ukázku, která vám umožní udělat si vlastní rozhodnutí.

  1. NeoSpeech
  2. iVona
  3. Acapela
  4. AT&T Přirozené hlasy
  5. Hlasy CereProc
6
Jim

Kombinujte nástroje SVOX (pico) s LibreOffice:

Nástroje SVOX (pico) se snadno instalují a v Ubuntu přinášejí kvalitní hlasy. Nainstalujte jej:

Sudo apt-get install libttspico0 libttspico-utils libttspico-data

LibreOffice můžete používat v kombinaci s nástroji SVOX (pico) instalací rozšíření „Číst text“ a získáte „GUI“ pro tento vynikající software TTS:

Nastavení možností rozšíření pro čtení text pomocí Nástroje - Doplňky - Výběr čtení .... Použijte /usr/bin/python jako externí program. Vyberte možnost příkazového řádku, která obsahuje token (PICO_READ_TEXT_PY) , možná budete chtít některé z nich experimentovat.

Nyní stačí jen vybrat nějaký text v LO Writer, Calc, Impress nebo Draw a kliknout na ikonu přidanou jako panel nástrojů (šťastná tvář s baňkou).

5
leoperbo

Hlasy Nitech HTS na festivalu považuji za velmi přirozené a uklidňující nad jinými hlasy, které jsem slyšel. Viz tento odkaz o tom, jak nastavit Nitech a další zvuky s festivalem. Nenašel jsem dobrého gui, které mohu použít ke konfiguraci těchto hlasů, ale nastavení je přes festival.scm stále funguje. Tento příspěvek je velmi starý a možná budete chtít najít skutečný instalační adresář pomocí příkazu „vyhledejte festival“

5
razor

Zde je to, co jsem udělal, abych měl čistě přirozenou řeč pro pdf a další textové soubory (jiná řešení nejsou přirozená nebo jsou to jen placené služby). Toto je vlastně řešení pomocí chromu nebo chrome, ale funguje rychle a snadno).

  1. Nainstalujte SpeakIt! rozšíření na váš chrome nebo chrom).
  2. Nainstalujte Prohlížeč PDF , pokud používáte chrom (chrom již má prohlížeč pdf zdarma) a zaškrtněte možnosti „Povolit v anonymním režimu“ a „Povolit přístup k adresám URL souborů“ v nastavení rozšíření chrómu.
  3. Přetáhněte soubor PDF do prohlížeče.
  4. Nyní zvýrazněte nějaký text a klikněte pravým tlačítkem a vyberte SpeakIt! takže můžete poslouchat čistě přirozený převod textu na řeč.

Existují také způsoby, jak otevřít jiné soubory jako .doc a .txt v chrome a udělat to samé). Existují další přípony pro chrome, které zobrazují soubory PDF), zkontrolujte, zda to se vám hodí lépe. Kromě toho můžete na Disk Google nahrávat všechny druhy textů a číst je pomocí SpeakIt !. Další rozšíření nazvané „Speak text“ funguje stejným způsobem a má přirozenou řeč.

4
Pouya Sanooei

Při hledání lepšího motoru tts, který se má použít v novém firefox 49 narativním režimu , jsem našel pico tts (svox) - můj oblíbený TTS engine.

Sudo apt install espeak libttspico0 libttspico-data libttspico-utils

Jak změnit výchozí systém syntézy řeči široký?

Lidé Arch Arch mě přivedli na správnou cestu:

Odkomentujte modul, který se vám líbí, a nastavte jej jako výchozí v nastavení dispečera řeči:

# Sudo vim /etc/speech-dispatcher/speechd.conf

[...]
# -----OUTPUT MODULES CONFIGURATION-----
# Each AddModule line loads an output module.
#AddModule "espeak"       "sd_espeak"   "espeak.conf"
AddModule "pico-generic"  "sd_generic"   "pico-generic.conf"

[...]
#DefaultModule espeak
DefaultModule pico-generic

Restartujte démona:

# Sudo systemctl restart speech-dispatcher.service

Ale při opětovném spuštění firefox se nic neděje. Podle výše uvedeného odkazu (Arch forum post # 10 and # 16) pracuje s festivalem (nezkoušel), ale dispečer řeči pro pico neuvádí dostupné hlasy. Nebude to fungovat.

Jakýkoli nápad tam by byl vysoce ceněn ;-)

2
apos

Simple Google ™ TTS

Pico, mbrola, cmu, festival, flite, vše SUCK v roce 2017 (Byly úžasné v 90. letech). AT&T přirozená řeč (která je fantastická) není kompatibilní s linuxem a není zdarma, proto používáme Google

git clone https://github.com/Glutanimate/simple-google-tts.git
Sudo apt install xsel libnotify-bin libttspico0 libttspico-utils libttspico-data libwww-Perl libwww-mechanize-Perl libhtml-tree-Perl so$
cd simple-google-tts
Sudo ln -s `pwd`/simple_google_tts /usr/local/bin
simple_google_tts en "Text to speech is now installed"
cd -
1
Jonathan

Můj oblíbený program převodu textu na řeč se jmenuje Magic English, ale stejně jako Natural Reader zmiňovaný Joe Steigerem, je to program Windows a nejsem si jistý, zda bude spuštěn pod vínem.

AT&T Natural Voices je k dispozici online jako demo, ale je to spíš řešení než řešení ...

1
Chris Granger

gTTS

gTTS ( Google Text-to-Speech), a Python knihovna a Nástroj CLI pro rozhraní s rozhraním API pro převod textu na řeč od společnosti Google Translate: Zapisuje mluvená data mp3 Do souboru, souborový objekt (bytestring) pro další manipulaci se zvukem nebo stdout.

Nevýhody : Pouze CLI. Musí být online, protože vyžaduje žádost o veřejný otevřený koncový bod Google.

Sudo -H pip install gTTS  # Install

Používání

gtts-cli 'hello' --output hello.mp3
gtts-cli -l es 'Nadie es patria, todos lo somos' | play -t mp3 -

Dokumentace a další příklady

Ostatní

Některé z nich již byly zmíněny

1
Pablo Bianchi

Za tímto účelem stavím Intelligent Speaker - rozšíření pro Google Chrome. Dokáže číst stránky i bez výběru (pokud je detekce textu správná).

0
Vitaly Zdanevich