Strategies in Transfer Learning for Low-Resource Speech Synthesis: Phone Mapping, Features Input, and Source Language Selection

Phat Do1, Matt Coler1, Jelske Dijkstra2, Esther Klabbers3
1Language, Technology and Culture Department, Campus Fryslân, University of Groningen (the Netherlands)
2Fryske Akademy/Mercator Research Centre (the Netherlands)
3ReadSpeaker (the Netherlands)


This is the companion webpage for our paper "Strategies in Transfer Learning for Low-Resource Speech Synthesis: Phone Mapping, Features Input, and Source Language Selection", which has been accepted for presentation at the Speech Synthesis Workshop 2023.

Below we present some of the synthetic audio samples from our experiment in the 6 low-resource languages (Bulgarian, Georgian, Kazakh, Swahili, Urdu, and Uzbek). For each language, we synthesized a total of 100 utterances, which were guaranteed to have a phoneme distribution as close as possible to that languages' training data (10 minutes, 160 to 200 utterances), and used them for evaluation. To avoid cluttering the page, here we only include 10 randomly-selected utterances as examples for each language.

1. Bulgarian

# Text Ground-truth English (en-US) Finnish (fi) Hindu (hi) Japanese (ja) Russian (ru)
Nomap Map Feature Nomap Map Feature Nomap Map Feature Nomap Map Feature Nomap Map Feature
1 понякога, като разбереше какво я пита кметът, отговаряше с една-две думи. s
2 и всички гледаха към султана и чакаха какво ще каже.
3 чуват ли се там песни, свирят ли гайди, кавали?
4 тежко и горко на моето пътувание!
5 останали бяха сухи утъпкани кръгове, загаснали огньове, дрипи.
6 баба яна стана, прозина се, протегна се, като че беше забравила лудориите на гърбавото.
7 когато се касае за душата - колко пари чинат дрехите?
8 и много ми е жал за този ръкопис.
9 булка, остави мотиката и почини си!
10 огнянов забележи техните измършавели и хлътнали лица.

2. Georgian

# Text Ground-truth English (en-US) Finnish (fi) Hindu (hi) Japanese (ja) Russian (ru)
Nomap Map Feature Nomap Map Feature Nomap Map Feature Nomap Map Feature Nomap Map Feature
1 სოფელი უკვე შუა საუკუნეებიდან თავისი თეთრი ლუდით იყო განთქმული.
2 აქვს გასასვლელი ადრიატიკის ზღვაზე.
3 აკრძალული ჰქონდა თბილისში ცხოვრება.
4 მათი ურთიერთობა თანდათან დრამატულ ხასიათს იღებს.
5 ძველ მსოფლიოში ნაწნავს არა მარტო ქალები იკეთებდნენ.
6 სამხრეთი კალთები ციცაბოდ ეშვება ალაის ხეობისკენ.
7 დაამთავრა ხაზარის უნივერსიტეტი სპეციალობით ეკონომიკა და მართვა.
8 მწვერვალები უმეტესწილად ბრტყელია.
9 კონტინენტურ დანიას უკავშირდება ზღვაში გაკეთებული დამბის გზით.
10 სკოტი და ალექსი ამგვარად დაუსხლტა შიარის იმპერიას.

3. Kazakh

# Text Ground-truth English (en-US) Finnish (fi) Hindu (hi) Japanese (ja) Russian (ru)
Nomap Map Feature Nomap Map Feature Nomap Map Feature Nomap Map Feature Nomap Map Feature
1 жалғыз иттің үргені білінбес, жалғыз кісінің жүргені білінбес.
2 отансыз да бір, опасыз да бір.
3 жаманның ақылы түстен кейін, жақсының қадірі істен кейін.
4 ғылымнан білім зор, білімсіз ғылым - қор.
5 мейірімділік жүректен, мейірімсіздік білектен.
6 алдамшыда ар болмас.
7 құлпырған жас - гүлденген өмір.
8 кәсіпсіз нәсіп жоқ.
9 түйедей бой бергенше, түймедей ой берсін.
10 жақсыдан айтқан ғибрат өлгеніңше ұмытылмайды.

4. Swahili

# Text Ground-truth English (en-US) Finnish (fi) Hindu (hi) Japanese (ja) Russian (ru)
Nomap Map Feature Nomap Map Feature Nomap Map Feature Nomap Map Feature Nomap Map Feature
1 manchester united haikushinda taji la ulaya licha ya kuingia fainali
2 wazigua na wanguu pia ukaribu wao uko katika lugha
3 milima hii inawavutia watu wengi na mashuhuri duniani
4 biashara ya kondoo inasaidia kuboresha hali ya uchumi
5 na liporejea nchini aliajiriwa kuwa afisa mipango visiwani zanzibari
6 kigweno ni mchanganyika wa kipare na kichaga
7 timu nyingi za hispania zinafanya vizuri ulaya
8 mandela akachaguliwa kwa wingi kukiongoza chama chake
9 aliyehamia uislamu mnamo elfu moja mia tisa na kumi
10 uwekezaji katika mashirika yasiyozalisha kubanwa kwa sekta binafsi na kufujwa kwa pesa za umma

5. Urdu

# Text Ground-truth English (en-US) Finnish (fi) Hindu (hi) Japanese (ja) Russian (ru)
Nomap Map Feature Nomap Map Feature Nomap Map Feature Nomap Map Feature Nomap Map Feature
1 آئندہ کا نقشہ محکمہ زراعت اورمنصفین کو مل بیٹھ کر بنانا چاہیے
2 سال کے لیے پالتو خوراک حجم سطح کے برابر تھا کمپنی نے کہا
3 پاکستانی ہیئر ای
4 میرے جوتے پالش کروا دیجئے
5 اب ہمیں نہ ملے تو ہماری کم علمی اور کم عقلی
6 تو میں تب بھی خاموش رہا
7 اسک ڈائیونگ تو بہر حال ایک خطر کھیل ہے
8 مسلمان ممالک مل کر بھی شام کو خود سے سبق نہیں سکھا سکتے
9 شجرکاری مہم تصاویر کو پسند کیا گیا 1
10 اللہ ہی واپسی کا دروازہ رکھے

6. Uzbek

# Text Ground-truth English (en-US) Finnish (fi) Hindu (hi) Japanese (ja) Russian (ru)
Nomap Map Feature Nomap Map Feature Nomap Map Feature Nomap Map Feature Nomap Map Feature
1 jizzax viloyati xabarlari - qisqa satrlarda
2 qo'rqoqlik qilmang.
3 keyin menga yo'qol, deb eski botinkani otib yubordi
4 asta-sekin men sening naqadar g'amgin va yakrang hayot kechirganingni anglab yetdim.
5 hozir bu choralar tatbiq etilganidan biroz vaqt o'tib, orttirilgan tajribadan kelib chiqiladi.
6 chag'ir toshli olis yo'llardan
7 beshikka onasining qo'llari cho'zilgan
8 menga aytib berishni xohlagan, biron gaping bormi?
9 jar yoqasiga yaqin kelib qolgan uyda yashovchi oila avvalo nima qilishi kerak?
10 toshkent qamoqxonasi. usmon nosir.