Skip to content

Latest commit

 

History

History
288 lines (283 loc) · 6.97 KB

supervised.md

File metadata and controls

288 lines (283 loc) · 6.97 KB

supervised testing performance

The following 276 languages have at least 50 entries in the Wikitionary. Those languages are supervised trained.

They are tested on the last 25 unseen words (the other 25 were used as dev). You should be able to reproduce this table by using transphone.bin.eval_g2p

  • The average phoneme error rate is 0.13
  • the average phonological distance is 0.05.
language phoneme error rate phonological distance
aar 0.006 0.006
abk 0.266 0.162
acw 0.182 0.122
ady 0.103 0.052
afb 0.174 0.091
afr 0.051 0.013
ain 0.033 0.021
ajp 0.111 0.073
akk 0.163 0.045
ale 0.014 0.003
alr 0.020 0.020
ang 0.016 0.000
aot 0.008 0.008
apw 0.184 0.074
arb 0.105 0.052
arc 0.232 0.138
ary 0.083 0.057
arz 0.244 0.109
asm 0.033 0.010
ast 0.089 0.037
ayl 0.138 0.055
azg 0.125 0.102
azj 0.076 0.042
bak 0.267 0.267
bam 0.487 0.087
ban 0.057 0.023
bbl 0.192 0.048
bcl 0.117 0.072
bdq 0.027 0.027
bel 0.000 0.000
ben 0.093 0.028
bod 0.111 0.054
bre 0.325 0.079
bsq 0.857 0.350
bul 0.056 0.012
cab 0.195 0.052
cat 0.009 0.001
cbn 0.198 0.039
ceb 0.089 0.055
ces 0.000 0.000
chb 0.062 0.035
che 0.158 0.050
cho 0.182 0.123
chv 0.393 0.042
ckb 0.068 0.052
cnk 0.000 0.000
cop 0.127 0.091
cor 0.112 0.013
cos 0.150 0.026
crk 0.011 0.011
crx 0.900 0.156
csb 0.301 0.105
cym 0.092 0.016
dan 0.181 0.067
deu 0.030 0.018
dhv 0.321 0.108
dlm 0.034 0.004
dng 0.193 0.079
dsb 0.007 0.000
dum 0.111 0.058
dzo 0.274 0.151
egl 0.186 0.013
egy 0.137 0.067
ekk 0.038 0.014
ell 0.010 0.003
eng 0.114 0.052
enm 0.103 0.039
eus 0.028 0.013
ewe 0.201 0.070
fao 0.062 0.022
fin 0.000 0.000
fra 0.017 0.013
fro 0.191 0.049
frr 0.171 0.049
fry 0.128 0.031
gla 0.141 0.034
gle 0.091 0.021
glg 0.104 0.003
glv 0.156 0.055
gml 0.147 0.063
goh 0.174 0.044
got 0.018 0.009
grc 0.000 0.000
gsw 0.075 0.020
guj 0.189 0.055
gur 0.392 0.125
hat 0.074 0.040
haw 0.161 0.148
hbs 0.010 0.000
heb 0.183 0.055
hif 0.299 0.098
hin 0.006 0.006
hrx 0.069 0.041
hts 0.046 0.034
hun 0.000 0.000
huu 0.037 0.037
hye 0.028 0.010
ilo 0.075 0.025
ind 0.054 0.012
inh 0.276 0.072
isl 0.043 0.008
ita 0.019 0.001
izh 0.129 0.026
jam 0.158 0.060
jje 0.098 0.076
kal 0.021 0.017
kan 0.178 0.075
kas 0.089 0.044
kat 0.000 0.000
kaz 0.098 0.016
kbd 0.126 0.072
kgj 0.475 0.118
khb 0.131 0.060
khw 0.356 0.140
kik 0.023 0.016
kir 0.041 0.010
kld 0.049 0.006
kmr 0.000 0.000
knn 0.255 0.032
kor 0.407 0.396
kpv 0.047 0.025
krl 0.131 0.087
kxd 0.013 0.002
lad 0.126 0.041
lao 0.084 0.046
lat 0.000 0.000
lav 0.105 0.033
lcp 0.080 0.051
lic 0.760 0.371
lif 0.038 0.018
lij 0.063 0.034
lim 0.185 0.066
lit 0.183 0.017
liv 0.078 0.013
lmo 0.168 0.094
lmy 0.000 0.000
lsi 0.036 0.014
ltg 0.059 0.002
ltz 0.215 0.041
lwl 0.065 0.047
mah 0.078 0.012
mai 1.250 0.560
mak 0.000 0.000
mal 0.299 0.096
mar 0.016 0.002
mdf 0.135 0.024
mfe 0.061 0.054
mga 0.169 0.035
mic 0.048 0.043
mkd 0.000 0.000
mlt 0.056 0.030
mnc 0.000 0.000
mnw 0.577 0.264
mon 0.209 0.059
mvi 0.248 0.134
mww 0.056 0.023
mya 0.116 0.040
nan 0.043 0.043
nap 0.129 0.021
nav 0.076 0.030
nci 0.025 0.017
nds 0.178 0.082
nep 0.000 0.000
new 0.056 0.021
nhg 0.032 0.019
nhn 0.189 0.167
nhx 0.018 0.018
niv 0.436 0.026
nld 0.050 0.006
nmy 0.085 0.045
nno 0.099 0.048
nob 0.066 0.012
non 0.058 0.018
nrf 0.290 0.114
nya 0.007 0.007
oci 0.086 0.016
ofs 0.144 0.020
olo 0.155 0.019
ory 0.014 0.007
osp 0.056 0.019
osx 0.079 0.018
ota 0.331 0.105
pan 0.227 0.055
pao 0.640 0.217
pau 0.218 0.063
pbv 0.356 0.134
pcc 0.271 0.103
pdc 0.049 0.038
pes 0.188 0.057
phl 0.007 0.007
pjt 0.060 0.044
plt 0.088 0.063
pms 0.021 0.001
pol 0.000 0.000
pon 0.512 0.244
por 0.178 0.045
pox 0.008 0.008
ppl 0.041 0.035
pus 0.157 0.079
quc 0.076 0.005
raw 0.054 0.001
ron 0.029 0.008
rup 0.052 0.026
rus 0.014 0.001
rys 0.121 0.067
ryu 0.317 0.190
sah 0.046 0.022
san 0.034 0.012
sce 0.146 0.058
scn 0.153 0.058
sco 0.121 0.043
sei 0.640 0.129
sga 0.033 0.005
shn 0.060 0.060
sid 0.027 0.027
slk 0.044 0.005
slv 0.058 0.008
sme 0.050 0.003
sms 0.137 0.074
snd 0.273 0.103
spa 0.004 0.001
sqi 0.068 0.044
srn 0.048 0.035
sro 0.056 0.008
stq 0.061 0.005
svm 0.053 0.018
swa 0.007 0.001
swe 0.073 0.017
syc 0.242 0.192
syl 0.051 0.019
tam 0.006 0.006
tel 0.047 0.040
tft 0.188 0.042
tgk 0.050 0.019
tgl 0.054 0.036
tha 0.018 0.018
tkl 0.000 0.000
ton 0.000 0.000
tpw 0.191 0.162
tsn 0.390 0.107
tuk 0.121 0.016
tur 0.040 0.009
twf 0.055 0.055
tyv 0.066 0.016
tzm 0.021 0.021
tzo 0.025 0.017
ugo 0.171 0.042
uig 0.164 0.052
ukr 0.021 0.001
unm 0.328 0.126
urd 0.199 0.082
vec 0.113 0.007
vie 0.019 0.010
wau 0.040 0.008
wiy 0.047 0.015
wlo 0.222 0.101
wol 0.576 0.186
wuh 0.402 0.276
xho 0.025 0.011
xsl 0.505 0.190
xug 0.484 0.133
ybi 0.000 0.000
ycl 0.143 0.049
yid 0.077 0.016
yoi 0.274 0.152
yor 0.038 0.024
yrk 0.503 0.187
yua 0.154 0.013
yue 0.079 0.057
yux 0.067 0.014
zgh 0.115 0.115
zha 0.070 0.044
zlm 0.057 0.015
zom 0.119 0.049
zul 0.005 0.005
zza 0.015 0.015