Sono stati effettuati vari esperimenti per mettere a confronto le varie tecnologie di adattamento al parlatore esposte nel paragrafo (5.1), mettendone in rilievo pregi e difetti.
Sono stati eseguiti i eseguiti esperimenti:
- si è analizzato il miglioramento delle prestazioni di riconoscimento al variare del numero di frasi di addestramento di uno specifico parlatore (sezione 6.1.3)
- si è ripetuto l'esperimento del punto precedente al variare del learning rate (sezione 5.2.2)
- si è fatto variare il numero di epoche di addestramento (sezione 5.2.3)
I risultati verranno forniti in termini di word-accuracy.
Nel riconoscimento vocale esistono diversi modi per analizzare le prestazioni di una rete. Il modo più intuitivo è quello di rilevare la percentuale di parole o di fonemi che vengono correttamente riconosciuti (corrects) confrontando la frase riconosciuta con quella corretta. Durante il riconoscimento alcune parole non sono rilevate (deletions) mentre altre vengono inserite, (insertions), anche se non esistono. Per tenere traccia di queste circostanze si usa come unità di misura la word-accuracy: che tiene conto della somma dei tre errori sopra esposti:
 |
(5.4) |
Subsections
Stefano Scanzio
2007-10-16