Standaard Boekhandel gebruikt cookies en gelijkaardige technologieën om de website goed te laten werken en je een betere surfervaring te bezorgen.
Hieronder kan je kiezen welke cookies je wilt inschakelen:
Technische en functionele cookies
Deze cookies zijn essentieel om de website goed te laten functioneren, en laten je toe om bijvoorbeeld in te loggen. Je kan deze cookies niet uitschakelen.
Analytische cookies
Deze cookies verzamelen anonieme informatie over het gebruik van onze website. Op die manier kunnen we de website beter afstemmen op de behoeften van de gebruikers.
Marketingcookies
Deze cookies delen je gedrag op onze website met externe partijen, zodat je op externe platformen relevantere advertenties van Standaard Boekhandel te zien krijgt.
Je kan maximaal 250 producten tegelijk aan je winkelmandje toevoegen. Verwijdere enkele producten uit je winkelmandje, of splits je bestelling op in meerdere bestellingen.
Vergleich des Ein usses impliziten und expliziten Lernens der Lautdauer auf die Verständlichkeit und Natürlichkeit von Sprachsynthese in neuronalen Systemen
Vergleich des Ein usses impliziten und expliziten Lernens der Lautdauer auf die Verständlichkeit und Natürlichkeit von Sprachsynthese in neuronalen Systemen
Sprachsynthese (Text-to-Speech, TTS) bezeichnet die computergestützte Umwandlung von Text in Sprache, wobei Verständlichkeit und Natürlichkeit zentrale Qualitätskriterien sind. Neuronale Ansätze haben die Sprachqualität in den letzten Jahren deutlich verbessert, ermöglichen jedoch bislang keine präzise Kontrolle der Lautdauer auf Phonemebene.Diese Arbeit untersucht, ob ein neuronales TTS-System bereits während des Trainings explizit lernen sollte, die Lautdauer auf Phonemebene zu steuern, oder ob ein rein implizites Lernen aus umfangreichen Sprachdaten ausreicht. Hierfür wurde ein bestehendes TTS-System erweitert, um mithilfe automatischer Lautdauerannotation explizit zu lernen. Dazu erfolgten eine phonemische Transkription der Aufnahmen, die zeitliche Ausrichtung sowie die Einteilung der Lautdauern in vier Quantile.Eine subjektive Evaluation über Amazon Mechanical Turk zeigte, dass der explizite Ansatz für Englisch die Natürlichkeit bei gleichbleibender Verständlichkeit hochsignifikant verbesserte. Objektive Messungen stützten die qualitative Überlegenheit des expliziten Ansatzes. Eine ergänzende Nebenstudie belegte zudem, dass mit beiden Ansätzen auch für Mandarin eine natürliche und verständliche Sprache erzeugt werden konnte.Die Methode erhöht die Steuerbarkeit und Natürlichkeit neuronaler Sprachsynthese und eröffnet neue Möglichkeiten für die linguistische Forschung.