Emotionen in Stimmen erkennen mit PyTorch und wav2vec2

Klassifikation von Audiodaten mit Huggingface Transformers

Udemy
platform
Deutsch
language
Other
category
Emotionen in Stimmen erkennen mit PyTorch und wav2vec2
23
students
2.5 hours
content
Apr 2023
last update
$19.99
regular price

What you will learn

What Meta's wav2vec2 model is and how it can be applied to new AI tasks

How to obtain and prepare a dataset for emotion classification tasks

Write a classification model for audio classification

Train, evaluate and test a pytorch model

Why take this course?

In diesem Kurs zeige ich euch, wie ihr ein Modell trainiert, das sieben Emotionen in Sprache erkennen kann, konkret in Audiodateien des Formats wav. Die Datengrundlage schaffen wir uns, indem wir einen entsprechenden, freien Datensatz (Berlin Database of Emotional Speech) besorgen, formatieren, mit Labels versehen und in einem Dataset bereitstellen.

Für das Training selber wird Meta's wav2vec2 als Foundation Modell genutzt und gezeigt, wir du das Modell auf den Task "Audio Classification" fine-tunen kannst. Dabei setzen wir auf die wav2vec2-Modellimplementierung von Huggingface auf und fügen einen Classification Head hinzu, den wir trainieren und evaluieren. Dadurch lernt ihr nicht nur, wie ihr Emotionen erkennt, sondern auch ein Training von Grund auf aufbaut und für weitere Klassifizierungsaufgaben verwenden könnt, etwa um Autos anhand ihrer Geräusche zu erkennen oder Situationen im Fußballstadion anhand der Geräuschkulisse per KI einzuschätzen.

Ist das Modell trainiert, schreiben wir gemeinsam ein Inference-Script, um das Modell anzuwenden.  Zum Schluss werden die Ergebnisse und mögliche Verbesserungen besprochen, um das Modell treffsicherer zu machen. Ihr sehr zusätzlich, wie ihr euer fertiges Modell auf dem Huggingface Hub veröffentlichen könnt, um so Lob und Feedback einzuholen.

Als Voraussetzung solltest du in der Lage sein, Python Code zu lesen und zu schreiben und ein Grundverständnis für Deep Learning mitbringen.

Screenshots

Emotionen in Stimmen erkennen mit PyTorch und wav2vec2 - Screenshot_01Emotionen in Stimmen erkennen mit PyTorch und wav2vec2 - Screenshot_02Emotionen in Stimmen erkennen mit PyTorch und wav2vec2 - Screenshot_03Emotionen in Stimmen erkennen mit PyTorch und wav2vec2 - Screenshot_04

Related Topics

5272426
udemy ID
4/14/2023
course created date
4/21/2023
course indexed date
Bot
course submited by