Audio Pattern Matching

  • Hi

    Ich kenne as Buch "Pattern Recognition and Machine Learning" einwenig aber durch die Vielzahl der Algos Blick ich schon wieder nicht durch ;)

    Wenn ich ein Audio Tmeplate habe (10 Sekunden) und ein großes Audio File (5 Minuten) und ich will schauen wie oft das Template im großen File vorkommt - welchen Algo braucht man da? Gauss Spektral Dings bums? ;)

    Danke
    LG

  • Kenn mich mit Audio-Daten nicht wirklich aus, aber für mich klingt da als simpelste Lösung einfach (Normalized?) Cross Correlation.
    Schiebst das 10 Sekunden-Fenster über das lange Signal, berechnest jeweils NCC (im Prinzip eh nur Werte miteinander multiplizieren, blöd gesagt) und schaust dir das Ergebnis an.
    Suchst den höchsten Wert und schaust ob er über einem gewissen Threshold liegt.

    Soviel zur Theorie. Praktisch gibts vermutlich hunderttausend Probleme mit der Vorgehensweise, aber vielleicht ists ein guter Anfang.

    Der beste Beginn ist natürlich mal Datensichtung: Wie siehts mitm Rauschen aus? Lineare Abhängigkeit gegeben (vermutlich schon wenn das Template einfach ein Auszug ist)? Machts Sinn, das Signal vorher zu glätten?

  • Danke für die Antwort. Cross Correlation hab ich mir auf wikipedia schon angeschaut. Ja - rauschen und Amplitudenunterschiede sind vorhanden. Komischerweise findet man nicht so viel in google - werde mal Mathlab anwerfen müssen.

    Die Frage ist, wie ein gutes Psotprocessing von Audio ausschauen muss ;) Ich kann die ganzen Algos auch nur von der Bildseite her

  • Hätte auch "gern" ein paar LVAs gegen sowas in die Richtung eingetauscht.
    Klar, währenddessen ists oft anstrengender und mühsamer als andere Dinge, aber nachher ist man froh, wenn mans hat ;)

    Für was brauchst du das=?

Jetzt mitmachen!

Sie haben noch kein Benutzerkonto auf unserer Seite? Registrieren Sie sich kostenlos und nehmen Sie an unserer Community teil!