Suche Statistik Algorithmus :)

  • Hey!
    Ich mag zwar Mathematik, aber Statistik ist eindeutig mein Blind-Spot dabei....

    Es geht um folgendes:
    Gegeben ist Gruppe A und Gruppe B, beide enthalten jeweils 11 Datensätze (ob das jetzt alles aussagekräftig ist oder nicht, ist mir egal ;) )
    Gruppe A und Gruppe B sind Opponenten sozusagen, Gruppe A beinhaltet Daten, bei denen ein bestimmtes Merkmal auftritt, Gruppe B beinhaltet Daten, bei denen dieses Merkmal nicht auftritt. Die Datensätze enthalten einen Wert, der genau dieses Merkmal beschreibt (ist ein Wert zw. 0 und 6, die meisten bewegen sich um 1 herum).

    Da sich, graphisch betrachtet, die Datensätze von A+B zusammen überlappen (irgendwo bei 1 oder 2), möchte ich eine Skala haben, die einen Werteberich beinhaltet, in dem nicht genau gesagt werden kann, dass ein Objekt mit diesem Wert genau zu A oder B gehört. Eben aufgrund meiner Datensätze berechnet.
    Also graphisch würde das irgendwie so aussehen:

    0 -------- hierEindeutigGruppeA ---------WertebereichAnfang---------hierKeineAussageMöglich-------------WertebereichEnde---------hiereindeutigGruppeB--------10

    So. Also ganz deppert bin ich auch nicht, ich hab natürlich schon Mittelwert und Standardabweichung berechnet, und zwar jeweils von Gruppe A, B und beiden gemeinsam. Problem ist, bei Gruppe A oder B, gebe ich 2σ (hab mich daran gehalten: http://de.wikipedia.org/wiki/Standarda…nd_Faustformeln) dazu komme ich leider unter den Wert 0, da der Mittelwert ziemlich nach an 0 liegt. Bei den Werten von Gruppe A+B erhalte ich sogar bei einfachem σ; einen Wert unter Null (einfach Mittelwert-σ = <0 )

    Wie kann ich das am besten lösen??
    Hoffe, jemand hat Lust mit dabei zu helfen :)

    Ihr glücklichen Augen, Was je ihr gesehen, Es sei wie es wolle, Es war doch so schön!

  • Naja, bist du dir sicher, dass du in dem Fall die Normalverteilung anwenden kannst? Ja, bei ausreichender Stichprobe und Grundgesamtheit nähert sich alles der Normalverteilung an, aber da ist 11 ein bisschen wenig dafür. Wenn nicht, dann legen deine Stichproben halt nahe, dass sich auch Werte im negativen Bereich befinden, weil die Verteilung ja symmetrisch um den Mittelwert ist. Zumindest bei der unteren Gruppe ist das aber ja nicht zwingend ein Problem, weil sich der gesuchte Bereich ja zwischen (Mittelwert A) + (Entsprechend multiplizierte Standardabweichung von A) und (Mittelwert B) - (Entsprechend multiplizierte Standardabweichung von B) befinden müsste, wenn ich das jetzt alles richtig verstanden habe. Wenn es ein Problem dadurch gibt, dass es Verteilungsmäßig auch negative Werte geben müsste, die es aber nicht geben darf, hast du entweder blöde Stichproben erwischt oder eine falsche Verteilungsannahme.

    Angaben ohne Gewähr

Jetzt mitmachen!

Sie haben noch kein Benutzerkonto auf unserer Seite? Registrieren Sie sich kostenlos und nehmen Sie an unserer Community teil!