Liste böser Wörter/Schimpfwörter, etc.

  • Ich wollte mal fragen ob wer eine Liste böser Wörter bzw. Schimpfwörter etc. hat. Bräuchte so eine Liste, um Nachrichten, die eines der Wörter aus der Liste hat nicht anzuzeigen bzw. die Wörter nicht anzuzeigen also wärs ideal wenn die Liste auch Sachen wie A*sch oder so was beinhalten würd.

    Wäre sehr froh, wenn wer so was hätte! Danke gleich im Voraus (auch für Tipps wo ich sowas bekommen könnte).

  • Ich hätt verdammt noch mal sowas aber gibs dir verfickt noch einmal nicht, weil die Idee Scheiße - nein: zum Kotzen - ist :p

    Gibt nichts beschisseneres als ein Spiel oder Channel in den man nicht mal fuck reinschreiben kann.

  • Zitat von JohnFoo

    Ich hätt verdammt noch mal sowas aber gibs dir verfickt noch einmal nicht, weil die Idee Scheiße - nein: zum Kotzen - ist :p

    Gibt nichts beschisseneres als ein Spiel oder Channel in den man nicht mal fuck reinschreiben kann.

    Es geht auch nicht um Spiel oder Channel, sondern um eine SMS-Wall, und da möcht ich nicht die ärgsten Beschimpfungen haben. Mir ist auch klar dass man solche Filter immer umgehen kann, aber wenn die Leute schon was extremes reinschreiben wollen, dann sollens wenigstens ein bissl nachdenken müssen :p

  • Zitat von NoUse

    Ich wollte mal fragen ob wer eine Liste böser Wörter bzw. Schimpfwörter etc. hat. Bräuchte so eine Liste, um Nachrichten, die eines der Wörter aus der Liste hat nicht anzuzeigen bzw. die Wörter nicht anzuzeigen...

    mit den wirklich häufig gebrauchten wörtern kann ich dir zwar auch nicht weiterhelfen, aber ich habe diese liste mit eher ausgefallenen begriffen, falls ich mich mal bei softwarebetreibern beschweren muss, weil sie wörter, die zu meinem grundwortschaft gehören (wie z.b scheisse) aus meinen beiträgen filtern. ;)

    Zitat von NoUse

    ...also wärs ideal wenn die Liste auch Sachen wie A*sch oder so was beinhalten würd.

    stamming nennt sich das: wörter auf ihren stamm zurück führen (z.b aufgrund des wortes arsch auch ärsche, ärschficker, ar*sch zu erkennen ).

    lucene kann das.

  • Also ich hab jetzt ein paar Listen auch gefunden, jetzt hab ich eine andere Frage:

    Die Abfrage muss ja relativ häufig ausgeführt werden, wie ist das am gscheitesten? Im Prinzip hab ich drei Möglichkeiten wo ich mal den Filter starte: Ich lass das ganze vom Java aus laufen (da werden auch die SMS ausgelesen), oder in der Access-Datenbank, oder vom PowerPoint aus (wo ich die Nachrichten ausles).

    Und dann ist noch die Frage, wie ichs mach, mit einem Array, Vector, oder in der Datenbank mit einer Tabelle, die die Wörter enthält?

    Oder gibts eine ganz andere Möglichkeit (vielleicht das Array sortieren und binäre Suche drüberrennen lassen, und dann so in der Art Heuristik, dass z.B. wenn nur 1 Buchstabe verschieden ist, das Wort auch gefiltert wird)?

    Bin für alle Tipps dankbar!

Jetzt mitmachen!

Sie haben noch kein Benutzerkonto auf unserer Seite? Registrieren Sie sich kostenlos und nehmen Sie an unserer Community teil!