UTF-8-Stream zeichenweise auslesen

  • Hallo,

    kann mir jemand sagen wie ich einen UTF-8 Stream Zeichenweise auslesen kann.

    also wenn ich z.b. habe:

    UTF8-String: "m#;23ller"

    wie kann dann die utf-8 zeichen einzeln zurückbekommen.

    also:
    zeichen1: m
    zeichen2: #;23 (fiktiv für das "ü")
    zeichen3: l
    zeichen4: l
    zeichen5: e
    zeichen6: r


    vielen dank.

    lg, robert

  • - Java kann von Haus aus
    - C# kann von Haus aus
    - Für C/C++ gibts ICU (auch in einer Java-Version verfügbar: ICU4j), das sollte mit ein bisschen Glück deinen Bedarf abdecken
    - Für C++ muss ich außerdem noch Qt empfehlen, welches es auch voll drauf hat

    Alternativerweise könnte ich dir einen Lexer mit Flex basteln, der die Zeichen unterscheiden kann und einzeln zurückgibt, aber da hab ich grad keine Lust drauf :rolleyes:

    "Egbert B. Gebstadter is the Egbert B. Gebstadter of indirect self-reference." - Egbert B. Gebstadter

Jetzt mitmachen!

Sie haben noch kein Benutzerkonto auf unserer Seite? Registrieren Sie sich kostenlos und nehmen Sie an unserer Community teil!