• Generell geht das gar nicht. Wenn man gewisse Dinge über eine Datei weiß (zB, in welcher Sprache sie verfasst wurde), kann man Heuristiken anwenden, die dann eine gewisse Wahrscheinlichkeit berechnen, dass eine Datei in einem bestimmten Encoding ist (durch Vergleichen der Häufigkeit von Codepunkten in der Datei mit der Häufigkeit von Zeichen in dieser Sprache).
    UTF-8 ist das einzige (übliche) Encoding, das auch fehlschlagen kann, weil es gewisse Bytefolgen gibt, die in diesem Encoding einfach nicht zulässig sind. Hilft einem aber auch nicht wirklich weiter.
    UTF-16 hat normalerweise eine BOM davor, das ist FFFE oder FEFF (je nach byte ordering), an dem kann mans ganz gut erkennen (weil das in anderen Encodings eine recht unübliche Bytefolge ist).

    [font=verdana,sans-serif]"An über-programmer is likely to be someone who stares quietly into space and then says 'Hmm. I think I've seen something like this before.'" -- John D. Cock[/font]

    opentu.net - freier, unzensierter Informationsaustausch via IRC-Channel!
    Hilfe und Support in Studienangelegenheiten, gemütliches Beisammensein, von und mit Leuten aus dem Informatik-Forum!

    Einmal editiert, zuletzt von hal (25. August 2008 um 18:24)

  • ok, ich dachte bei jeder datei is explizit angeben in welchen zeichensatz die datei abgespeichert ist. so wie bei webpages fesgelegt wird welchen zeichensatz sie entsprechen.

    konkret gehts darum dass netbeans bei php-entwicklung immer die umlaute in unlesbare sonderzeichen umwandelt wenn ich netbeans schließe, ohne die datei vorher zu schließen. hatte das schonmal jemand?


    danke,
    andi

  • Viele Editoren (vim und emacs zumindest) erlauben es, ganz am Anfang der Datei als Kommentar anzugeben, welches encoding das file hat. Das ist zwar auch nicht 100% korrekt (der header an sich braucht ja auch schon ein encoding, und wo steht dieses dann?), aber funktioniert in der Praxis ganz gut.

    Manche Dateisysteme erlauben es, das encoding explizit als metadata anzugeben (speziell BeFS auf BeOS und HFS+ auf Mac OS X), aber das ist noch nicht sehr verbreitet.

    Meine Kurzrecherche zu Netbeans hat ergeben, dass man das irgendwo in den Projekteinstellungen einstellen kann.

    [font=verdana,sans-serif]"An über-programmer is likely to be someone who stares quietly into space and then says 'Hmm. I think I've seen something like this before.'" -- John D. Cock[/font]

    opentu.net - freier, unzensierter Informationsaustausch via IRC-Channel!
    Hilfe und Support in Studienangelegenheiten, gemütliches Beisammensein, von und mit Leuten aus dem Informatik-Forum!

Jetzt mitmachen!

Sie haben noch kein Benutzerkonto auf unserer Seite? Registrieren Sie sich kostenlos und nehmen Sie an unserer Community teil!