hallo,
kennt wer ein tool um die encodierung einer datei rauszufinden?
danke,
andi
hallo,
kennt wer ein tool um die encodierung einer datei rauszufinden?
danke,
andi
'file' bzw 'enca'
hi,
is leider windows
hi,
is leider windows
hey cygwin kenn ich
es muss doch auch für windows ein tool geben, das mir anzeigt, mit welchen zeichensatz eine datei abgespeichert ist.
hat noch nie jemand sowas gebraucht?
Generell geht das gar nicht. Wenn man gewisse Dinge über eine Datei weiß (zB, in welcher Sprache sie verfasst wurde), kann man Heuristiken anwenden, die dann eine gewisse Wahrscheinlichkeit berechnen, dass eine Datei in einem bestimmten Encoding ist (durch Vergleichen der Häufigkeit von Codepunkten in der Datei mit der Häufigkeit von Zeichen in dieser Sprache).
UTF-8 ist das einzige (übliche) Encoding, das auch fehlschlagen kann, weil es gewisse Bytefolgen gibt, die in diesem Encoding einfach nicht zulässig sind. Hilft einem aber auch nicht wirklich weiter.
UTF-16 hat normalerweise eine BOM davor, das ist FFFE oder FEFF (je nach byte ordering), an dem kann mans ganz gut erkennen (weil das in anderen Encodings eine recht unübliche Bytefolge ist).
ok, ich dachte bei jeder datei is explizit angeben in welchen zeichensatz die datei abgespeichert ist. so wie bei webpages fesgelegt wird welchen zeichensatz sie entsprechen.
konkret gehts darum dass netbeans bei php-entwicklung immer die umlaute in unlesbare sonderzeichen umwandelt wenn ich netbeans schließe, ohne die datei vorher zu schließen. hatte das schonmal jemand?
danke,
andi
Viele Editoren (vim und emacs zumindest) erlauben es, ganz am Anfang der Datei als Kommentar anzugeben, welches encoding das file hat. Das ist zwar auch nicht 100% korrekt (der header an sich braucht ja auch schon ein encoding, und wo steht dieses dann?), aber funktioniert in der Praxis ganz gut.
Manche Dateisysteme erlauben es, das encoding explizit als metadata anzugeben (speziell BeFS auf BeOS und HFS+ auf Mac OS X), aber das ist noch nicht sehr verbreitet.
Meine Kurzrecherche zu Netbeans hat ergeben, dass man das irgendwo in den Projekteinstellungen einstellen kann.
danke für die info - das hab ich studium wohl nicht ganz mitgekriegt.
bei netbeans kann man bei den project settings die encodierung einstellen - das war auch korrekt auf utf-8 eingestellt, mittlerweile stellte sich raus, das ein bug in der serialisieren der selektierten datei ist
http://www.netbeans.org/issues/show_bug.cgi?id=144694
liebe grüße
andi
Sie haben noch kein Benutzerkonto auf unserer Seite? Registrieren Sie sich kostenlos und nehmen Sie an unserer Community teil!