ObiWanBelix Geschrieben 13. März 2008 Teilen Geschrieben 13. März 2008 Hallo, ich habe einen String den ich mittels einem Encoding in ein ByteArray umwandle. Jetzt kann es aber vorkommen, dass in dem String Zeichen sind die in meinem Encoding nicht erlaubt sind. Die verursacht bei mir große Schwierigkeiten. Ich suche nach einer Möglichkeit ein ByteArray nach ungültigen Zeichen in Bezug auf ein Encoding zu prüfen und diese dann auch gleich zu ersetzen. Natürlich kann ich mir vorstellen Byte für Byte durchzugehen und jedes Byte gegen das Encoding zu prüfen, aber soetwas ist doch sicherlich schon mal erfunden worden, Oder?? Vielen Dank Zitieren Link zu diesem Kommentar Auf anderen Seiten teilen Mehr Optionen zum Teilen...
TDM Geschrieben 13. März 2008 Teilen Geschrieben 13. März 2008 Warum nutzt du nicht einfach String.Replace um nach unerlaubten Zeichen zu suchen und diese zu ersetzen? Zitieren Link zu diesem Kommentar Auf anderen Seiten teilen Mehr Optionen zum Teilen...
ObiWanBelix Geschrieben 13. März 2008 Autor Teilen Geschrieben 13. März 2008 ja genau?! und wie soll dann der Replace aussehen? wie kann ich denn im Replace alle NICHT UTF-8 (oder UTF-16) angeben? Mit ner RegEx? Wie sollte die dann aussehen? Zitieren Link zu diesem Kommentar Auf anderen Seiten teilen Mehr Optionen zum Teilen...
TDM Geschrieben 13. März 2008 Teilen Geschrieben 13. März 2008 Na entweder du schreibst eigene Funktionen in der Art wie toUtf8(string str) { [INDENT]str.Replace(<böses Zeichen>, <gutes Zeichen>)[/INDENT] } Oder du "missbrauchst" den URLEncoder/URLDecoder. Allerdings bin ich mir nicht zu 100% sicher, ob das irgendwelche Performancevorteile bringt, da wäre eine Byteiteration vielleicht doch angebracht. [Edit:] Nochmal nachgeschauen, eigentlich geht's auch leichter: String myStr = "Test"; byte[] myBA = myStr.getBytes(); String myUTF8Str = new String(myBA , "UTF-8"); String myUTF16Str = new String(myBA , "UTF-16"); Zitieren Link zu diesem Kommentar Auf anderen Seiten teilen Mehr Optionen zum Teilen...
ObiWanBelix Geschrieben 14. März 2008 Autor Teilen Geschrieben 14. März 2008 Also ich werde das wohl über eine Iteration lösen müssen. Jetzt stellt sich noch die Frage wie ich jeweilks zu einem Encoding erfahre was die nicht gültigen Zeichen sind. Für jedes Byte durch den Charset des Encodings zu iterieren scheint mir nicht sinnvoll zu sein. Gibts da eine Möglichkeit? Zitieren Link zu diesem Kommentar Auf anderen Seiten teilen Mehr Optionen zum Teilen...
TDM Geschrieben 14. März 2008 Teilen Geschrieben 14. März 2008 CharsetEncoder (Java 2 Platform SE 5.0) Zitieren Link zu diesem Kommentar Auf anderen Seiten teilen Mehr Optionen zum Teilen...
ObiWanBelix Geschrieben 14. März 2008 Autor Teilen Geschrieben 14. März 2008 Danke, soetwas habe ich gesucht. Jetzt habe ich noch ein Problem: In meinem ersten Thread bin ich von eine String ausgegangen. Ich bekomme aber initial ein ByteArray. Ich würde gerne das ByteArray gegen ein Encoding prüfen. Ich werde wohl nicht darum herumkommen das BYteArray in einenS tring zu wandeln und dann mit CharsetEncoder zu prüfen oder?? Hintergrund: Ich bekomme Artikeldaten als ByteArray diese gebe diese als String mit einer bestimmten codierung weiter. Ich würde gerne das ByteArray prüfen und nicht den String. Zitieren Link zu diesem Kommentar Auf anderen Seiten teilen Mehr Optionen zum Teilen...
TDM Geschrieben 14. März 2008 Teilen Geschrieben 14. März 2008 Scroll einfach bisschen im Link, dann findest du eine Funktion isLegalReplacement Vielleicht hilft die dir ja. Zitieren Link zu diesem Kommentar Auf anderen Seiten teilen Mehr Optionen zum Teilen...
Empfohlene Beiträge
Dein Kommentar
Du kannst jetzt schreiben und Dich später registrieren. Wenn Du ein Konto hast, melde Dich jetzt an, um unter Deinem Benutzernamen zu schreiben.