itselo Geschrieben 1. Juni 2012 Geschrieben 1. Juni 2012 Guten tag zusammen, bin grad an einem Projekt verwickelt wo ich ein Extraktor für Email Dateien programmieren muss und hänge an einem speziellen Punkt, nämlich das konvertieren von hex in Ascii Zeichen. habe für diesen Vorgang eine Methode erstellt um die einzelnen hex paare in Chars umzuwandeln, nur kann meine Methode nicht alle zeichen (wie z.B. das € Zeichen) umwandeln, anstelle dieses Zeichens tauchen dann Fragezeichen auf, was daraufhin beim öffnen der extrahierten Datei, leere Inhalte dargestellt werden. Meine Frage ist, gibt es statt der variablen char auch ne andere Möglichkeit die restlichen zeichen zu lesen? MfG itselo Zitieren
Klotzkopp Geschrieben 1. Juni 2012 Geschrieben 1. Juni 2012 In welcher Zeichencodierung liegen die Daten vor, und in welcher willst du die konvertierten Daten speichern? Zitieren
itselo Geschrieben 1. Juni 2012 Autor Geschrieben 1. Juni 2012 Ich denke das es unterschiedliche zeichen sind aus verschiedenen ISO-8859 Tabellen, weil ich versuche die hex-codes z.b. aus einer .pdf-Datei in Ascii Zeichen umzuwandeln und diese dann per Filewriter in eine Default Datei zu packen um dadurch diese PDF neu zu erzeugen. Nur bestimmte Zeichen wie das € zeichen oder Y mit pünktchen, Satzzeichen usw können nicht dargestellt werden. Beim lesen der Hexcodes treten zum glück keine probleme auf nur eben bei der konvertierung in diese zeichen, passiert eben das. Zitieren
Klotzkopp Geschrieben 1. Juni 2012 Geschrieben 1. Juni 2012 Ich denke das es unterschiedliche zeichen sind aus verschiedenen ISO-8859 TabellenDenken reicht nicht, das musst du schon wissen. Nur bestimmte Zeichen wie das € zeichen oder Y mit pünktchen, Satzzeichen usw können nicht dargestellt werden.Diese Zeichen gibt es in ASCII nicht. Deine "Hexcodes" repräsentieren eine Folge von Bytes. Wenn du daraus Zeichen machen willst, musst du die Bytes als Zeichen interpretieren. Es gibt ziemlich viele Möglichkeiten, das zu tun. Diese Möglichkeiten nennt man Zeichencodierungen. Je nachdem, welche Codierung du benutzt, erzeugt dieselbe Byte-Sequenz unterschiedliche Zeichen-Sequenzen. Für die Gegenrichtung gilt dasselbe. Wenn du mit Java die Zeichen in eine Datei schreibst, wird eine bestimmte Zeichencodierung angewendet, um aus den Zeichen wieder Bytes zu machen. Und auch das Programm, mit dem du diese Datei hinterher betrachtest oder weiterverarbeitest, benutzt eine Zeichencodierung. Du musst also wissen, in welcher Codierung deine Daten vorliegen, und in welcher Codierung du sie wieder speichern willst. Zitieren
flashpixx Geschrieben 2. Juni 2012 Geschrieben 2. Juni 2012 bin grad an einem Projekt verwickelt wo ich ein Extraktor für Email Dateien programmieren muss und hänge an einem speziellen Punkt, nämlich das konvertieren von hex in Ascii Zeichen Du musst also wissen, in welcher Codierung deine Daten vorliegen, und in welcher Codierung du sie wieder speichern willst. Du solltest Dich an die Standards halten. Multipurpose Internet Mail Extensions. Generell solltest Du zuerst die passenden RFCs lesen Die Kodierung von Nicht-7-Bit-ASCII-Zeichen erfolgt häufig mittels Quoted-Printable-Kodierung, Binärdaten hingegen werden üblicherweise Base64-kodiert. [...] Alternativ ist es für Textdaten mittels Content-Transfer-Encoding: 8bit auch möglich, die nicht-ASCII-Zeichen direkt zu übertragen (die Kodierung muss dabei angegeben sein, z. B. UTF-8 oder ISO-8859-15 für deutsche Texte). Benutze ein Protokoll wie Internet Message Access Protocol um auf die Mails zuzugreifen und nutze eine entsprechende Protokollimplementation com.sun.mail.imap (JavaMail API documentation) Zitieren
Empfohlene Beiträge
Dein Kommentar
Du kannst jetzt schreiben und Dich später registrieren. Wenn Du ein Konto hast, melde Dich jetzt an, um unter Deinem Benutzernamen zu schreiben.