Zum Inhalt springen

Empfohlene Beiträge

Geschrieben

Hallo an alle,

mein Problem ist, dass zwei Strings, die augenscheinlich gleich sind es doch nicht sind.

Ich habe einen String1, der aus einer XML-Datei mit Codierung utf-8 kommt:

Halldór Laxness. Aus dem Isländischen übertragen von Ernst Harthern

Ich habe einen String2, der auch aus einem XML-Stream kommt, der laut "Hersteller" auch utf-8-Codiert ist:

Halldór Laxness. Aus d. Isländ. übers. von Ernst Harthern (hier sind z. Bsp. auch die ä-Pünktchen neben dem Buchstaben)

Wenn ich beide Strings durch CW2A(CP_UTF8) schicke erhalte ich folgendes:

String1: Halldór Laxness. Aus dem Isländischen übertragen von Ernst Harthern

String2: HalldoÃŒÂr Laxness. Aus d. Isländ. übers. von Ernst Harthern

Beides ist wohl sachlich richtig. Wie bekomme ich aber den String2 in das Format von String1, damit ich die vergleichen kann bzw. finde ich in String2 nicht String2.Find(L"Isländ.").

Genutzt wird VC++ 2010, UNICODE, MFC.

Geschrieben

So ist es. Das wollte ich auch gerade schreiben.

Angepasst aus der MSDN:


CString strText=L"Halldór Laxness. Aus d. Isländ. übers. von Ernst Harthern"


if(!IsNormalizedString(NormalizationC, strText, strText.GetLength()))

 {

  int iSizeGuess=0;

  LPWSTR pBuffer=NULL;


  // How big is our buffer (quick guess, usually enough) 

  iSizeGuess = NormalizeString(NormalizationC, strText, -1, NULL, 0);


  while(iSizeGuess > 0)

   {

    pBuffer = (LPWSTR)malloc(iSizeGuess * sizeof(WCHAR));


    if(pBuffer)

     {

      // Normalize the string 


      int iActualSize = NormalizeString(NormalizationC, strText, -1, pBuffer, iSizeGuess);

      iSizeGuess = 0;


      if (iActualSize <= 0 && GetLastError() != ERROR_SUCCESS)

       {

        // Error during normalization 

        if (GetLastError() == ERROR_INSUFFICIENT_BUFFER)

         {

          // If the buffer is too small, try again with a bigger buffer. 

          iSizeGuess = -iActualSize;

         }//end if (GetLastError() == ERROR_INSUFFICIENT_BUFFER)


        else if (GetLastError() == ERROR_NO_UNICODE_TRANSLATION)

         {

         }//end else if (GetLastError() == ERROR_NO_UNICODE_TRANSLATION)

       }//end if (iActualSize <= 0 && GetLastError() != ERROR_SUCCESS)


      else

       {

        // Display the normalized string 

       }//end else by if (iActualSize <= 0 && GetLastError() != ERROR_SUCCESS)


      strText=pBuffer;

       // Free the buffer 

      free (pBuffer);

     }//end if(pBuffer)

    else

     {

      iSizeGuess = 0;

     }//end else by if(pBuffer)

   }//end while(iSizeGuess > 0)

 }//end if(!IsNormalizedString(NormalizationC, strKurzText, strKurzText.GetLength()))


return strText;

Man erhält dann einen String, den man auch vergleichen kann.

Erstelle ein Benutzerkonto oder melde Dich an, um zu kommentieren

Du musst ein Benutzerkonto haben, um einen Kommentar verfassen zu können

Benutzerkonto erstellen

Neues Benutzerkonto für unsere Community erstellen. Es ist einfach!

Neues Benutzerkonto erstellen

Anmelden

Du hast bereits ein Benutzerkonto? Melde Dich hier an.

Jetzt anmelden

Fachinformatiker.de, 2024 by SE Internet Services

fidelogo_small.png

Schicke uns eine Nachricht!

Fachinformatiker.de ist die größte IT-Community
rund um Ausbildung, Job, Weiterbildung für IT-Fachkräfte.

Fachinformatiker.de App

Download on the App Store
Get it on Google Play

Kontakt

Hier werben?
Oder sende eine E-Mail an

Social media u. feeds

Jobboard für Fachinformatiker und IT-Fachkräfte

×
×
  • Neu erstellen...