Namespaces
Variants

std:: mbrtowc

From cppreference.net
Definiert in Header <cwchar>
std:: size_t mbrtowc ( wchar_t * pwc,

const char * s,
std:: size_t n,

std:: mbstate_t * ps ) ;

Wandelt ein schmales Multibyte-Zeichen in ein Breitzeichen um.

Wenn s kein Nullzeiger ist, untersucht die Funktion maximal n Bytes der Multibyte-Zeichenkette, beginnend mit dem von s gezeigten Byte, um die Anzahl der Bytes zu bestimmen, die zur Vervollständigung des nächsten Multibyte-Zeichens (einschließlich aller Shift-Sequenzen) erforderlich sind. Wenn die Funktion feststellt, dass das nächste Multibyte-Zeichen in s vollständig und gültig ist, konvertiert sie es in das entsprechende Breitzeichen und speichert es in * pwc (falls pwc nicht null ist).

Wenn s ein Nullzeiger ist, werden die Werte von n und pwc ignoriert und der Aufruf entspricht std :: mbrtowc ( nullptr, "" , 1 , ps ) .

Wenn das erzeugte Breitzeichen das Nullzeichen ist, ist der in * ps gespeicherte Konvertierungszustand der anfängliche Schaltzustand.

Inhaltsverzeichnis

Parameter

pwc - Zeiger auf die Position, an der das resultierende Breitzeichen geschrieben wird
s - Zeiger auf die als Eingabe verwendete Multibyte-Zeichenkette
n - Grenze für die Anzahl der Bytes in s, die untersucht werden können
ps - Zeiger auf den Konvertierungsstatus, der bei der Interpretation der Multibyte-Zeichenkette verwendet wird

Rückgabewert

Das erste der folgenden zutreffenden Kriterien:

  • 0 falls das von s konvertierte Zeichen (und in pwc gespeichert, falls nicht null) das Nullzeichen war.
  • die Anzahl der Bytes [ 1 ... n ] des Multibyte-Zeichens, das erfolgreich von s konvertiert wurde.
  • static_cast < std:: size_t > ( - 2 ) falls die nächsten n Bytes ein unvollständiges, aber bisher gültiges Multibyte-Zeichen bilden. Nichts wird nach * pwc geschrieben.
  • static_cast < std:: size_t > ( - 1 ) falls ein Kodierungsfehler auftritt. Nichts wird nach * pwc geschrieben, der Wert EILSEQ wird in errno gespeichert und der Wert von * ps bleibt unspezifiziert.

Beispiel

#include <clocale>
#include <cstring>
#include <cwchar>
#include <iostream>
void print_mb(const char* ptr)
{
    std::mbstate_t state = std::mbstate_t(); // initial state
    const char* end = ptr + std::strlen(ptr);
    int len;
    wchar_t wc;
    while ((len = std::mbrtowc(&wc, ptr, end-ptr, &state)) > 0)
    {
        std::wcout << "Next " << len << " bytes are the character " << wc << '\n';
        ptr += len;
    }
}
int main()
{
    std::setlocale(LC_ALL, "en_US.utf8");
    // UTF-8 narrow multibyte encoding
    const char* str = "z\u00df\u6c34\U0001d10b"; // or u8"zß水𝄋"
                      // or "\x7a\xc3\x9f\xe6\xb0\xb4\xf0\x9d\x84\x8b";
    print_mb(str);
}

Ausgabe:

Next 1 bytes are the character z
Next 2 bytes are the character ß
Next 3 bytes are the character 水
Next 4 bytes are the character 𝄋

Siehe auch

wandelt das nächste Multibyte-Zeichen in ein Breitzeichen um
(Funktion)
wandelt ein Breitzeichen in seine Multibyte-Darstellung um, mit Zustand
(Funktion)
[virtual]
konvertiert einen String von ExternT zu InternT , z.B. beim Lesen aus einer Datei
(virtuelle geschützte Memberfunktion von std::codecvt<InternT,ExternT,StateT> )
C-Dokumentation für mbrtowc