Character encoding (文字エンコーディング)

エンコーディングはバイト列と文字を対応付けるものです。バイトの並びは文字としてさまざまに解釈できます。特定のエンコーディング(UTF-8 など)を設定することで、バイトの並びがどのように解釈されるかを定めることができます。

例えば、 HTML ではふつう以下のような行を使って UTF-8 の文字エンコーディングを宣言します。

html
<meta charset="utf-8" />

これで HTML 文書であらゆる自然言語の文字を使用できるようになり、確実に表示されるようになります。

関連情報

一般知識