文字コード変換ツール
テキストのUTF-8バイト列・Unicodeコードポイント・HTML実体参照・URLエンコードを一括表示するオンラインツール。全処理ローカル完結。
テキスト入力
サンプル:
各エンコードについて
UTF-8 バイト列
Unicodeを可変長(1〜4バイト)で表現。ASCII文字は1バイト、日本語は3バイト、絵文字は4バイト。
Unicodeコードポイント
各文字に割り当てられた一意の番号。U+0041は「A」、U+3042は「あ」。U+10000以降はサロゲートペア。
HTML実体参照
HTML内で特殊文字を安全に表示するための記法。& → &、< → <など。
URLエンコード
URLで使えない文字を%XX形式で表現。スペースは%20、日本語は%E3%81%82(あ)など。