utf16 文字 コード
UTF-16 编码表
Unicode 中的一个编码区段,编码从 U+0000 至 U+FFFF,也称基本多文种平面(Basic Multilingual Plane,BMP),或第零平面(Plane 0)。
Unicode 编码规定以下字符范围为控制字符,\U0000 - \U001F, \U007F, \U0080 - \U009F。 现版本为修订 4.10 版,2005 年 9 月 19 日出版。已分配编码区段为:
encoding | 説明する |
---|---|
0000-007F | C0 制御記号と基本ラテン語 (C0 Control and Basic Latin) |
0080-00FF | C1 制御記号とラテン語補足-1(C1 Control and Latin 1 Supplement) |
0100-017F | ラテン語拡張-A(Latin Extended-A) |
0180-024F | ラテン語拡張-B(Latin Extended-B) |
0250-02AF | 国際音声アルファベット拡張子(IPA Extensions) |
02B0-02FF | 空白の修飾文字(Spacing Modifiers) |
0300-036F | 組み合わせの発音記号(Combining Diacritics Marks) |
0370-03FF | ギリシャ語とコプト語 (Greek and Coptic) |
0400-04FF | キリル文字 (Cyrillic) |
0500-052F | キリル文字の補足(Cyrillic Supplement) |
0530-058F | アルメニア語(Armenian) |
0590-05FF | ヘブライ語 (Hebrew) |
0600-06FF | アラビア語(Arabic) |
0700-074F | シリア語 (Syriac) |
0750-077F | アラビア語補足 (Arabic Supplement) |
0780-07BF | モルディブ語(Thaana) |
07C0-077F | 西アフリカの書き言葉 (N'Ko) |
0800-085F | アヴェスタン州とパフラヴィー州(Avestan and Pahlavi) |
0860-087F | マンダイック |
0880-08AF | サマリア人 (Samaritan) |
0900-097F | 天城ドキュメント (Devanagari) |
0980-09FF | ベンガル語 (Bengali) |
0A00-0A7F | シーク教のテキスト (Gurmukhi) |
0A80-0AFF | グジャラート語 (Gurmukhi) |
0B00-0B7F | オリヤ文字(Gujarati) |
0B80-0BFF | タミル語(Oriya) |
0C00-0C7F | テルグ語(Tamil) |
0C80-0CFF | カンナダ語(Telugu) |
0D00-0D7F | ドラヴィダ語 (Kannada) |
0D80-0DFF | シンハラ語(Malayalam) |
0E00-0E7F | タイ語(Sinhala) |
0E80-0EFF | ラオ語(Thai) |
0F00-0FFF | チベット語(Lao) |
1000-109F | ビルマ語(Tibetan) |
10A0-10FF | グルジア語 (Myanmar) |
1100-11FF | 韓国語(Georgian) |
1200-137F | エチオピア (Hangul Jamo) |
1380-139F | エチオピア語補足(Ethiopic) |
13A0-13FF | チェロキー(Ethiopic Supplement) |
1400-167F | 統一カナダ先住民シラバス (Cherokee) |
1680-169F | オガム文字(Unified Canadian Aboriginal Syllabics) |
16A0-16FF | ルーン(Ogham) |
1700-171F | タガログ語 (Tagalog) |
1720-173F | ハヌヌオ |
1740-175F | ブヒド |
1760-177F | タグバンワ |
1780-17FF | クメール語(Khmer) |
1800-18AF | モンゴル語(Mongolian) |
18B0-18FF | チャム |
1900-194F | リンブー |
1950-197F | デホン タイ(Tai Le) |
1980-19DF | 新しい Dai 言語 (New Tai Lue) |
19E0-19FF | クメール表記(Kmer Symbols) |
1A00-1A1F | ブギナ語 |
1A20-1A5F | バタク |
1A80-1AEF | ランナ |
1B00-1B7F | バリ語 (Balinese) |
1B80-1BB0 | スンダ語(Sundanese) |
1BC0-1BFF | パハウ・モン族 |
1C00-1C4F | レブチャ(Lepcha) |
1C50-1C7F | オルチキ |
1C80-1CDF | マニプール(Meithei/Manipuri) |
1D00-1D7F | 音声拡張子(Phonetic Extensions) |
1D80-1DBF | 音声学拡張補足(Phonetic Extensions Supplement) |
1DC0-1DFF | 発音記号との組み合わせ(Combining Diacritics Marks Supplement) |
1E00-1EFF | ラテン語拡張加算 (Latin Extended Additional) |
1F00-1FFF | ギリシャ語拡張(Greek Extended) |
2000-206F | 一般的な句読点 (General Punctuation) |
2070-209F | 上付き文字と下付き文字 (Superscripts and Subscripts) |
20A0-20CF | 通貨記号(Currency Symbols) |
20D0~20FF | 組み合わせ表記 (Combining Diacritics Marks for Symbols) |
2100-214F | アルファベット記号 (Letterlike Symbols) |
2150-218F | 数値形式(Number Form) |
2190-21FF | 矢印(Arrows) |
2200-22FF | 数学演算子(Mathematical Operator) |
2300-23FF | その他の工業用シンボル(Miscellaneous Technical) |
2400-243F | 制御画像 (Control Pictures) |
2440-245F | 光学識別子 (Optical Character Recognition) |
2460-24FF | 閉じた英数字(Enclosed Alphanumerics) |
2500-257F | タブ文字(Box Drawing) |
2580-259F | ブロック要素(Block Element) |
25A0-25FF | ジオメトリ(Geometric Shapes) |
2600-26FF | その他の記号 (Miscellaneous Symbols) |
2700-27BF | 記号の印刷(Dingbats) |
27C0-27EF | その他の数学表記-A(Miscellaneous Mathematical Symbols-A) |
27F0-27FF | 矢印 A を追加(Supplemental Arrows-A) |
2800-28FF | 点字モデル(Braille Patterns) |
2900-297F | 矢印 B を追加 (Supplemental Arrows-B) |
2980-29FF | その他の数学表記-B(Miscellaneous Mathematical Symbols-B) |
2A00-2AFF | 算術演算子を追加します(Supplemental Mathematical Operator) |
2B00-2BFF | その他の記号と矢印(Miscellaneous Symbols and Arrows) |
2C00-2C5F | グラゴール文字 (Glagolitic) |
2C60-2C7F | ラテン語拡張子-C(Latin Extended-C) |
2C80-2CFF | 古代エジプト人 (Coptic) |
2D00-2D2F | グルジア語補足(Georgian Supplement) |
2D30-2D7F | ティフィナバン(Tifinagh) |
2D80-2DDF | エチオピア拡張子(Ethiopic Extended) |
2E00-2E7F | 追加の句読点(Supplemental Punctuation) |
2E80-2EFF | CJK ラジカル サプリメント(CJK Radicals Supplement) |
2F00-2FDF | 康熙辞典部首(Kangxi Radicals) |
2FF0-2FFF | 表意文字記述子(Ideographic Description Characters) |
3000-303F | CJK 記号と句読点(CJK Symbols and Punctuation) |
3040-309F | ひらがな(Hiragana) |
30A0-30FF | カタカナ(Katakana) |
3100-312F | ふりがな(Bopomofo) |
3130-318F | 韓国語互換文字 (Hangul Compatibility Jamo) |
3190-319F | 絵文字注釈マーク(Kanbun) |
31A0-31BF | 発音アルファベット拡張(Bopomofo Extended) |
31C0-31EF | CJK ストローク(CJK Strokes) |
31F0-31FF | カタカナ音声展開 (Katakana Phonetic Extensions) |
3200-32FF | クローズされた CJK テキストと月(Enclosed CJK Letters and Months) |
3300-33FF | CJK 互換(CJK Compatibility) |
3400-4DBF | CJK 統一表意文字拡張 A(CJK Unified Ideographs Extension A) |
4DC0-4DFF | 易経の 64 のヘキサグラム シンボル(Yijing Hexagrams Symbols) |
4E00-9FBF | CJK 統一表意文字(CJK Unified Ideographs) |
A000-A48F | イ音節 (Yi Syllables) |
A490-A4CF | Yi 文字ルート(Yi Radicals) |
A500-A61F | ヴァイ |
A660-A6FF | 統一カナダ先住民シラバス補足(Unified Canadian Aboriginal Syllabics Supplement) |
A700-A71F | トーン修飾文字(Modifier Tone Letters) |
A720-A7FF | ラテン語拡張子-D(Latin Extended-D) |
A800-A82F | シロティ・ナグリ |
A840-A87F | パシーバキャラ(Phags-pa) |
A880-A8DF | サウラーシュトラ州 |
A900-A97F | ジャワ語(Javanese) |
A980-A9DF | チャクマ |
AA00-AA3F | ヴァラン・クシティ |
AA40-AA6F | ソラン・ソンペン |
AA80-AADF | ネワーリ |
AB00-AB5F | ベトナム語 Dai (Việt TháI) |
AB80-ABA0 | カヤー・リー |
AC00-D7AF | 韓国語の音節(Hangul Syllables) |
D800-DBFF | UTF-16のハイハーフゾーン |
DC00-DFFF | UTF-16の下位ハーフゾーン |
E000-F8FF | 自己利用エリア(Private Use Zone) |
F900-FAFF | CJK 互換象形文字(CJK Compatibility Ideographs) |
FB00-FB4F | 文字式(Alphabetic Presentation Form) |
FB50-FDFF | アラビア語表現形式 A(Arabic Presentation Form-A) |
FE00-FE0F | 変数セレクター(Variation Selector) |
FE10-FE1F | 縦型フォーマット(Vertical Forms) |
FE20-FE2F | 半シンボルの結合(Combining Half Marks) |
FE30-FE4F | CJK 互換形式(CJK Compatibility Forms) |
FE50-FE6F | 小型バリエーション(Small Form Variants) |
FE70-FEFF | アラビア語表現 B(Arabic Presentation Form-B) |
FF00-FFEF | ハーフタイプおよびフルタイプの形式(Halfwidth and Fullwidth Form) |
FFF0-FFFF | 特殊(Specials) |
主な機能:
- 文字検索: ユーザーが特定の文字の UTF-16 エンコーディングをすばやく見つけて理解できる便利なインターフェイスを提供します。
- Unicode ブロック: カテゴリに文字を表示することで、ユーザーは特定の Unicode ブロックを参照し、関連する文字セットについて学ぶことができます。
- 詳細: 文字名、Unicode コード ポイント、UTF-16 エンコーディングでの文字の表現など、各文字の詳細情報を提供します。
- 検索機能: キーワードで文字を検索できるため、検索プロセスがより柔軟かつ効率的になります。
使用するシーン:
- 開発者ツール: 開発者は、このエンコード テーブルを使用して、文字エンコード関連の問題のトラブルシューティングを行い、アプリケーションがさまざまな文字を正しく処理できることを確認できます。
- 学術研究: 学者や研究者は、このツールを使用して Unicode 文字セットについての洞察を得て、研究で正しい文字エンコーディングを引用することができます。
- 教育: 教育者は、これを教育リソースとして使用して、学生が文字エンコーディングに関する基本概念を学習できるようにすることができます。
注: UTF-16 エンコーディング テーブルは、ユーザーが UTF-16 文字エンコーディングを理解して使用できるように設計された便利なリファレンス ツールです。 直感的なインターフェイスと豊富な情報を提供することにより、文字エンコーディングの問題に対処するために不可欠なリソースになります。