Unicode to English

utf16 文字 コード

UTF-16 编码表

Unicode 中的一个编码区段,编码从 U+0000 至 U+FFFF,也称基本多文种平面(Basic Multilingual Plane,BMP),或第零平面(Plane 0)。

Unicode 编码规定以下字符范围为控制字符,\U0000 - \U001F, \U007F, \U0080 - \U009F。 现版本为修订 4.10 版,2005 年 9 月 19 日出版。已分配编码区段为:

encoding説明する
0000-007FC0 制御記号と基本ラテン語 (C0 Control and Basic Latin)
0080-00FFC1 制御記号とラテン語補足-1(C1 Control and Latin 1 Supplement)
0100-017Fラテン語拡張-A(Latin Extended-A)
0180-024Fラテン語拡張-B(Latin Extended-B)
0250-02AF国際音声アルファベット拡張子(IPA Extensions)
02B0-02FF空白の修飾文字(Spacing Modifiers)
0300-036F組み合わせの発音記号(Combining Diacritics Marks)
0370-03FFギリシャ語とコプト語 (Greek and Coptic)
0400-04FFキリル文字 (Cyrillic)
0500-052Fキリル文字の補足(Cyrillic Supplement)
0530-058Fアルメニア語(Armenian)
0590-05FFヘブライ語 (Hebrew)
0600-06FFアラビア語(Arabic)
0700-074Fシリア語 (Syriac)
0750-077Fアラビア語補足 (Arabic Supplement)
0780-07BFモルディブ語(Thaana)
07C0-077F西アフリカの書き言葉 (N'Ko)
0800-085Fアヴェスタン州とパフラヴィー州(Avestan and Pahlavi)
0860-087Fマンダイック
0880-08AFサマリア人 (Samaritan)
0900-097F天城ドキュメント (Devanagari)
0980-09FFベンガル語 (Bengali)
0A00-0A7Fシーク教のテキスト (Gurmukhi)
0A80-0AFFグジャラート語 (Gurmukhi)
0B00-0B7Fオリヤ文字(Gujarati)
0B80-0BFFタミル語(Oriya)
0C00-0C7Fテルグ語(Tamil)
0C80-0CFFカンナダ語(Telugu)
0D00-0D7Fドラヴィダ語 (Kannada)
0D80-0DFFシンハラ語(Malayalam)
0E00-0E7Fタイ語(Sinhala)
0E80-0EFFラオ語(Thai)
0F00-0FFFチベット語(Lao)
1000-109Fビルマ語(Tibetan)
10A0-10FFグルジア語 (Myanmar)
1100-11FF韓国語(Georgian)
1200-137Fエチオピア (Hangul Jamo)
1380-139Fエチオピア語補足(Ethiopic)
13A0-13FFチェロキー(Ethiopic Supplement)
1400-167F統一カナダ先住民シラバス (Cherokee)
1680-169Fオガム文字(Unified Canadian Aboriginal Syllabics)
16A0-16FFルーン(Ogham)
1700-171Fタガログ語 (Tagalog)
1720-173Fハヌヌオ
1740-175Fブヒド
1760-177Fタグバンワ
1780-17FFクメール語(Khmer)
1800-18AFモンゴル語(Mongolian)
18B0-18FFチャム
1900-194Fリンブー
1950-197Fデホン タイ(Tai Le)
1980-19DF新しい Dai 言語 (New Tai Lue)
19E0-19FFクメール表記(Kmer Symbols)
1A00-1A1Fブギナ語
1A20-1A5Fバタク
1A80-1AEFランナ
1B00-1B7Fバリ語 (Balinese)
1B80-1BB0スンダ語(Sundanese)
1BC0-1BFFパハウ・モン族
1C00-1C4Fレブチャ(Lepcha)
1C50-1C7Fオルチキ
1C80-1CDFマニプール(Meithei/Manipuri)
1D00-1D7F音声拡張子(Phonetic Extensions)
1D80-1DBF音声学拡張補足(Phonetic Extensions Supplement)
1DC0-1DFF発音記号との組み合わせ(Combining Diacritics Marks Supplement)
1E00-1EFFラテン語拡張加算 (Latin Extended Additional)
1F00-1FFFギリシャ語拡張(Greek Extended)
2000-206F一般的な句読点 (General Punctuation)
2070-209F上付き文字と下付き文字 (Superscripts and Subscripts)
20A0-20CF通貨記号(Currency Symbols)
20D0~20FF組み合わせ表記 (Combining Diacritics Marks for Symbols)
2100-214Fアルファベット記号 (Letterlike Symbols)
2150-218F数値形式(Number Form)
2190-21FF矢印(Arrows)
2200-22FF数学演算子(Mathematical Operator)
2300-23FFその他の工業用シンボル(Miscellaneous Technical)
2400-243F制御画像 (Control Pictures)
2440-245F光学識別子 (Optical Character Recognition)
2460-24FF閉じた英数字(Enclosed Alphanumerics)
2500-257Fタブ文字(Box Drawing)
2580-259Fブロック要素(Block Element)
25A0-25FFジオメトリ(Geometric Shapes)
2600-26FFその他の記号 (Miscellaneous Symbols)
2700-27BF記号の印刷(Dingbats)
27C0-27EFその他の数学表記-A(Miscellaneous Mathematical Symbols-A)
27F0-27FF矢印 A を追加(Supplemental Arrows-A)
2800-28FF点字モデル(Braille Patterns)
2900-297F矢印 B を追加 (Supplemental Arrows-B)
2980-29FFその他の数学表記-B(Miscellaneous Mathematical Symbols-B)
2A00-2AFF算術演算子を追加します(Supplemental Mathematical Operator)
2B00-2BFFその他の記号と矢印(Miscellaneous Symbols and Arrows)
2C00-2C5Fグラゴール文字 (Glagolitic)
2C60-2C7Fラテン語拡張子-C(Latin Extended-C)
2C80-2CFF古代エジプト人 (Coptic)
2D00-2D2Fグルジア語補足(Georgian Supplement)
2D30-2D7Fティフィナバン(Tifinagh)
2D80-2DDFエチオピア拡張子(Ethiopic Extended)
2E00-2E7F追加の句読点(Supplemental Punctuation)
2E80-2EFFCJK ラジカル サプリメント(CJK Radicals Supplement)
2F00-2FDF康熙辞典部首(Kangxi Radicals)
2FF0-2FFF表意文字記述子(Ideographic Description Characters)
3000-303FCJK 記号と句読点(CJK Symbols and Punctuation)
3040-309Fひらがな(Hiragana)
30A0-30FFカタカナ(Katakana)
3100-312Fふりがな(Bopomofo)
3130-318F韓国語互換文字 (Hangul Compatibility Jamo)
3190-319F絵文字注釈マーク(Kanbun)
31A0-31BF発音アルファベット拡張(Bopomofo Extended)
31C0-31EFCJK ストローク(CJK Strokes)
31F0-31FFカタカナ音声展開 (Katakana Phonetic Extensions)
3200-32FFクローズされた CJK テキストと月(Enclosed CJK Letters and Months)
3300-33FFCJK 互換(CJK Compatibility)
3400-4DBFCJK 統一表意文字拡張 A(CJK Unified Ideographs Extension A)
4DC0-4DFF易経の 64 のヘキサグラム シンボル(Yijing Hexagrams Symbols)
4E00-9FBFCJK 統一表意文字(CJK Unified Ideographs)
A000-A48Fイ音節 (Yi Syllables)
A490-A4CFYi 文字ルート(Yi Radicals)
A500-A61Fヴァイ
A660-A6FF統一カナダ先住民シラバス補足(Unified Canadian Aboriginal Syllabics Supplement)
A700-A71Fトーン修飾文字(Modifier Tone Letters)
A720-A7FFラテン語拡張子-D(Latin Extended-D)
A800-A82Fシロティ・ナグリ
A840-A87Fパシーバキャラ(Phags-pa)
A880-A8DFサウラーシュトラ州
A900-A97Fジャワ語(Javanese)
A980-A9DFチャクマ
AA00-AA3Fヴァラン・クシティ
AA40-AA6Fソラン・ソンペン
AA80-AADFネワーリ
AB00-AB5Fベトナム語 Dai (Việt TháI)
AB80-ABA0カヤー・リー
AC00-D7AF韓国語の音節(Hangul Syllables)
D800-DBFFUTF-16のハイハーフゾーン
DC00-DFFFUTF-16の下位ハーフゾーン
E000-F8FF自己利用エリア(Private Use Zone)
F900-FAFFCJK 互換象形文字(CJK Compatibility Ideographs)
FB00-FB4F文字式(Alphabetic Presentation Form)
FB50-FDFFアラビア語表現形式 A(Arabic Presentation Form-A)
FE00-FE0F変数セレクター(Variation Selector)
FE10-FE1F縦型フォーマット(Vertical Forms)
FE20-FE2F半シンボルの結合(Combining Half Marks)
FE30-FE4FCJK 互換形式(CJK Compatibility Forms)
FE50-FE6F小型バリエーション(Small Form Variants)
FE70-FEFFアラビア語表現 B(Arabic Presentation Form-B)
FF00-FFEFハーフタイプおよびフルタイプの形式(Halfwidth and Fullwidth Form)
FFF0-FFFF特殊(Specials)

主な機能:

  • 文字検索: ユーザーが特定の文字の UTF-16 エンコーディングをすばやく見つけて理解できる便利なインターフェイスを提供します。
  • Unicode ブロック: カテゴリに文字を表示することで、ユーザーは特定の Unicode ブロックを参照し、関連する文字セットについて学ぶことができます。
  • 詳細: 文字名、Unicode コード ポイント、UTF-16 エンコーディングでの文字の表現など、各文字の詳細情報を提供します。
  • 検索機能: キーワードで文字を検索できるため、検索プロセスがより柔軟かつ効率的になります。

使用するシーン:

  • 開発者ツール: 開発者は、このエンコード テーブルを使用して、文字エンコード関連の問題のトラブルシューティングを行い、アプリケーションがさまざまな文字を正しく処理できることを確認できます。
  • 学術研究: 学者や研究者は、このツールを使用して Unicode 文字セットについての洞察を得て、研究で正しい文字エンコーディングを引用することができます。
  • 教育: 教育者は、これを教育リソースとして使用して、学生が文字エンコーディングに関する基本概念を学習できるようにすることができます。

注: UTF-16 エンコーディング テーブルは、ユーザーが UTF-16 文字エンコーディングを理解して使用できるように設計された便利なリファレンス ツールです。 直感的なインターフェイスと豊富な情報を提供することにより、文字エンコーディングの問題に対処するために不可欠なリソースになります。

Popular Tags :

Share this post :