定義された文字の集合を文字セット(文字集合、キャラクターセット)と呼ぶ。JIS規格の文字セットでは使用頻度の高い文字を含む第一水準漢字(2,965文字)、第二水準漢字(3,390文字)に加え業種によって必要な特殊記号などを含めた第三、第四水準漢字まである。
世界中の文字を収録する。文字セットの国際標準。
UnicodeまたはUCS(Universal Character Set)
エンコード形式(符号化方式)として「UTF-8」「UTF-16」「UTF-32」などがある。
日本語文字セットの標準規格。
エンコード形式(符号化方式)として「ISO-2022-JP(JISコード)」「EUC-JP(日本語EUC)」「Shift_JIS(シフトJIS)」などがある。
JIS文字セット(上記の「JIS X 0208」を含む)は日本語文字セットの公的規格。
規格番号 | 規格名称 | 通称 | 文字数 |
---|---|---|---|
JIS X 0208 | JIS C 6226:1978 | JIS78(旧JIS) | 6,802 |
JIS C 6226:1983 | JIS83(新JIS) | 6,877 | |
JIS X 0208:1990 | JIS90 | 6,879 | |
JIS X 0212 | JIS X 0212:1990 | 補助漢字 | 6,067 |
JIS X 0213 | JIS X 0213:2000 | JIS2000 | 11,223 |
JIS X 0213:2004 | JIS2004 | 11,233 |
Adobe社による日本語文字セットの規格。Adobe-Japan1-0からAdobe-Japan1-7まで8つある。
文字の集合の定義だけではなく文字の形のバリエーションも含んだグリフセットとなっている。
対応するAdobe-Japan1の規格 | グリフ数 | |
---|---|---|
Std | Adobe-Japan1-3 | 9,354 |
Pro | Adobe-Japan1-4 | 15,444 |
Pr5 | Adobe-Japan1-5 | 20,317 |
Pr6 | Adobe-Japan1-6 | 23,058 |
※語尾に「N」があるもの(「ProN」など)は「JIS X 2013:2004」字形を正字として使用している。
※語尾が「N」でないものは(「Pro」など)は「JIS X 0208:1990」字形を正字として使用している。
Microsoft社による日本語文字セット。Microsoft社が自社のドキュメント等で「CP932」という用語を使って表している対象は「Windows-31J」となっている。
名称 | 文字数 |
---|---|
Windows-31J | 7,881 |