目次

文字セット

定義された文字の集合を文字セット(文字集合、キャラクターセット)と呼ぶ。JIS規格の文字セットでは使用頻度の高い文字を含む第一水準漢字(2,965文字)、第二水準漢字(3,390文字)に加え業種によって必要な特殊記号などを含めた第三、第四水準漢字まである。


Unicode

世界中の文字を収録する。文字セットの国際標準。
UnicodeまたはUCS(Universal Character Set)

エンコード形式(符号化方式)として「UTF-8」「UTF-16」「UTF-32」などがある。

JIS X 0208

日本語文字セットの標準規格。

エンコード形式(符号化方式)として「ISO-2022-JP(JISコード)」「EUC-JP(日本語EUC)」「Shift_JIS(シフトJIS)」などがある。


JIS文字セット

JIS文字セット(上記の「JIS X 0208」を含む)は日本語文字セットの公的規格。

JIS文字セットの種類

規格番号 規格名称 通称 文字数
JIS X 0208 JIS C 6226:1978 JIS78(旧JIS) 6,802
JIS C 6226:1983 JIS83(新JIS) 6,877
JIS X 0208:1990 JIS90 6,879
JIS X 0212 JIS X 0212:1990 補助漢字 6,067
JIS X 0213 JIS X 0213:2000 JIS2000 11,223
JIS X 0213:2004 JIS2004 11,233



Adobeの文字セット

Adobe社による日本語文字セットの規格。Adobe-Japan1-0からAdobe-Japan1-7まで8つある。
文字の集合の定義だけではなく文字の形のバリエーションも含んだグリフセットとなっている。

対応するAdobe-Japan1の規格 グリフ数
Std Adobe-Japan1-3 9,354
Pro Adobe-Japan1-4 15,444
Pr5 Adobe-Japan1-5 20,317
Pr6 Adobe-Japan1-6 23,058

※語尾に「N」があるもの(「ProN」など)は「JIS X 2013:2004」字形を正字として使用している。
※語尾が「N」でないものは(「Pro」など)は「JIS X 0208:1990」字形を正字として使用している。

Microsoftの文字セット

Microsoft社による日本語文字セット。Microsoft社が自社のドキュメント等で「CP932」という用語を使って表している対象は「Windows-31J」となっている。

名称 文字数
Windows-31J 7,881