====== 文字セット ====== 定義された文字の集合を文字セット(文字集合、キャラクターセット)と呼ぶ。JIS規格の文字セットでは使用頻度の高い文字を含む第一水準漢字(2,965文字)、第二水準漢字(3,390文字)に加え業種によって必要な特殊記号などを含めた第三、第四水準漢字まである。 ---- ===== Unicode ===== **世界中の文字を収録する。文字セットの国際標準。** UnicodeまたはUCS(Universal Character Set) エンコード形式(符号化方式)として「UTF-8」「UTF-16」「UTF-32」などがある。 ===== JIS X 0208 ===== **日本語文字セットの標準規格。** エンコード形式(符号化方式)として「ISO-2022-JP(JISコード)」「EUC-JP(日本語EUC)」「Shift_JIS(シフトJIS)」などがある。 \\ ---- ===== JIS文字セット ===== JIS文字セット(上記の「JIS X 0208」を含む)は日本語文字セットの公的規格。 ==== JIS文字セットの種類 ==== |< 80% 20% 20% 20% 20%>| ^ 規格番号 ^ 規格名称 ^ 通称 ^ 文字数 ^ | JIS X 0208 | JIS C 6226:1978 | JIS78(旧JIS) | 6,802 | | ::: | JIS C 6226:1983 | JIS83(新JIS) | 6,877 | | ::: | JIS X 0208:1990 | JIS90 | 6,879 | | JIS X 0212 | JIS X 0212:1990 | 補助漢字 | 6,067 | | JIS X 0213 | JIS X 0213:2000 | JIS2000 | 11,223 | | ::: | JIS X 0213:2004 | JIS2004 | 11,233 | \\ ---- ===== Adobeの文字セット ===== Adobe社による日本語文字セットの規格。Adobe-Japan1-0からAdobe-Japan1-7まで8つある。 文字の集合の定義だけではなく文字の形のバリエーションも含んだグリフセットとなっている。 |< 80% 20% 30% 30%>| ^ ^ 対応するAdobe-Japan1の規格 ^ グリフ数 ^ | Std | Adobe-Japan1-3 | 9,354 | | Pro | Adobe-Japan1-4 | 15,444 | | Pr5 | Adobe-Japan1-5 | 20,317 | | Pr6 | Adobe-Japan1-6 | 23,058 | ※語尾に「N」があるもの(「ProN」など)は「JIS X 2013:2004」字形を正字として使用している。 ※語尾が「N」でないものは(「Pro」など)は「JIS X 0208:1990」字形を正字として使用している。 ===== Microsoftの文字セット ===== Microsoft社による日本語文字セット。Microsoft社が自社のドキュメント等で「CP932」という用語を使って表している対象は「Windows-31J」となっている。 |< 50% 30% 20%>| ^ 名称 ^ 文字数 ^ | Windows-31J | 7,881 |