N
NARITAI

経営情報システム

補助

その他

基礎技術の分類外論点を過去問範囲に絞って扱う。

この章で覚えておきたいこと

ASCII、EUC、Unicode を文字集合と符号化方式の切り分けから整理する図解
  • このトピックは独立論点を広げる場所ではなく、過去問で出た基礎技術の補助確認に使います。
  • ASCII は 7ビットで128種類 の基本的な文字コードです。
  • EUC は UNIX 系で使われた日本語の符号化方式 として押さえます。
  • Unicode は 世界の主要文字を扱う文字集合 として理解します。
  • 文字集合符号化方式 を同じ意味で扱わないことが重要です。

基本知識

文字集合と符号化方式

文字集合と符号化方式を役割の違いで切り分ける図解

文字コード問題では、まず「どの文字を扱うか」と「それをどういうビット列で表すか」を分けて考えます。前者が文字集合、後者が符号化方式です。

Unicode は世界の主要な文字を広く扱う文字集合として理解します。EUC-JP や ISO-2022-JP は、日本語を扱うための符号化方式として整理します。2024年度第2問は、この階層の違いを見抜けるかを問う問題でした。

ASCII、EUC、Unicode

ASCII、EUC、Unicode の特徴を短い手掛かりで見分ける図解

ASCII は 7 ビットで 128 種類を表す基本的な文字コードで、英数字、制御文字、一部記号が中心です。7ビット、128種類 がそのまま識別語になります。

EUC は Extended Unix Code の略で、UNIX 系で使われた日本語符号化方式として出題されます。名称に -JP が付くことも手掛かりになります。

Unicode は ISO/IEC 10646 と関連付けて問われることがあり、世界の主要文字を表現できるという説明に対応します。EUC や ISO-2022-JP と同じく符号化方式の名前だと雑に覚えると、ここで崩れやすくなります。

この章のまとめ

文字コード論点で階層判定と各用語の特徴を順に確認する図解
  • 補助トピックではありますが、2024年度に実際に出題されたため、ASCII、EUC、Unicode の説明対応は押さえておく価値があります。
  • 文字集合か符号化方式かを先に判定すれば、似た用語が並んでも切り分けやすくなります。
  • ASCII の 7ビット、128種類、EUC の UNIX系日本語符号化方式、Unicode の 多言語文字集合 は短く言えるようにします。

一次試験過去問での出方

2024年第2問で、ASCII、EUC、Unicode の説明対応がそのまま出題されました。出題参照は多くありませんが、今後も周辺基礎知識として再登場し得るため、追加暗記を広げるより 用語の階層と代表的な説明 を正確に押さえる学習が適しています。