※「セキュリティ保護のため...」というメッセージが出る方・日本語が入力できない方へ
return 日本語JISコード


 ■旧JIS,新JIS

    日本語の文字コードは最初1978年に JIS-C6226 として、約6800文字の
    コードが定められました。これは第一水準2965文字、第二水準3385文字
    非漢字453文字から成ります。
    
    初期のプリンタやディスプレイでは、第一水準の文字しか表示できない
    ものもありました。私が最初に買ったワープロなども第一水準はROMに
    内蔵していましたが、第二水準はフロッピーで使用する方式になってい
    ました。
    
    その後このコードが見直され、1983年に JIS-X0208 という新しい規格
    が定められました。このコードでは第一水準2965文字は変わりませんが
    第二水準が3388文字と4文字追加、非漢字も524文字に増えました。さて
    ここで増えただけならよかったのですが、実は幾つかの文字が入れ替え
    られたり書体が変更されていました。
    
    一般に1978年規格を「旧JIS」、1983年規格を「新JIS」と呼んでいます。
    
  次の文字が旧JISと新JISで字体が交換になったものです。

     3033鯵−鰺724d    395c砿−礦6268    4676迩−邇6d6e
     3229鴬−鶯7274    3c49蕊−蘂6922    4768蝿−蠅6a24
     3342蛎−蠣695a    3f59靭−靱7057    4930桧−檜5b58
      3349撹−攪5978    4128賎−賤6c4d    4b79侭−儘5056
     3376竃−竈635e    445b壷−壺5464    4c79薮−藪692e
     3443潅−灌5e75    4557砺−礪626a    4f36篭−籠6446
     3452諌−諫6b5d    456e梼−檮5b6d
     375b頚−頸7074    4573涛−濤5e39

  追加された文字は7421-7424 の4文字で、それに伴い
  3646尭−7421, 4b6a槙−7422, 4d5a遥−7423, 6076瑶−7424 の4書体
    が変更になっています。これ以外にも116文字の書体が変更されました。

  私はなぜいったん決めたコード体系を変更しなければならないのか、
  理解できません。この旧JIS,新JISの問題は日本のコンピュータ業界に
  ひじょうに大きな混乱をもたらしました。
  
  新JISに対する対応はメーカーによってばらばらでした。過去の文書と
  の互換性を重視して旧JISを使い続けた所と新JISに切り替えた所とが
  あります。そのためあるマシンで「檜」と書いたつもりが別の人には
  「桧」と見えてしまうということで、本当に困ったものでした。現在
  はWindows95/98のお陰で、ほとんどのマシンで新JISが見えるように
  なりました。

 ■1990年規格
  
  JISは1990年にまた新しい規格を発表します。これは従来の第一水準・
  第二水準・非漢字を収録した JIS-X0208 (2965+3390+524) と一般に
  「補助漢字」と呼ばれる JIS-X0212(5801文字)からなります。
  
  JIS-X0208は1983年規格から2文字増えています。増えた文字は
  凜(7425),熙(7426)の2文字です。こういうチョコチョコした増補という
  のも意図を理解しがたい所です。しかし1990年の規格で戸惑いを招いた
  のは X0212 の補助漢字 5801文字でした。
  
  従来の2バイト文字の処理体系にはもう余裕がなく、5801文字もの大量の
  漢字を処理することができません。そのため、この補助漢字を処理でき
  る環境は結局3バイト以上の漢字コードが処理できるunicodeか新EUCが
  使える環境(具体的には Windows98 または 最近の日本語処理モジュー
  ルを装備したUNIX環境、あるいは ATOK12 を入れたシステムなど)が普
  及し始める、1998年前後以降を待たなければなりませんでした。
  
  ただこの補助漢字を処理できるソフトは一太郎8などまだまだ少数のよ
  うです。文字コードが1バイトまたは2バイトで構成されると決めてか
  かっているソフトが恐らく「日本語対応ソフト」の9割以上を占めます。

  (そもそも日本人SEの半数は補助漢字の存在を知らないと思います)

 ■unicode
 
   unicodeは1995年に JIS-X0221 として規格化されました。
  
 ■1997年規格
  
  現在の所、JISコードの最新規格はJIS-X0208-1997 だと思います。これ
  は規格番号が変わっていないので分かるように、あまり大きな改訂はな
  されていませんが、初めて シフトJISを「公認」したことと、旧コード
  体系への考慮を行ったことがあげられます。
  
  この規格ではシフトコードを使うことによって、コード体系を切り替え
  ることができます。
  
   ESC(B    ASCIIコード(ISO-IEC646)
   ESC(J    JISの1バイトコード(JIS-X0201)
   ESC$@    旧JIS(JIS-C6226)   ESC$B    97JIS(JIS-X0208-1997)
   ESC$D    補助漢字(JIS-X0212)

 ■第三水準・第四水準 (JIS-X0213-2000?)

  現在、JISでは第三水準(約2000文字)・第四水準(約3000文字)という文字
  コードを整備中です。

 ■幽霊文字
 
  JISの漢字コード表にはいわゆる「幽霊文字」が存在することが知られて
  います。

  つまりコード表には入っているが、使用された例がどうしても見つからな
  いというものです。これは策定作業中の転記ミスや、誰かが誤記した文書
  を見て「こういう字もあるのか」と収録してしまったものであるといわれ
  ています。



return Dropped down from digital episode.
(C)copyright ffortune.net 1995-2007 produced by ffortune and Lumi.
お問い合わせはこちらから