※「セキュリティ保護のため...」というメッセージが出る方・日本語が入力できない方へ
日本語JISコード
■旧JIS,新JIS
日本語の文字コードは最初1978年に JIS-C6226 として、約6800文字の
コードが定められました。これは第一水準2965文字、第二水準3385文字
非漢字453文字から成ります。
初期のプリンタやディスプレイでは、第一水準の文字しか表示できない
ものもありました。私が最初に買ったワープロなども第一水準はROMに
内蔵していましたが、第二水準はフロッピーで使用する方式になってい
ました。
その後このコードが見直され、1983年に JIS-X0208 という新しい規格
が定められました。このコードでは第一水準2965文字は変わりませんが
第二水準が3388文字と4文字追加、非漢字も524文字に増えました。さて
ここで増えただけならよかったのですが、実は幾つかの文字が入れ替え
られたり書体が変更されていました。
一般に1978年規格を「旧JIS」、1983年規格を「新JIS」と呼んでいます。
次の文字が旧JISと新JISで字体が交換になったものです。
3033鯵−鰺724d 395c砿−礦6268 4676迩−邇6d6e
3229鴬−鶯7274 3c49蕊−蘂6922 4768蝿−蠅6a24
3342蛎−蠣695a 3f59靭−靱7057 4930桧−檜5b58
3349撹−攪5978 4128賎−賤6c4d 4b79侭−儘5056
3376竃−竈635e 445b壷−壺5464 4c79薮−藪692e
3443潅−灌5e75 4557砺−礪626a 4f36篭−籠6446
3452諌−諫6b5d 456e梼−檮5b6d
375b頚−頸7074 4573涛−濤5e39
追加された文字は7421-7424 の4文字で、それに伴い
3646尭−7421, 4b6a槙−7422, 4d5a遥−7423, 6076瑶−7424 の4書体
が変更になっています。これ以外にも116文字の書体が変更されました。
私はなぜいったん決めたコード体系を変更しなければならないのか、
理解できません。この旧JIS,新JISの問題は日本のコンピュータ業界に
ひじょうに大きな混乱をもたらしました。
新JISに対する対応はメーカーによってばらばらでした。過去の文書と
の互換性を重視して旧JISを使い続けた所と新JISに切り替えた所とが
あります。そのためあるマシンで「檜」と書いたつもりが別の人には
「桧」と見えてしまうということで、本当に困ったものでした。現在
はWindows95/98のお陰で、ほとんどのマシンで新JISが見えるように
なりました。
■1990年規格
JISは1990年にまた新しい規格を発表します。これは従来の第一水準・
第二水準・非漢字を収録した JIS-X0208 (2965+3390+524) と一般に
「補助漢字」と呼ばれる JIS-X0212(5801文字)からなります。
JIS-X0208は1983年規格から2文字増えています。増えた文字は
凜(7425),熙(7426)の2文字です。こういうチョコチョコした増補という
のも意図を理解しがたい所です。しかし1990年の規格で戸惑いを招いた
のは X0212 の補助漢字 5801文字でした。
従来の2バイト文字の処理体系にはもう余裕がなく、5801文字もの大量の
漢字を処理することができません。そのため、この補助漢字を処理でき
る環境は結局3バイト以上の漢字コードが処理できるunicodeか新EUCが
使える環境(具体的には Windows98 または 最近の日本語処理モジュー
ルを装備したUNIX環境、あるいは ATOK12 を入れたシステムなど)が普
及し始める、1998年前後以降を待たなければなりませんでした。
ただこの補助漢字を処理できるソフトは一太郎8などまだまだ少数のよ
うです。文字コードが1バイトまたは2バイトで構成されると決めてか
かっているソフトが恐らく「日本語対応ソフト」の9割以上を占めます。
(そもそも日本人SEの半数は補助漢字の存在を知らないと思います)
■unicode
unicodeは1995年に JIS-X0221 として規格化されました。
■1997年規格
現在の所、JISコードの最新規格はJIS-X0208-1997 だと思います。これ
は規格番号が変わっていないので分かるように、あまり大きな改訂はな
されていませんが、初めて シフトJISを「公認」したことと、旧コード
体系への考慮を行ったことがあげられます。
この規格ではシフトコードを使うことによって、コード体系を切り替え
ることができます。
ESC(B ASCIIコード(ISO-IEC646)
ESC(J JISの1バイトコード(JIS-X0201)
ESC$@ 旧JIS(JIS-C6226) ESC$B 97JIS(JIS-X0208-1997)
ESC$D 補助漢字(JIS-X0212)
■第三水準・第四水準 (JIS-X0213-2000?)
現在、JISでは第三水準(約2000文字)・第四水準(約3000文字)という文字
コードを整備中です。
■幽霊文字
JISの漢字コード表にはいわゆる「幽霊文字」が存在することが知られて
います。
つまりコード表には入っているが、使用された例がどうしても見つからな
いというものです。これは策定作業中の転記ミスや、誰かが誤記した文書
を見て「こういう字もあるのか」と収録してしまったものであるといわれ
ています。
Dropped down from digital episode.