かな漢字変換って(2バイトコードの憂鬱)

漢字って大変

PCで日本語の文章を書いていると必ず「ひらがな」を「漢字」に変換する必要があります。

何を当たり前の事を言っているの?と思われるかもしれませんが、英語で文章を書く場合にはこの作業は必要ありません

タイピングしたらそのままですので、「変換・確定」という動作が不要になります。

最近、この「かな漢字変換」にうんざりし始めています。

かな漢字変換にイラつくケース

例えばこんなシーンでイラつきます

  • 思った通りの変換が出なくて何回もスペースを押す(行き過ぎて一周してこないといけないとか)
  • 人の名前や専門用語は変換候補に無いので、別の読み方を組み合わせて単語を作成しなくてはいけない(単語登録していても辞書が壊れたりします)
  • 日本語と英単語をまぜた文章を打つといちいち変換モードの切り替えが必要(スマホなんかだと超めんどくさいですね)
  • 変換モードが何になっているか知らずタイプして謎の日本語になる(”book”と打ったつもりが”ぼおk”とか一瞬自分がバカになった気がします)
  • ウェブなどの入力フォームで半角はダメですと言われたりする(イラッ!)

挙げたらキリがありません。

私は仕事がら英語でメールを打つ事もありますが、表現は制限されるものの、スピードは英語の方が速いくらいです(それにストレスが少ない)。

英語の方が言語としては効率が良い、特にITシステムでは

英語は基本的に26文字の組み合わせに?(クエスチョンマーク)とか.(ピリオド)でほとんどの表現が可能です(!とか” ”とか表現を豊かにするためにはもう少し必要ですが)。

この事は、ITシステムの世界では大きな違いを生みます。

どんなシステムにも使用言語というのがあって、英語であればコンピューターの最小単位である1バイト(8ビット)で全ての文字を表す事ができます。

専門的な話になりますが、1バイトで表現できる文字は256種類となり、英語は記号などを含めてもこれに収まります。

一方、日本語は漢字が何千とありますので、ひらがな、カタカナと合わせて膨大な文字データをソフト内に組み込む必要があります。

その上、システム上でそれが正しく、美しく(フォントというやつですね)表示される事をテストしなければいけません。

日本語は漢字一文字を1バイトでは表現できません(256種類以上あるので数が足りない)。

よって2バイト以上を組み合わせてデータ化します。これを一般的に2バイトコードと言います。

メールなどのやり取りで”文字化け”という現象を経験した事があると思います。

これはこの2バイトコードの途中が抜けたりして、その後の文章が全て壊れてしまう事から発生します(組み合わせが全てずれてしまう為)。

よく文字化けした文章の中でアルファベット部分だけは読める、というのを見た事がありませんか?

それだけ2バイトコードはエラーにも弱いのです。

2バイトコード圏(主にアジア)と欧米の差

これら上げた事は我々は「日常」として受け入れ、あまり意識していませんが、日本全体となると相当なコストになっていると考えると、ちょっと憂鬱な気分になります。

何が言いたいかというと、なぜ日本人の生産性が上がらないのか、という昨今の問題について、この2バイトコードも少なからず影響しているではないかと思うのです。

英語でITシステムを構築して、英語でコミュニケーションをするに比べて、日本語でそれをやるには余分なコスト、労力、ストレス、スピードダウンなどを引き起こしている可能性があるのです。

日本は美しい国で日本語にも誇りはありますが、国際社会ではハンデとなっていると感じます。

メリットとしては、外資がおいそれと入ってこれない参入障壁の役割をしているという側面もありますが、内需が先細る我が国ではそのうち外資参入自体が減る気もします。

言語というのはその国がグローバル社会で競争するのには大きな要素です。

そういった意味で日本における英語教育の改善はかなり急務と思います。将来、会社・学校では英語を使い、家族や友達と話しをする時は日本語で話すような文化になりませんかね。。。。

フィリピンではタガログという自国語を大切にしながら英語を流暢に話します。彼らにできて日本にできない事はないのではないでしょうか。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です