般若心経カクカクしかじか

般若心経カクカクしかじか - 般若心経の外字

般若心経の外字

般若心経の 外字、正確に言うと 特殊文字 について。

般若心経には、日本語では通常使わない漢字が 2つ使われています。
菩提薩埵の 「埵」 と、 心無罣礙の 「罣」 です。

これらの文字は、通常の日本語文字と同じように扱おうとすると、 消えてしまうか「?(クエスチョンマーク)」になってしまいます。
試しにこのページの上記の文字をドラッグで選択し、コピー、 メモ帳を開き、貼り付け、適当な名前を付けて保存、と操作してみて下さい。 そのファイルを再びメモ帳で開くと、「埵」と「罣」だった箇所が両方とも「?」に なっていると思います。

これは上記 2つの漢字が、通常日本語で使われる「シフトJIS」というコードに、 存在しないために起こる現象です。
先ほどの操作で、名前を付けて保存 する時に、「文字コード」が標準で、 ANSI になっていたと思います。 ANSI は、大まかに言うと Shift_JIS のことだと思って下さい。 前述した通り 2つの文字は「シフトJIS」には存在しないので「?」に置き換えられた、 というわけです。

では、どうすればよいか。 名前を付けて保存 する時に、「文字コード」を UTF-8 にすれば解決です。

般若心経の外字 補足

最新版のメモ帳では、前項の操作をした時に以下の警告が出るようになっているようです。

メモ帳の警告

メッセージに書かれているように、文字コード には Unicode というのもあります。 そのほか Unicode big endian というのもあります。 Unicode/Unicode big endian/UTF-8 すべて「Unicode(ユニコード)」です。 エンコーディング(符号化方式)の違いで名称が異なっているのですが、 インターネットで一般的、という観点から UTF-8 にしておけば、まぁ間違いないでしょう。

Unicode とは全世界の言語の文字を 1つのコードに統一した文字コードです。
この中には日本語の漢字ももちろんありますが、「日本語」というくくりではなく、 「CJK互換用文字」というくくりになっています。CJK統合漢字ともよばれています。 CJK とは、Chinese(中国語)+Japanese(日本語)+Korean(韓国語) の略で、 各国語の漢字を統合して 1つのコード領域に収めたもの、という、 ちょっと乱暴な分類です。 ※参照: Unicode一覧表&逆引き「うにこ~ど2」

このページの主題である 般若心経の外字(厳密には特殊文字) 「埵」と「罣」は、 Shift_JIS(シフトJIS) には存在しないけれども、 Unicode の CJK互換用文字 には存在する、ということです。

「埵」と「罣」をホームページに表示したい、という場合は、

  1. HTML の HEADセクション - METAタグ - charset=UTF-8 を記述
    <meta charset="UTF-8">
  2. HTMLファイルを UTF-8 で保存

とすれば OK です。

最後に・・・。
どうしても Shift_JIS にしなければならない場合は、以下のいずれかの方法になるでしょう。

  1. 画像を使う。例えば「 外字1 ←これは画像です」「 外字2 ←これは画像です」など。
  2. 代替文字を使う。例えば「垂」「圭」など。