ちょっとやってみたこと
ありゃ?




パソコンを使っているとき(特に文字入力をしているとき)にありゃっと思ったことを集めてみたです。



顔に見える文字
←の字はどうも哭いている顔にみえる。
囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧
囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧
囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧
囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧囧

**********************************************************************************
文字一覧でフォント「New Gulim」に設定して、「私用領域」の所を見てみると通常時の朝鮮語入力モードでは打つことのできないハングルや漢字を見ることができる。
↓ その中で見つけた顔のようなハングルをいくつか。

パソコンの中に「樂」はいくつ存在する?

↑ 文字セットを「シフトJIS」ではなく「Unicode」のほうにしておくのよ?




なんか知らんが「楽」の旧字である「樂」はパソコン上にたくさん存在する。
私の探した限りでは4つ見つけることができた。
これはすべて違うコードがふられているのでパソコンから見たら全く違う文字であるが、人間から見たら同じ文字でしかない。
なぜこんなにたくさん存在するのかは知らん。



それら4つを下に示してみた。
樂 樂樂樂 (←違いがわかりますか?)
左は日本語入力でも打てるCJK統合漢字の「樂」(上の画像で言うとのヤツ)、右3つは日本語入力時には打つことのできないCJK互換漢字の「樂」(上の画像で言うとのヤツ)(要するに日本では常用でない領域のコードを持つ文字、たぶん韓国語入力の時とかに打てるんじゃないかな?)。

またこの場合、文字を大きくよりも小さく表示したほうがその違いが確認しやすいことが多いので拡大表示にはせず、標準のフォントサイズで表示させています。


----------------------------------------------------------------------------
上と同じような漢字(「同形異コード漢字」とでも表現すべきか?)がいくつかあったのでその一部を。
左が常用文字、右が「CJK互換漢字」。
綠綠
錄錄
露露
奈奈
契契
金金
句句
車車
更更
參參
說說
難難
宅宅
北北
不不
歷歷
曆曆



もっと見てみたい人は文字一覧を開き、「CJK互換漢字」の類のところを見てみてください。

「崎」の異字体を捜索!


「崎」の異字体である「嵜」を文字一覧で探してみるとすぐ見つけることができたが、もうひとつの異字体であるのほうはなかなか難しいのですよ?
人の名前になんかによく使われる「」はパソコン上では特殊文字の漢字に属すようで「CJK互換漢字」という分類のところに入っていた。
が、この「」の類の文字はメールやネット上では文字化けする恐れがあるのでフォントを指定するタグ
<FONT FACE ="フォント名">という形のヤツ
を使ってしっかりと文字化けせずに表示させられるフォントを指定してやることが必要である。



んで、「崎」「」「嵜」があるなら「」は無いのかと思ったら、あったんだなぁ、これが。
」は「CJK互換文字」に属していた。


また、「崎」「」「嵜」はわざわざ文字一覧を使わんでも手書き機能でも検索できる文字だが、「」は手書き機能では検索できない文字である。

またこの「CJK互換漢字」に属す漢字には下のような文字も含まれていた。
「示」偏が「ネ」ではなく旧字体のもの。
点々の部分が線となっているもの。
「食」偏が「飠」ではなく旧字体のもの。
線ではなく点々になっているもの。
でも本来はこの形が正しいらしい。
↑ 文字セットを「シフトJIS」ではなく「Unicode」のほうにしておくのよ?
↑文字一覧では通常、異字体もとなりまたはその近くに配置されている。青で囲んで部分が基本形とその異字体の関係に相当する文字の部分。
緑で囲んだ部分はすべて同じ字。(上は「巓」の「頁」が「」に、左下のは「真」が「眞」、右下のは「真」となっている。日本では左下のものが標準字体となっている)



=文字化けについて=
日本のコンピュータ(Windowsにおいて)は「MS Pゴシック」が標準フォントとされ、とくにパソコンの設定をいじっていなければこの設定のはずです。
ですから日本のパソコンではフォント指定をしていない時にはこの「MS Pゴシック」フォントで文字が表示されることになっています。
文字化けとはこの「MS Pゴシック」フォントでは表示できないコードを持つ文字(訓民正音(ハングル)など日本では使用頻度の低いまたは全く使わない文字がこの中に入ります)があるときに生じます。

また表示できても醜く汚い文字などもありますが、これは「MS Pゴシック」フォントで一応表示はできるが常用ではない文字を表示させた時に現れる現象です。
これら文字は画面上では汚く表示されますが、プリントアウトするとちゃんと綺麗な文字として印刷されます。

ある文字のコード(「シフトJIS」或いは「Unicode」)を知りたい時は、①文字一覧で探してマウスをかざして表示させるか、②外字エディタを開き参照をクリックして開いた窓で文字を入力してコードを表示させるなどの方法があるが、どちらかといえば②の方法のほうが楽かな。

「中」は「ちゅう」?「ちゅうう」?
なして「ちゅうう」と入力しても「ちゅう」と発音する音に変換できるのだろう?
一応、変換候補数は「ちゅう」でも「ちゅうう」でも同じ。

不思議、不思議やネ。

マウスオーバー辞書
マウスオーバー辞書機能を有効にして、「NEWS」という単語の上にマウスポインタを置き翻訳表示させると、日本語翻訳では「ニュース、便り」の2つだけ表示された。
中国語ではやたらとたくさん表示された。(簡体版でも同じ)
朝鮮語は日本語と似て少しだけ表示された。
ロシア語はそういえば半角じゃなくて全角文字の文化だったんですね、今知ったわ。

「mℓ」は「Mℓ」ではない
当初「㎝」のように「c」と「m」2つでひとつの文字として表示される、「単位用文字」の「ミリリットル」を探して文字一覧を開いたのですが、見つけて打ち出してみると不思議なことが。
変換を押して再変換するとなぜか「ミリリットル」ではなく「メガリットル」と変換されるんですわ。
「文字一覧」及び変換候補の上では確かに小文字の「m」で、「mℓ」と表示されているのに、いざ打ち込んでみるとなぜか大文字の「M」の表示となり、全く大きさの違う単位である「Mℓ」と表示されてしまうのですよ。
さらに文字一覧上では両隣がそれぞれ「㎕(マイクロリットル)」、「㎗(デシリットル)」となっているのでここに来るべきは確かに「ミリリットル」のはずなんですがねぇ。どうしたことかいこれは。


でも、他のパソコンでやると、表示はちゃんと小文字のmとなる。が、やはり変換すると「メガリットル」となる。

untill?

私のパソコンでは英単語上にマウスポインタを置くとその単語の意味を翻訳し表示するという機能が設定されています。

この間、「朝まで」を英語で打とうとして間違えて「until」を「untill」と「l」を2回打ってしまいました。
その際たまたまマウスポインタが単語上に来ていて偶然発見したのですが、なぜかありえない単語「untill」を「まで、するまで」と翻訳したんですねぇ。
たぶんこのソフトを作った人が間違えて登録してしまったのでしょうな。

ちなみに翻訳サイトを利用して翻訳してみたところ、もちろん「untill」のほうは翻訳できませんでした。

文字一覧上で「脱」「」の違いは現れない。
中国語入力モードで文字一覧を使って「脱」「」を探してみると、なぜか同じように表示される。

もちろん入力すれば左のようにそれぞれの違いは明らかになるが。

在中文輸入模式上...(中国語入力モードにおいて...)
中国語入力をしているといろいろとへんなことに気づいた。
ん?、なぜ!?

「ㄧㄠ」(yao)と入力して変換すると、繁体、簡体の双方が候補に挙がるのに、「ㄧㄠ˙」(yao˙)と入力すると簡体しか候補に挙がらん?
もしかして違う文字?
いやいやそりゃないだろ。
こりゃ什麼な文字だな。

探してみるとこれに似た感じの漢字が結構ありました。

あらっ、これも簡体だけ?


読みは...。
って、繁体は音がぜんぜん違うぅッッッッ?

違う意味の漢字?
んな分けないよな...。

これも簡体と繁体で声調が違う。

これ、は...?

音は同じだから同じ字?
同じ意味の字でも地域によって字体に差がある「戸」「户」「戶」や「内」「內」、「値」「值」の類の漢字ということか?