ワイルドカードな言葉



 「うんちく講座」のNo.141「五十音ランキング」No.143「あなうめ最適型」No.176「横10本・縦10本」などの「言葉しらみつぶし」系のうんちくである。No.110「名前の切り貼り」なども同系統かもしれない。



 MS-DOS時代からコンピュータをやっている人は、よくわかるだろうが、MS-DOSのコマンドを使うときに効率的なものとして、「ワイルドカード」というものがある。

 例えば、ハードディスク内に次のようなファイルがあったとする。

abc.txt
abs.txt
abukuma.com
cbc.txt
abc.exe
abbc.txt
assoonas.jpg
amc.txt


 このとき、ある条件のファイルネームを持つものだけを、コピーとか削除したいというときに便利なのが、ワイルドカードである。



(以下の部分は少しくどいので、読み飛ばしてもけっこうです)

 例えば、MS-DOSのコマンドラインから、次のように入力する。

 copy a:*.txt b:

 すると、拡張子が「txt」の「a」ドライブにあるファイル(abc.txtabs.txtcbc.txtabbc.txtamc.txt)が、「b」ドライブにコピーされる。

 あるいは、「abc.*」とすれば、「abc.txtabc.exe」が選択対象になる。



 「a*.txt」として「abc.txtabs.txtabbc.txtamc.txt」を選択したり、「a*.*」として、「abc.txtabs.txtabukuma.comabc.exeabbc.txtassoonas.jpgamc.txt」を選択することもできる。



 「*」(アスタリスク)は、文字数に関係なく該当のファイルを選択するが、任意の文字数で選択したい場合は、「?」を使う。

 「a?c.txt」とすると、「abc.txtabs.txtamc.txt」が選択対象となる。(abbc.txtは除外される)



 MS-DOS講座ではないので、これ以上の細かい説明は避けるが、この使い方を知っているとかなり便利である。

 「*」や「?」をワイルドカードといい、MS-DOSだけではなく、Windowsでも検索の際に同様に使うことができる。

(ここまでは、読み飛ばしてもけっこうです)



 こういう考え方を日本語全体に対してもできないかと考えたのが、今回の試みである。



 例えば「んてい」とした場合、「あんてい(安定)・うんてい(雲底)・えんてい(堰堤)・おんてい(音程)・かんてい(鑑定)・きんてい(謹呈)‥‥」という具合に、いくつかの言葉が該当してくる。



 こういうようにして、該当する言葉が一番多いのは何だろうと試してみた。

 国語辞典を引いて調べるのが妥当なのだろうが、膨大な時間がかかるので、この手の実験ではおなじみのワープロの辞書を活用することにした。



 「」に入るのは1音ということにする。

 「あいうえお」から「らりるれろ わをん」までの46文字に、「が行・ざ行・だ行・ば行・ぱ行」を加える。「きゃ・きゅ・きょ・しゃ・しゅ・しょ」などの拗音もあるが、漢字熟語の頭に使われることはほとんどないので例外的な「しゃ・じゃ」だけを加えることにして、全部で73文字を対象とする。

 漢字変換したときに2文字の熟語になるものを洗い出すことにするので、音としては「んてい」のように「ひらがな」4文字のものだけを対象とする(「しゃ」・「じゃ」は1文字扱い)

 また、変換したときに完全に漢字2文字の熟語として変換されるものだけを数えることにした。例えば「四艇」のようなものは対象外とする。「三艇」もだめだが「さんてい」の場合は「算定」のように1熟語として変換できるので、これは1つに数えた。



 そうして調べたのが、次の結果である。

○んこう(45)
○んしょう(43)
○んせい(42)
○んとう(41)
○んかん(37)
○んしん(35)
○んしゅう(33)
○んぽう(30)
○んたい(29)
○んえい(27)
○んけん(27)
○んぶん(27)
○んてい(27)
○んそく(24)
○んきん(23)
○んせん(23)
○んてん(23)



 今回は私が使用している「一太郎ver.9」の「ATOK12」の辞書を使ったのだが、自分で単語登録して使っている辞書なので、使用環境によって若干の個人差があるかもしれないし、別のワープロ辞書などを使えば違った結果になるかもしれないが、だいたいの傾向はこんなものではないだろうか。



 結果的に最初の部分が「○ん」のように「ん」がつくものばかりになったが、「○いこう」などのような「ん」がつかない言葉を調査対象から外したわけではない。(「○いこう」は21個)

 No.141「五十音ランキング」の結果では、2音の単文字変換結果が次のようになった。












130
こう
45
しん
30
せき
18

いか・さく・ちか
がん
105
しょう
43
ちょう
25
しき
83
そう
42
よう・しゅう
24
れい・げん
17

かつ・てん・ひき
ばい・ばん
76
かん
41
てい・さい
23

たて・がい・あき
きん・えい
70
とう
39
じょう・かく
16
たち
55
せん
35
えん
22
さん・すい
15
きし・せつ
52
かい
34
きゅう・はん
21
じゅう・ちゅう
14
とく・ひょう
51
けい・きょう
33
たい
20
いん・かし・じん
13

きく・しつ
たつ・だん
49
けん
32
ゆう
19

あい・かき・こん
じゅん・たん・へい
46
せい・ほう
31
おう
以下略


 これだと、2音目に「ん」がつくものよりも「う」がつくもののほうが多いが、日本語では、「あ行」に「う」がつくと「かう」が「こう」という音に変化したり、「いう」が「ゆう」、「えう」が「よう」のように変化したりするという傾向があるので、ワイルドカードとしては2音目に「う」がつく音は不向きということになるようだ。

 2音目に「い」がつく音も健闘してはいるのだが、ワイルドカードとしては「ん」がつく音にかなわなかった。



 前述のように、「」の対象になるのが73文字。その中で「を・ん」などはほとんど使われることがないし、「ぢ・づ」なども同様であるから、実質的に対象になるのは70文字未満である。

 その中で45文字も該当するというのだから、「○んこう」の打率(?)は6割5分以上になる。上位の6位までは打率5割以上だから、「ワイルドカードな言葉」としては、かなりの好成績である。



 No.143「あなうめ最適型」でも書いたように、この手の「言葉しらみつぶし」は、言葉遊びの面白い素材になる。

 小学校高学年以上であれば、国語科の指導の中にとりいれても面白いだろう。



 なお、このしらみつぶしも、私の場合、全ての組み合わせを試してみたわけではない。

 もしかしたら、もっとヒット率の高い言葉を見落としているかもしれない。ここにあげた言葉の他に「私はこんなのを見つけた」という方がいたら、メールや掲示板等で、お知らせいただければありがたい。

<99.10.02>



ホームページに戻るうんちく目次へ