ワイルドカードな言葉
「うんちく講座」のNo.141「五十音ランキング」、No.143「あなうめ最適型」、No.176「横10本・縦10本」などの「言葉しらみつぶし」系のうんちくである。No.110「名前の切り貼り」なども同系統かもしれない。
MS-DOS時代からコンピュータをやっている人は、よくわかるだろうが、MS-DOSのコマンドを使うときに効率的なものとして、「ワイルドカード」というものがある。
例えば、ハードディスク内に次のようなファイルがあったとする。
abc.txt
|
abs.txt
|
abukuma.com
|
cbc.txt
|
abc.exe
|
abbc.txt
|
assoonas.jpg
|
amc.txt
|
このとき、ある条件のファイルネームを持つものだけを、コピーとか削除したいというときに便利なのが、ワイルドカードである。
(以下の部分は少しくどいので、読み飛ばしてもけっこうです)
例えば、MS-DOSのコマンドラインから、次のように入力する。
copy a:*.txt b:
すると、拡張子が「txt」の「a」ドライブにあるファイル(abc.txt・abs.txt・cbc.txt・abbc.txt・amc.txt)が、「b」ドライブにコピーされる。
あるいは、「abc.*」とすれば、「abc.txt・abc.exe」が選択対象になる。
「a*.txt」として「abc.txt・abs.txt・abbc.txt・amc.txt」を選択したり、「a*.*」として、「abc.txt・abs.txt・abukuma.com・abc.exe・abbc.txt・assoonas.jpg・amc.txt」を選択することもできる。
「*」(アスタリスク)は、文字数に関係なく該当のファイルを選択するが、任意の文字数で選択したい場合は、「?」を使う。
「a?c.txt」とすると、「abc.txt・abs.txt・amc.txt」が選択対象となる。(abbc.txtは除外される)
MS-DOS講座ではないので、これ以上の細かい説明は避けるが、この使い方を知っているとかなり便利である。
「*」や「?」をワイルドカードといい、MS-DOSだけではなく、Windowsでも検索の際に同様に使うことができる。
(ここまでは、読み飛ばしてもけっこうです)
こういう考え方を日本語全体に対してもできないかと考えたのが、今回の試みである。
例えば「?んてい」とした場合、「あんてい(安定)・うんてい(雲底)・えんてい(堰堤)・おんてい(音程)・かんてい(鑑定)・きんてい(謹呈)‥‥」という具合に、いくつかの言葉が該当してくる。
こういうようにして、該当する言葉が一番多いのは何だろうと試してみた。
国語辞典を引いて調べるのが妥当なのだろうが、膨大な時間がかかるので、この手の実験ではおなじみのワープロの辞書を活用することにした。
「?」に入るのは1音ということにする。
「あいうえお」から「らりるれろ わをん」までの46文字に、「が行・ざ行・だ行・ば行・ぱ行」を加える。「きゃ・きゅ・きょ・しゃ・しゅ・しょ」などの拗音もあるが、漢字熟語の頭に使われることはほとんどないので例外的な「しゃ・じゃ」だけを加えることにして、全部で73文字を対象とする。
漢字変換したときに2文字の熟語になるものを洗い出すことにするので、音としては「?んてい」のように「ひらがな」4文字のものだけを対象とする(「しゃ」・「じゃ」は1文字扱い)
また、変換したときに完全に漢字2文字の熟語として変換されるものだけを数えることにした。例えば「四艇」のようなものは対象外とする。「三艇」もだめだが「さんてい」の場合は「算定」のように1熟語として変換できるので、これは1つに数えた。
そうして調べたのが、次の結果である。
○んこう(45)
|
○んしょう(43)
|
○んせい(42)
|
○んとう(41)
|
○んかん(37)
|
○んしん(35)
|
○んしゅう(33)
|
○んぽう(30)
|
○んたい(29)
|
○んえい(27)
|
○んけん(27)
|
○んぶん(27)
|
○んてい(27)
|
○んそく(24)
|
○んきん(23)
|
○んせん(23)
|
○んてん(23)
|
|
今回は私が使用している「一太郎ver.9」の「ATOK12」の辞書を使ったのだが、自分で単語登録して使っている辞書なので、使用環境によって若干の個人差があるかもしれないし、別のワープロ辞書などを使えば違った結果になるかもしれないが、だいたいの傾向はこんなものではないだろうか。
結果的に最初の部分が「○ん」のように「ん」がつくものばかりになったが、「○いこう」などのような「ん」がつかない言葉を調査対象から外したわけではない。(「○いこう」は21個)
No.141「五十音ランキング」の結果では、2音の単文字変換結果が次のようになった。
数
|
音
|
|
数
|
音
|
|
数
|
音
|
|
数
|
音
|
130
|
こう
|
45
|
しん
|
30
|
せき
|
18
|
いか・さく・ちか
がん
|
105
|
しょう
|
43
|
ちょう
|
25
|
しき
|
83
|
そう
|
42
|
よう・しゅう
|
24
|
れい・げん
|
17
|
かつ・てん・ひき
ばい・ばん
|
76
|
かん
|
41
|
てい・さい
|
23
|
たて・がい・あき
きん・えい
|
70
|
とう
|
39
|
じょう・かく
|
16
|
たち
|
55
|
せん
|
35
|
えん
|
22
|
さん・すい
|
15
|
きし・せつ
|
52
|
かい
|
34
|
きゅう・はん
|
21
|
じゅう・ちゅう
|
14
|
とく・ひょう
|
51
|
けい・きょう
|
33
|
たい
|
20
|
いん・かし・じん
|
13
|
きく・しつ
たつ・だん
|
49
|
けん
|
32
|
ゆう
|
19
|
あい・かき・こん
じゅん・たん・へい
|
46
|
せい・ほう
|
31
|
おう
|
以下略
|
これだと、2音目に「ん」がつくものよりも「う」がつくもののほうが多いが、日本語では、「あ行」に「う」がつくと「かう」が「こう」という音に変化したり、「いう」が「ゆう」、「えう」が「よう」のように変化したりするという傾向があるので、ワイルドカードとしては2音目に「う」がつく音は不向きということになるようだ。
2音目に「い」がつく音も健闘してはいるのだが、ワイルドカードとしては「ん」がつく音にかなわなかった。
前述のように、「?」の対象になるのが73文字。その中で「を・ん」などはほとんど使われることがないし、「ぢ・づ」なども同様であるから、実質的に対象になるのは70文字未満である。
その中で45文字も該当するというのだから、「○んこう」の打率(?)は6割5分以上になる。上位の6位までは打率5割以上だから、「ワイルドカードな言葉」としては、かなりの好成績である。
No.143「あなうめ最適型」でも書いたように、この手の「言葉しらみつぶし」は、言葉遊びの面白い素材になる。
小学校高学年以上であれば、国語科の指導の中にとりいれても面白いだろう。
なお、このしらみつぶしも、私の場合、全ての組み合わせを試してみたわけではない。
もしかしたら、もっとヒット率の高い言葉を見落としているかもしれない。ここにあげた言葉の他に「私はこんなのを見つけた」という方がいたら、メールや掲示板等で、お知らせいただければありがたい。
<99.10.02>
ホームページに戻る
うんちく目次へ