図形が「似ている」ということ 〜「距離」を考える〜
埼玉県と形が一番似ている都道府県はどれか
次の三つから選べ。
なに、形が分からないって?仕方ないなー。
答えは「比べ方によって答えが違う」が正解。詐欺とか言われそうなので、根拠を示してみる。
まず、「面積が一番近ければ似ている」と仮定して比べてみよう。大きさが近いってことは似ているってことだよね。国土地理院的データからいうと、埼玉県に一番面積が近いのは滋賀県。ついで奈良県、山梨県の順だ。ということは滋賀県が一番似ている?ううーん、これはちょっと(私的にも)納得できんかな(ダメダメやん)。
じゃあ、「重ねあわせた時に、ぴったり重なるやつが一番似ている」ことにしてみよう。その場合はこんかんじ。左から、奈良県、滋賀県、山梨県と埼玉県を重ねてみたところ。
重ねたときにはみ出したところに色を付けてある。どうよ、これだと山梨県が一番ぴったりしている、というかはみ出しているところが少ない。じゃあ山梨県で決まりか?というとそうとも言い切れない。
今の比べ方は、図形を回しちゃいけないという暗黙のルールのもとで重ねてみた。回しちゃいけないとか、誰も言ってない。じゃあ「回してもいいから、一番ぴったり重なる奴が一番にている」ということにしよう。
するとどうだろう、これだと奈良県が一番ぴったり重なってる感じがしない?
こんなふうに、「形が似ている」っていうのは人によって結構比べる基準やルールが違っていたりいる。実は、世界標準的な「似ている度合い」みたいなものを測るモノサシというのは、あるようで無かったりする。今の比べ方もかなりアバウトなもので、この比べ方で本当にいいかどうかという保証があるわけじゃない。
図形を比べるとき、人間が何をもって「似ている」と思うのかは、よく分からないところが多い。人間ならば、直感のようなもので「なんとなく似ている」といえるけど、ロボットやコンピュータに二つの図形をみせて、それが「似ている」かを判断させるには、似ている度合いを測るモノサシがはっきりしていないと計算できない。だから、ロボットビジョンなんかの研究の中で、人間が「似ている」と感じるのはどういうときなのかという研究や、そして「似ている度合い」の測り方の研究がなされてきた。そのおかげで、今ではいろんなモノサシが作られている。
例えば、デジタルカメラで顔の場所を自動的に認識してくれたり、笑顔になるとシャッターを押してくれたりするものがあるけど、あれも基準となる「顔」や「笑顔」の図形があって、それと「似たもの」をカメラが自動的に探してたりする。手書き文字認識やOCRもこのモノサシを使っている。予め用意されているたくさんの文字と、手書き差れた文字を比べて、どの文字に一番近いのかを比べている。音声認識、銀行で使われているような指紋認証、網膜認証といったシステムにも使われている。もちろん、それぞれのシステムごとに「モノサシ」は違うんだけど根っこは同じで、「似たもの」を探すというモノサシをどう作って、それをどう効率良く測るのか、という技術が基本になっている。
専門用語的には、この「似ている度合い」のことを「類似度」といったりする。ここでは、今まで私がこれまで頭の中に貯めてきた「類似度」についての知識を、このあたりに dump してみようと思う。そうすると、もしかしたら何かの役に立つかもしれないし、たたないかもしれない。多分たたないな。
ちなみに、個人的に興味があるのは、線が「似ている」とはどういうことか、ということを探求する部分にあったりするので、多分そのへんの話が多くなるかも。