AIとともに歩む未来 ~もっと身近な存在に~
現在のAIは以前よりも進化を遂げ、いかにも機械的であったAIが、人間的な認知機能を備えるようになりました。少し専門的に言えば、シングルモーダルであったAIがマルチモーダルになったということです。例えば、人の画像を見たときに顔と認識したり、音声を聞いたときにテキストに変換したりできるが、それらを組み合わせては認識できない、これはシングルモーダルです。一方で、画像と音声の認識を別々にもできるが、組み合わせても認識できる、これがマルチモーダルです。
相手の表情(画像)を見ているときに、相手の話す言葉(音声)を聞いて、(それらを組み合わせて)相手の感情を理解するといった行為は、マルチモーダルであり、人間が日常的に行っていることです。こうした機能も備えつつあるのが現代のAIで、あたかも人間とやり取りしているような感覚でAIと触れ合うことが可能になっていきます。