あるようでない、ないようであるつながり

デジサーチ、実は東大の先生と「AIの共同研究」もやっています。

今日は、そのZOOM会議に、初めて参加しました。

「 AIにたくさんジョーダンを学習させたら、まだ誰も見たことないジョーダンの画像を作ってくれるかもしれない!」

AI×ファッションで、どんなことができるのか。100足を越える、AIが生み出したスニーカーのデザインを、みんなで見たりしました。

デジサーチのスニーカーオタクもびっくりする組み合わせもあったり。

「AIデザイナー、いいじゃん!」

思わず、そう言いたくなる斬新なスニーカーの画像も並んでいました。

会議で話題の中心となったのは、ディフュージョンモデル。

AIの画像生成の新しいモデルで、2020年に論文で発表されたばかり。日本語で検索しても、まだ情報はほんとど出てきません。

それまで、AIの画像生成の分野を引っ張ってきたのGANモデル。2014年の登場は衝撃だったそうです。GAN、styleGAN、styleGAN2と、着実に進化してきました。

たとえば、たくさんの顔の画像を学習させて、混ぜる。混ぜる割合を変えたり、混ぜるところを変えたり。そうやって、全く存在しない人の顔を高精度に作れるのがGANモデルでした。

でも、その進化とは、全く別のアプローチとして登場したのが、ディフュージョンモデルです。

元の顔の画像に、数学的にノイズをかけて、分からなくする。そこからAIに元の顔を想像してもらう。すると、人間からみれば今までよりもクリエイティブな、顔の画像が生み出せるそうです。

AIは、画像を混ぜるより、画像を想像した方が、優れたデザイナーになる──この大発見は、機械学習ではなく、物理学の発想から生まれました。全く違う分野から新しいものが入ってくることで、時代はグッと進むものなんですね。

会議では、このディフュージョンモデルで何ができるかの話で盛り上がりました。

音楽の話なら……

「平均律の世界では、音階やコードが決まっているから、ルールを学ばせれば、クリエイティブな曲って意外にAIでできるんじゃないですかね?」

「それは、音楽のルールが、微分可能かに、かかっていますね」

「音楽のルールって、微分できるのかな?ピアノの平均律より、倍音の純正律の方が数学的だから、相性が良さそう!でも、そもそも平均律はノイズを入れてるから、ノイズっていう意味ではデフュージョンっぽいですね」

経済の話なら……

「過去の履歴と最近のトレンドから学習するのが最近のAIだと思っていて、ディフュージョンモデルって、あんまり過去に囚われないモデルなのでは」
「過去に囚われないというより、新しい階段が増えるイメージ。進むべき方向が見える。広がっていく。もしかしたら、金融で面白いかも」
「ノーベル経済学賞をとった金融工学のブラックショールズモデルは、ディフュージョンモデルに考え方が近い気がしている」
「あ、wikipedeiaで数式をみてみたら、定式化のところは、ディフュージョンモデルと同じですね!」
「じゃあ、金融工学も結構進化するかもしれないですね!」

そんなちょっとマニアックな話もしながらも、実はつながっていたりするのが、面白かったです。

新しいつながりが生まれるところを、察知できるかどうか。

詳しい道は分からなくても、大きな山や川の特徴は知っている。起業家なら、いつでも探索に出れる方がいい、かもしれません。

知ってるところを深めるのもいいけど、外に新しいことを探しにいくことも忘れずに。

感度を持って経営することは、とっても大事。そんな気がしました──R.Y

※このメディアは企業再生案件など、センシティブな話題があるため、登場人物は全て仮名で表記しております。