第65回 SFでは当たり前のように書かれる空間コンピューティングの技術ついて、面白い論文があったので、紹介してみた。(2)
前回は脳信号デコーディングの面白い論文紹介をしました。
もし読んでおられない方はそちらから読んでいただいた方が楽しめるかもしれません。
●’26/1/25(日)
前回、被験者の見た画像を被験者の脳信号から作る、いわゆる”脳神経デコーディング”について、現在の著しい技術発展を見ていただいた。
しかし、この脳信号デコーディングにおいて、大きい難点がある。
それは脳信号が人によって異なる点。
そして、まだあまり多くのデータが収集できていない点である。
この点に対して、2023年のシンガポール大学から出ている
”Seeing Beyond the Brain: Conditional Diffusion Model with Sparse Masked Modeling for Vision Decoding”
(脳を通して”見る”: 視覚デコードのためのスパースマスクモデリングを用いた条件付き拡散モデル)
では、新しい技術により、その壁を乗り越える試みが実施されている。
その技術というのは ”データマスキング” と ”ノイズ付与による逆進行学習” である。
まずは ”データマスキング”。
これはデータの一部をマスキングして、その部分をAIに予測させて学習させることを行っている。
イメージとしては画像の一部を隠してその部分を予測させるようなものである。
そのマスキングする部分を変えてはそれを学習させる1データとして活用する。
マスキングする部分、サイズを変える度にデータが増えるわけである。
これによって少ないデータでも、あたかも多くのデータを持っているように学習を発展させることができ、その試みはうまく機能しているようである。
実はこれは工業製品の画像処理においては比較的良くある手法であるが、それが生体データにも適用可能であることを示したコロンブスの卵的開発である。
次に ”ノイズ付与による逆進行学習”。
これはデータに少しノイズを加えて、そのデータを学習させる。
さらにノイズを加えて学習。またノイズを加えて学習。
これを繰り返し、元データが判断できなくなるまで、そのデータの持つ特徴を学習させることを行っている。
そして、それによってデータをノイズ付与前に戻すための生成関数の逆関数を作らせる。
そこも様々なデータを与えて学習させる。
これによって、多数のノイズが入ったデータからも正しい”らしい”データが生成可能となるわけである。
この2点のアプローチによって、人による違いなども含めて精度が飛躍的に向上したようである。
解析の方法がAIがあってこそのアプローチであるようにも感じて面白い。
さらには如何にAIに学習させるかというところにまだまだ人間が必要であることも明らかとなっていると感じる。
マルチモーダル学習の飛躍的な技術発展から考えると、これからいろんなデータ取得方法が開発されていくのだろうなと感じた。
そこで、気になったのが特許である。
私は仕事上結構特許を書くのだが、競合他社の動向を調べる時に特許を調べたりもする。
それと同じように、脳信号デコーディングに関する特許を調べた内容がコンサルティング会社であるastamuse companyのホームページにあったので、それを信じて抜粋させていただく。(笑)
(上げた画像はそれなりの解像度であるが、見ると表示も小さく、解像度も荒くなっているので、見えにくいかも。)
年が進むにつれて非常に件数が伸びている部分を見ると、モーダル学習、解析方法よりもデータ信号取得の伸びが大きい。
この表に出てくる特許は公開されたもののみである。
特許は出願から1年半以内に公開する必要がある。そのため、公になった特許というのは技術が発見されて1年半後である。
マルチモーダル学習の論文が2024年。
特許のデータは2023年までであるため、この段階では研究者内ではまだまだデータの多様性不足を感じていたところなのかもしれないが、現在の特許件数を調べると大きく変化しているのかもしれない。
(すみません。そこまで時間が取れないので、また分かったら上げます。。。)
特許の出願国であるが、件数を国別に分けると、中国が最も多く、アメリカ、韓国、EU、日本の順のようである。
日本は第一人者、パイオニアがいたにも関わらず現在のところ低迷している。
ここが、ちょっと悲しいところである。
半導体のラピダスだけでなく、こういった技術やフィジカルAI(ロボティクス+AI)にも積極的に投資しないと、現状様々なテック技術において、日本がかなり置いていかれるような危機感を感じているのは私だけであろうか。
そして、この脳信号デコーディングにも当然であるが、スタートアップ企業が存在する。
多くはアメリカ企業のようで、その中に2008年創業のBlackrock Neurotechという企業がある。
この企業では思考のみでメール送信やロボットアーム操作を行った実績があり、さらにはタイピング90文字/分、思考解読62語/分を達成したそうである。
これを読み、もうこんなところまで来ているのかとかなり驚いた。
確かにこの脳信号デコーディングは最初に障害者に対してのサービスとして立ち上げられるのだろうが、近い将来本当に健常者と変わらない状態を作り得るのだろう。
科学が不条理を1つ乗り越える良い例となるかもしれない。
最後に今までの真面目な内容をぶち壊すようで申し訳ないが、この脳信号デコーディングの論文や記事を読みながら、
「これがゲームに応用されたら、宇宙戦争もので、思考によりフィンファンネルを多数操縦して無双するモジャモジャ茶髪の青年パイロットが現れたりするんかな?」
と勝手な妄想を膨らませていた。(笑)
私の書いた”タキオンの矢”のような世界が来るのかもしれない。(笑)
暗い世の中が少し明るく見える、そんな論文、記事でした。
あとがきは割愛させていただきます。
読んでいただき、ありがとうございました。




