【LLM論文】Hierarchical Reasoning Model を受けて、これからのAIについて

ふとインプットしたものについての雑記。

これからAIがどう発展していくかについて思いついたことをつらつらと書いています。

論文の中身については素敵な記事がたくさんあるのでそちらにお任せします。

Hierarchical Reasoning Model

最近パラメータを増やせば解決できるだろうとハードのリソースに頼り切りなモデルが多かった中で一石を投じそうなモデル。論文はこちら

この論文の中身というと、人間の脳の働きを模していて2つのモジュールに分かれ推論するモデルを提案している。

二つのモジュールは、一つが抽象的で長期的な計画を担うモジュールで、もう一つが速い計算を行うモジュール。

これを聞くと、以前話題になっていた本の「ファスト&スロー」内にある「速い思考」と「遅い思考」と同じだ!と率直に感じるところだ。

今流行しているLLMの構造を見るとずっとバランスが悪いなと思っていたが、やはり研究は進んでいたか...。

パラメータを増やせばいいだろうという脳筋プレーもいいんだが、なんかそれだと人間のニューロン数をたやすく超えてしまってスマートではなかった。そのため、LLMの構造が変化するというのは非常に嬉しいところ。

今後

今後はこの構造が市場に出てくる段階がある。

遠い未来で量子科学の分野で情報伝達にさらなる革新が起こり、人工知能分野に大きな影響を与えてくれるだろうなとふと思うところだ。

また、個人的には今年出た論文のPHOTONと呼ばれる新しいモデルアーキテクチャもチェックしたいと思っている。

こちらはTransformerモデルの課題を解決する試みをしている。なんだかんだ言っても、LLMの構造、そしてその構造改革は人間がどう考えているのかについてもヒントを与えていそうでワクワクする分野である。AGIにはまだまだ遠く見えるが着実な一歩だと思うので、今後も様々な論文を追いかけていきたい。

おすすめの論文があればシェアいただければ嬉しい限りである。

参考文献

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です