Googleが開発しているLLMであるGeminiがランキング1位に。

グーグルが開発中の次世代大規模言語モデル(LLM)「Gemini-1.5-Pro-Exp-0801」が、モデルの性能を評価するベンチマークサイト「Chatbot Arena」2024年7月31日付けランキングで1位になった模様。

各社から新しいAIモデルがリリースされる毎にランキングが塗り替えられている。

Chatbot Arenaはブラインドで2つのAIを人間が使い投票する形式のため、受け答えの実感に近いと思われる。

news.yahoo.co.jp

↓最新のランキングは、こちらから。

arena.lmsys.org

↓Geminiを使ってみたい場合は、こちらから。

aistudio.google.com

 

Azure基盤を利用した情報の安全性に配慮したサービスを展開しているマイクロソフトが、エンタープライズ利用で先行している印象ではあるが、GoogleドライブなどのGoogleサービスとGeminiを掛け合わせたサービスをGoogleも展開を始めている。

pc.watch.impress.co.jp

 

一般利用では今のところChat 機能を通して、AI利用することが一般的であるが、サービス✖️AIが進展し、遠くない将来、AIエージェントが登場して、作業の多くを代替してくれる未来が来るように思われる。今もIFTTTやZapierを使えば構築可能であるが、素人には扱うこと難しく、またメンテナンスも地味に大変であったりする。

AIエージェントとして所定のサービスとして提供される様になるか、AIエージェントに依頼すレバ、複数のサービスや操作を組み合わせた機能が提供される未来を想像している。

www.lac.co.jp

AIエージェントは、Artificial Intelligenceエージンと思っていたら、wikipediaを読んでいたら、Autonomous Intelligent(自律知能) エージェントのAIみたい。

勘違いしていた。。

ja.wikipedia.org

Wikipediaから抜粋すると、AIエージェントの特徴は以下の通り。人類は、SFなど想像した技術を大体実現してきたので、AIエージェントも近い将来開発されると思う。単純作業はだいぶ代替されそうなので、備えが必要。問題としては実現されるまでの時間軸だけど、遠くない将来には実現すると思われる。

環境との相互作用によって学習し改善されていく(Embodiment)
オンラインおよびリアルタイムに適応
大量のデータから高速に学習
絶えず新たな問題解決規則に適応していく
類型や検索に関するデータはメモリ上に持つ
短期記憶や長期記憶、その間の移動や忘却に関してのパラメータを指定できる
自身の動作・失敗・成功などを自己分析できる

以上