Related Posts
AIニュース(4/1)
©GoogleGoogleは、推論能力に重点を置いた言語モデル「Gemini(ジェミナイ)2.5」を発表した。今回公開されたのはGemini 2.5 Proの実験バージョンで、Googleが本格的に推論型AIモデル競争に参入したことを示している。 Gemini 2.5は、アップグレードされたベースモデルとポストトレーニング(後処理学習)を組み合わせて性能を向上させており、LMArena、Humanity’s Last Exam、AIMEといった主要ベンチマークで最先端の成績を収めている。現在、Google AI Studioにアップデートされており、Gemini Advancedのサブスクリプション利用者はGeminiアプリでも利用可能。数学の問題解決や複雑な推論を必要とする日常の課題も、より簡単に解決できるようになっている。 強力なコーディング能力 GoogleはAIによるコーディング性能の向上に注力しており、Gemini 2.5は前バージョンの2.0と比べて大きな進歩を遂げた。今後も継続的な改善が予定されている。Gemini 2.5 Proは、視覚的に魅力あるWebアプリケーションの制作、エージェント型コードの開発、コードの変換・編集など、さまざまな分野で優れた性能を発揮している。 特に、エージェント型コード評価の業界標準とされる「SWE-Bench Verified」では、カスタマイズされたエージェント設定を用いて63.8%という高いスコアを記録し、卓越したコーディング能力を証明した。 以下の動画では、Gemini 2.5 Proがわずか1行のプロンプトから実行可能なコードを生成し、ビデオゲームを制作する様子が確認できる。 ...
OpenAI、「GPT-4.1」モデルを発表
OpenAIのAPIに、マルチモーダル言語モデル「GPT-4.1」が新たに追加されました。現在研究中のGPT-4.5の代替として、はるかに低コストかつ短時間で同等レベルの性能を提供する点が特徴です。 GPT-4.1は、Basic(基本)、Mini(ミニ)、Nano(ナノ)の3種類のモデルサイズで提供されており、コーディング、命令実行、長文コンテキスト理解、画像解析といった分野で、従来のGPT-4oを上回る性能を示しました。もちろん、o1、o3-mini、GPT-4.5といった最新の推論モデルにはやや劣りますが、GPT-4oより約26%安価で利用でき、実用的な選択肢となりそうです。 https://www.youtube.com/live/kA-P9ood-cE?si=TZFYclDmxoW1OApv ...
