Related Posts
NVIDIA、長編動画を理解するEagle 2.5
©NVIDIA NVIDIAは、長いコンテキスト理解に特化したVLM(ビジョン・ランゲージ・モデル)「Eagle 2.5」を発表しました。長編動画や高解像度画像の理解は、マルチモーダルモデルにとって大きな課題とされてきました。 NVIDIAは、効率的な画像サンプリング手法とポストトレーニング(追加学習)フレームワークを組み合わせることで、長編動画の理解能力を大幅に向上させました。Video-MMEベンチマークでは、動画の長さが増しても性能を維持し、8Bサイズの小型モデルでありながら、GPT-4oやQwen2.5-VL-72Bといった大規模モデルに匹敵する性能を示し、AIによる映像解析の効率性を大きく高めました。 Eagle 2.5: Boosting Long-Context Post-Training for Frontier Vision-Language Models https://nvlabs.github.io/EAGLE/ ...
AI news(4/7): OpenAI、誰でも利用できるAI教育サイトをオープン
OpenAIが、無料のAI教育サイト「OpenAIアカデミー(OpenAI Academy)」をオープンしました。AIに関する知識のアクセスを大衆化するために作られたこのプラットフォームは、OpenAIのミッションである「汎用人工知能(AGI)が人類全体に恩恵をもたらすことを保証する」という価値観に沿って開発されています。 誰でも無料でコンテンツにアクセスでき、現在は学校や職場でのChatGPT活用法、Soraチュートリアル、教師向けのAI講座などが提供されています。今後はオンラインライブセッションやさまざまなコミュニティ機能も追加される予定です。まだ資格や認定コースなどは提供されていませんが、AI学習へのハードルを大きく下げ、誰もがデジタル時代に必要なAIスキルを身につけられるようになるでしょう。 ...
