ICEIC2025参加 2025년 01월 23일2025년 01월 23일| shinshin| 0 Comments| 4:00 pm| Categories: news Post navigation Previous Previous post: Next Next post: Related Posts 2025년 05월 12일2025년 05월 12일 NVIDIA、長編動画を理解するEagle 2.5 ©NVIDIA NVIDIAは、長いコンテキスト理解に特化したVLM(ビジョン・ランゲージ・モデル)「Eagle 2.5」を発表しました。長編動画や高解像度画像の理解は、マルチモーダルモデルにとって大きな課題とされてきました。 NVIDIAは、効率的な画像サンプリング手法とポストトレーニング(追加学習)フレームワークを組み合わせることで、長編動画の理解能力を大幅に向上させました。Video-MMEベンチマークでは、動画の長さが増しても性能を維持し、8Bサイズの小型モデルでありながら、GPT-4oやQwen2.5-VL-72Bといった大規模モデルに匹敵する性能を示し、AIによる映像解析の効率性を大きく高めました。 Eagle 2.5: Boosting Long-Context Post-Training for Frontier Vision-Language Models https://nvlabs.github.io/EAGLE/ ... Read MoreRead More 2025년 04월 01일2025년 04월 01일 AIニュース(4/1) ©OpenAIOpenAIは、GPT-4oモデルに画像生成機能を新たに追加した。この発表直後から、GPT-4oで生成された4コマ漫画が次々と共有されるなど、大きな反響を呼んでいる。OpenAIは、自社の言語モデルにおいて画像生成が重要な機能の一つであると判断し、最新の画像生成器をGPT-4oに統合した。 今回のアップデートで特に注目すべき点は、優れたテキストレンダリング能力である。従来の画像生成モデルではテキストが潰れてしまうことが多かったが、GPT-4oでは印刷体や手書き風の文字も美しく表現できる。ChatGPTプラットフォームでは、会話の文脈(コンテキスト)を維持しながら生成された画像をさらに修正することができ、ユーザーが求める成果物に至るまで、自然な対話を通じて画像をブラッシュアップしていけるようになった。 → Introducing 4o Image Generation https://openai.com/index/introducing-4o-image-generation/ ... Read MoreRead More 2025년 01월 23일2025년 01월 23일 Development of a Cable-Driven Bionic Spherical Joint for a Robot Wrist Zixun He, Yutaka Ito, Shotaro Saito, Sakura Narumi, Yousun Kang, Duk Shin Biomimetics https://doi.org/10.3390/biomimetics10010052 Abstract Wrist movements play a crucial role in upper-limb motor tasks. ... Read MoreRead More