第5章 深層学習:転移学習 🔄 転移学習とは? なぜ転移学習が有効なのか? 従来のアプローチの問題点 転移学習の利点 転移学習の直感的理解 転移学習の仕組み 📦 事前学習済みモデルの紹介 主要な事前学習済みモデル モデル 年 層数 パラメータ数 Top-5精度 特徴 VGG16 2014 ...
第5章 深層学習:転移学習 🔄 転移学習とは? なぜ転移学習が有効なのか? 従来のアプローチの問題点 転移学習の利点 転移学習の直感的理解 転移学習の仕組み 📦 事前学習済みモデルの紹介 主要な事前学習済みモデル モデル 年 層数 パラメータ数 Top-5精度 特徴 VGG16 2014 ...
第4章 深層学習:CNN Ⅱ 🔄 第3章の復習:Convolutionの基礎 📐 Conv2Dのパラメータ 多チャンネル入力への適用例 例1:RGB画像への適用 例2:特徴マップへの適用 🔢 パラメータ数の詳細計算 基本的なパラメータ計算式 📊 計算例:段階的な理解 例1:最初のConv2D層 計算過程: 例2:2番目のConv2D層 計算過程: 例3:Dense(全結合)層 ...
第3章 深層学習:CNN Ⅰ 🧠 深層学習の概要 💡 深層学習(Deep Learning)とは? 深層学習は、人間の脳の学習と記憶のメカニズムを模倣した方法です。 多層のニューラルネットワークを用いて、データから自動的に特徴を抽出し、複雑なパターンを学習します。 深層学習が学習すること 学習の仕組み 💡 最適化アルゴリズム 学習データの予測誤差を最小化できるように、重み(W)を最適化するアルゴリズムで学習します。 🎯 深層学習の長所と短所 ✅ 長所 ⚠️ ...
第2章 機械学習:回帰 🚀 イントロダクション 🔍 分類 vs 回帰 📊 分類(Classification) 📈 回帰(Regression) 🔄 分類と回帰の違いまとめ 観点 分類 回帰 予測対象 カテゴリ・ラベル 連続的な数値 ...
総合演習Ⅱ 機械学習と深層学習 著者:姜 有宣・辛 徳 📖 目次 第1章 機械学習:分類・識別 パターン認識の基礎とscikit-learnによる実習 第2章 機械学習:回帰 線形回帰と勾配降下法の理解 第3章 深層学習:CNN Ⅰ 畳み込みニューラルネットワークの基礎 第4章 深層学習:CNN Ⅱ ...
DSGの新しい挑戦 https://www.mlsysbook.ai/ 機械学習システムは、機械学習(ML)システムの理解とエンジニアリングのための体系的なフレームワークを提供します。本書は、理論的な基礎と実践的なエンジニアリングのギャップを埋め、効果的なAIソリューションの構築に必要なシステムの視点を重視しています。アルゴリズムやモデルアーキテクチャに主眼を置くリソースとは異なり、本書はデータエンジニアリング、モデル最適化、ハードウェアを考慮したトレーニング、推論の高速化など、MLシステムが動作するより広範なコンテキストに焦点を当てています。読者は、MLシステムアーキテクチャについて推論する能力を養い、柔軟で効率的かつ堅牢な機械学習システムを構築するための永続的なエンジニアリング原則を適用できるようになります。 ...
©NVIDIA NVIDIAは、長いコンテキスト理解に特化したVLM(ビジョン・ランゲージ・モデル)「Eagle 2.5」を発表しました。長編動画や高解像度画像の理解は、マルチモーダルモデルにとって大きな課題とされてきました。 NVIDIAは、効率的な画像サンプリング手法とポストトレーニング(追加学習)フレームワークを組み合わせることで、長編動画の理解能力を大幅に向上させました。Video-MMEベンチマークでは、動画の長さが増しても性能を維持し、8Bサイズの小型モデルでありながら、GPT-4oやQwen2.5-VL-72Bといった大規模モデルに匹敵する性能を示し、AIによる映像解析の効率性を大きく高めました。 Eagle 2.5: Boosting Long-Context Post-Training for Frontier Vision-Language Models https://nvlabs.github.io/EAGLE/ ...
OpenAIのAPIに、マルチモーダル言語モデル「GPT-4.1」が新たに追加されました。現在研究中のGPT-4.5の代替として、はるかに低コストかつ短時間で同等レベルの性能を提供する点が特徴です。 GPT-4.1は、Basic(基本)、Mini(ミニ)、Nano(ナノ)の3種類のモデルサイズで提供されており、コーディング、命令実行、長文コンテキスト理解、画像解析といった分野で、従来のGPT-4oを上回る性能を示しました。もちろん、o1、o3-mini、GPT-4.5といった最新の推論モデルにはやや劣りますが、GPT-4oより約26%安価で利用でき、実用的な選択肢となりそうです。 https://www.youtube.com/live/kA-P9ood-cE?si=TZFYclDmxoW1OApv ...
©Google Googleは、既存のGemini 2.5 Proよりも軽量かつ高速なモデル「Gemini 2.5 Flash」を発表しました。現在、Google AI StudioおよびVertex AIのGemini APIを通じて利用可能です。 このモデルは、速度とコスト効率を向上させつつ、段階的な思考を促すハイブリッド推論機能を採用し、応答品質、コスト、速度のバランスを柔軟に調整できるよう設計されています。推論機能をオフにした状態でも高速な応答を維持し、全体的な性能も向上しています。実際、LMArenaの「Hard Prompts(難易度の高い質問)」部門では、Gemini 2.5 Proに次いで2位を獲得しました。 ...
Metaは2025年4月5日、次世代の大規模言語モデル(LLM)ファミリー「Llama 4」を発表しました。このシリーズには、マルチモーダル対応の「Llama 4 Scout」と「Llama 4 Maverick」、そして現在トレーニング中の「Llama 4 Behemoth」が含まれています。 🦙 Llama 4 Scout:軽量かつ高性能なマルチモーダルモデル 🦙 Llama 4 Maverick:高性能なエンタープライズ向けモデル 🦙 Llama 4 Behemoth:トレーニング中の巨大モデル ...