ランダムフォレスト

ランダムフォレスト(Random Forest)は、決定木を数百本、データとfeatureをランダムにサンプリングしてそれぞれ別々に学習させ、多数決(分類)または平均(回帰)で最終予測を出すアンサンブルモデルです。

決定木

決定木(Decision Tree)は、「このfeatureがX以上か?」という質問を上から順に繰り返してデータを分け、最後の葉(leaf)で予測値を出す分類・回帰モデルです。

LSTM (長・短期記憶)

LSTM (Long Short-Term Memory · 長・短期記憶)は、RNNが長いシーケンスで前半を忘れる問題を解決するために設計されたニューラルネットです。

RNN (再帰型ニューラルネットワーク)

RNN (Recurrent Neural Network · 再帰型ニューラルネットワーク)は、シーケンス(文・時系列・音声など順序のあるデータ)を1トークンずつ処理しながら、前の状態を隠れ状態(hidden state)として次のstepに渡すニューラルネット構造です。

CNN (畳み込みニューラルネットワーク)

CNN (Convolutional Neural Network · 畳み込みニューラルネットワーク)は、小さなフィルタ(カーネル)を画像上でスライドさせて局所パターンを抽出する構造のディープラーニングモデルです。

ロジスティック回帰

ロジスティック回帰(Logistic Regression)は、名前は「回帰」ですが実際には二値分類(例:スパムかどうか)を行う、最も古い統計・ML手法の一つです。

XGBoost

XGBoostは、複数の浅い決定木を順番に積み重ね、前の木の誤差を次の木が補うように学習するgradient boostingアルゴリズムです。Chen & Guestrinが2016年の論文で公開し、Kaggleコンペで圧倒的な成績を収め、表形式データ(tabular)分野のde facto標準となりました。

SVM (Support Vector Machine)

SVM (Support Vector Machine)は、2つのクラスを分ける決定境界(hyperplane)をデータ点から最も遠くなるように探す分類アルゴリズムです。

Adaptive Thinking

Adaptive Thinkingはモデルが質問の難易度を自ら判断してreasoning深度を調整する仕組みです。単純な質問は素早く答え、複雑な質問は内部で長い段階推論を自動的に走らせます。

システムカード

システムカード(System Card)はモデルカードよりもう一段上で「デプロイ済みシステム全体」を記述する文書です。モデル本体だけでなく、入力フィルタリング、出力セーフガード、プロンプトテンプレート、モニタリング体制まで含めて公開します。

JAKO