BEST アルゴリズムと予測結合による予測エンジンのコール

このトピックでは、BEST アルゴリズムを使用して予測エンジンをコールするために使用する技術、および予測結合技術について説明します。選択した技法は、1 ステップ先の予測の結果を結合し、結合により予測の精度が改善するかどうかを判定するために使用されます。

[クラシック結合] オプションを選択すると、次の技法が使用されます。

  • 単純平均: 予測の平均値を計算します。
  • 三重平均: 予測値を昇順でソートし、「x」極限値 (両端) の値を削除して平均値を計算します。「x」はトリム係数によって定義されます。
  • ウィンザライズド平均: 予測値をソートし、極限値「x」 (両端) を「x+1」に置き換えて平均値を計算します。「x」はウィンザー係数によって定義されます。
  • 重み付け AIC: 最初の「x」の最良 AIC 値の重みを計算します。

このオプションは、予測を結合するために、線形回帰 (MLR) の方法を適用できます。

  • 確率的勾配降下法 (SGD) および train-test 手法を使用する MLR:
    • 予測エンジンで [機械学習の完全データセットランダム化] が選択された場合に、ランダム化ありで適用されます。
    • 予測エンジンで「機械学習の完全データセット」が選択されている場合、ランダム化なしで適用されます。
  • 予測エンジンで「機械学習のクロス検証」を選択した場合、確率的勾配降下法 (SGD) を使用する MLRと、クロス - 検証手法が適用されます。

MLR 技術は、一連の重量 (ある期間内の各予測、つまり各アルゴリズムにつき 1 つ) を計算します。

  • 加重の初期セットと切片 (予測に関連しない基礎のレベル) を設定します。
  • 予測エンジンパラメーターで定義された、すべての「エポック」データポイントの数をループします。
  • SGD を使用して各メインループ内の各データポイントの重みを再計算します。したがって、重量は、その 1 ステップ先の予測の割合に観察を乗じた結果を考慮して調整されます。パーセンテージは、予測エンジンパラメーターで定義された学習レートによって決まります。
  • ランダム化が要求されたとき (つまり、ランダムな番号のシード = 0) である場合、テストまたはトレーニングデータの順序はランダムです。
注: 結合オプションは相互に排他的ではありません。予測結合プロセスには、すべての方法を含めることができます。