概要
ローレンツ距離分類器(LDC)は、マシンラーニングの分類アルゴリズムであり、多次元特徴空間からの履歴データを分類することができます。この指標は、ローレンツ分類が、近似最近傍(ANN)アルゴリズムの新しい実装の距離メトリックとして使用されるときに、将来の価格動向の方向を予測するためにも使用できることを示しています。
この指標はバッファとして信号を提供するため、この指標からEAを作成するのが非常に簡単です。
背景
物理学において、ローレンツ空間はアインシュタインの一般相対性理論における時空の曲率を記述する役割で最もよく知られています(2)。興味深いことに、この理論物理学からの抽象的な概念は、取引においても具体的な実世界の応用を持っています。
最近、ローレンツ空間が時系列データの分析にも適しているという仮説が立てられました(4)、(5)。この仮説は、ローレンツ距離が、より一般的に使用されるユークリッド距離(1)、(3)、(6)よりも外れ値やノイズに対してより頑健であることを示すいくつかの実証研究によって支持されています。さらに、ローレンツ距離は、マンハッタン距離、バッタチャリヤ類似度、コサイン類似度(1)、(3)を含む、他の多くの高く評価されている距離メトリックを上回ることも示されています。ダイナミックタイムワーピングに基づくアプローチを除けば、残念ながら現在のPineScriptには計算負荷が高すぎるため、ローレンツ距離メトリックは、さまざまな時系列データセットにおいて常に最高の平均精度を記録しています(1)。
ユークリッド距離は、NNベースの検索アルゴリズムのデフォルトの距離メトリックとして一般的に使用されていますが、金融市場データを扱う際には必ずしも最良の選択とは限りません。これは、金融市場データがFOMC会議やブラックスワンイベントなどの主要な世界的イベントへの近接によって大きく影響を受ける可能性があるためです。このイベントベースの市場データの歪みは、大きな物体が時空連続体に与える重力の歪みに似ていると考えることができます。金融市場において、歪みを経験する類似の連続体は「価格-時間」と呼ばれることがあります。
以下は、三次元ユークリッド空間とローレンツ空間における類似の履歴ポイントの近隣がどのように見えるかの比較です(画像2)。
この図は、ローレンツ空間が価格-時間の歪みをより適切に扱えることを示しています。ローレンツ距離関数は、ユークリッド近隣を圧縮することで、ローレンツ空間における新しい近隣分布が、原点自体に加えて主要な特徴軸の周りにクラスターする傾向があることを意味します。これは、使用される距離メトリックに関係なく、一部の最近傍が同じである場合でも、ローレンツ空間は、ユークリッド距離メトリックでは考慮されない履歴ポイントを考慮することを可能にします。
直感的に、ローレンツ距離メトリックに内在する利点は理解できます。たとえば、パウエル議長がスピーチを終えた後の数時間に発生する価格動向は、彼がスピーチを終えた以前のいくつかの時期に似ていることは論理的です。これは、市場がその時に買われすぎているか売られすぎているか、またはマクロ条件が全体的により強気または弱気であるかどうかに関係なく当てはまるかもしれません。これらの履歴参照ポイントは予測モデルにとって非常に価値がありますが、ユークリッド距離メトリックでは、イベントの前日に関連性のないデータポイントを優先することが多く、これらの近隣を完全に見逃してしまいます。ローレンツ距離をメトリックとして使用することで、MLモデルはイベントによって引き起こされる価格-時間の歪みを考慮し、最終的には時系列によって課せられた時間的バイアスを超越することができます。
この指標で使用される近似最近傍(ANN)アルゴリズムの実装詳細については、ソースコード内の詳細なコメントを参照してください。
使用方法
画像3は、この指標がインターフェースに表示されるさまざまな部分の説明です。
画像4は、この指標のさまざまな設定の説明です。
一般設定:- ソース - デフォルト値は「hlc3」で、入力データソースを制御するために使用されます。
- 近隣数 - デフォルト値は8、最小値は1、最大値は100、ステップは1です。考慮する近隣の数を制御するために使用されます。
- 最大バー数 - デフォルト値は2000です。
- 特徴数 - デフォルト値は5、最小値は2、最大値は5です。ML予測に使用する特徴の数を制御します。
- 色圧縮 - デフォルト値は1、最小値は1、最大値は10です。色スケールの強度を調整するための圧縮係数を制御するために使用されます。
- 出口を表示 - デフォルト値はfalseです。チャート上に出口閾値を表示するかどうかを制御します。
- 動的出口を使用 - デフォルト値はfalseです。カーネル回帰に基づいて出口閾値を動的に調整することで利益を伸ばすかどうかを制御するために使用されます。
特徴エンジニアリング設定:
注:特徴エンジニアリングセクションは、ML予測に使用される特徴を微調整するためのものです。デフォルト値は、ほとんどのチャートの4Hから12Hの時間枠に最適化されていますが、他の時間枠でも合理的にうまく機能するはずです。デフォルトでは、モデルは2つのパラメータ(それぞれパラメータAとパラメータB)を受け入れる特徴をサポートできます。デフォルトで提供される特徴は4つだけですが、異なる設定の同じ特徴は2つの別々の特徴としてカウントされます。特徴が1つのパラメータしか受け入れない場合、2つ目のパラメータはデフォルトでEMAベースのスムージングに設定され、デフォルト値は1です。これらの特徴は、私のテストで遭遇した最も効果的な組み合わせを表していますが、将来的には追加のオプションとして追加の特徴が追加される可能性があります。
- 特徴1 - デフォルト値は「RSI」で、オプションは「RSI」、「WT」、「CCI」、「ADX」です。
- 特徴2 - デフォルト値は「WT」で、オプションは「RSI」、「WT」、「CCI」、「ADX」です。
- 特徴3 - デフォルト値は「CCI」で、オプションは「RSI」、「WT」、「CCI」、「ADX」です。
- 特徴4 - デフォルト値は「ADX」で、オプションは「RSI」、「WT」、「CCI」、「ADX」です。
- 特徴5 - デフォルト値は「RSI」で、オプションは「RSI」、「WT」、「CCI」、「ADX」です。
フィルター設定:
- ボラティリティフィルターを使用 - デフォルト値はtrueです。ボラティリティフィルターを使用するかどうかを制御するために使用されます。
- レジームフィルターを使用 - デフォルト値はtrueです。トレンド検出フィルターを使用するかどうかを制御するために使用されます。
- ADXフィルターを使用 - デフォルト値はfalseです。ADXフィルターを使用するかどうかを制御するために使用されます。
- レジーム閾値 - デフォルト値は-0.1、最小値は-10、最大値は10、ステップは0.1です。トレンド/レンジ市場を検出するためのレジーム検出フィルターを制御するために使用されます。
- ADX閾値 - デフォルト値は20、最小値は0、最大値は100、ステップは1です。トレンド/レンジ市場を検出するための閾値を制御するために使用されます。
カーネル回帰設定:
- カーネルで取引 - デフォルト値はtrueです。カーネルで取引するかどうかを制御するために使用されます。
- カーネル推定を表示 - デフォルト値はtrueです。カーネル推定を表示するかどうかを制御するために使用されます。
- ルックバックウィンドウ - デフォルト値は8、最小値は3です。推定に使用されるバーの数を制御するために使用されます。推奨範囲:3-50
- 相対重み付け - デフォルト値は8、ステップサイズは0.25です。時間枠の相対重み付けを制御するために使用されます。推奨範囲:0.25-25
- バーで回帰を開始 - デフォルト値は25です。回帰を開始するバーのインデックスを制御するために使用されます。推奨範囲:0-25
表示設定:
- バーの色を表示 - デフォルト値はtrueです。バーの色を表示するかどうかを制御するために使用されます。
- バーの予測値を表示 - デフォルト値はtrueです。各バーのMLモデルの評価を整数として表示するかどうかを制御します。
- ATRオフセットを使用 - デフォルト値はfalseです。バー予測オフセットの代わりにATRオフセットを使用するかどうかを制御します。
- バー予測オフセット - デフォルト値は0、最小値は0です。バーの高値または終値からのパーセンテージとしてバー予測のオフセットを制御するために使用されます。
バックテスト設定:
- バックテスト結果を表示 - デフォルト値はtrueです。指定された設定の勝率を表示するかどうかを制御するために使用されます。
引用文献
(1) R. Giusti and G. E. A. P. A. Batista, "時系列分類のための類似度測定の実証比較," 2013年ブラジルインテリジェントシステム会議, 2013年10月, DOI: 10.1109/bracis.2013.22.
(2) Y. Kerimbekov, H. Ş. Bilge, and H. H. Uğurlu, "分類問題におけるローレンツ距離メトリックの使用," パターン認識レター, vol. 84, 170176, 2016年12月, DOI: 10.1016/j.patrec.2016.09.006.
(3) A. Bagnall, A. Bostrom, J. Large, and J. Lines, "偉大な時系列分類ベイクオフ:最近提案されたアルゴリズムの実験的評価." ResearchGate, 2016年2月4日.
(4) H. Ş. Bilge, Yerzhan Kerimbekov, and Hasan Hüseyin Uğurlu, "ローレンツ距離メトリックを使用した新しい分類方法," ResearchGate, 2015年9月2日.
(5) Y. Kerimbekov and H. Şakir Bilge, "複数の特徴のためのローレンツ距離分類器," 第6回国際パターン認識応用および方法会議の議事録, 2017年, DOI: 10.5220/0006197004930501.
(6) V. Surya Prasath et al., "KNN分類器の性能に対する距離測定選択の影響 - レビュー.".
=======================
「再描画」に関する注意:
明確にするために、バーが閉じた後、この指標は再描画しません。これは、ML予測とカーネル推定の両方に当てはまります。
「学習」のためのバー要件に関する注意:
これは貴重な推奨事項です。この指標を使用する際には、H4またはそれ以下の時間枠を使用することが実用的なアプローチです。これは、学習と分析のために履歴価格データが必要であるためです。これにより、指標が価格動向に効果的に学習し適応するために十分な数の履歴バーが確保されます(MT4では、より大きな時間枠で約1000バーがチャートに表示されます)。取引や指標に関連する他の洞察や質問があれば、自由に共有したり質問したりしてください。
バッファに関する注意
この指標からの信号でEAを作成する場合は、iCustomを使用してください(詳細は文書にありますこちら)
GogoJungleを初めてご利用する方へ商品のご利用まではかんたん3ステップ!
GogoJungleでは、会員様向けに、あなたの投資生活を豊かにするサービスをご用意しております。また、商品のご購入は通常会員様に限られさせていただいております。今すぐ会員登録をして、Gogojungleを活用してみませんか!