تعلم الآلة تداول العملات الأجنبية
جون V.
البيانات الكبيرة. الشركات الناشئة. تجارة.
البيانات الكبيرة. الشركات الناشئة. تجارة.
آلة يدق الإنسان: استخدام آلة التعلم في الفوركس.
تعلم الآلة والتداول هو موضوع مثير جدا للاهتمام. بل هو أيضا موضوع حيث يمكنك قضاء طن من الوقت كتابة التعليمات البرمجية وأوراق القراءة وبعد ذلك طفل يمكن أن يضربك في حين لعب ماريو كارت.
في المشاركات التالية، سنتحدث عن:
تحسين الإدخالات والمخارج. وهذا فقط وهذا يمكن أن تجعل طن من الفرق في لفة البنك الخاص بك. حساب حجم الموقف (في حال كنت لا تحب معيار كيلي) البحث عن علاقة محتملة بين أزواج مختلفة (تداول الزوج). أنا أحب اليورو مقابل الدولار مقابل مقابل غبجبي الارتباط! حساب الدعم & أمب؛ خطوط المقاومة.
ولكن ما هو التعلم الآلي؟
خوارزميات التعلم الآلي هي خوارزميات حيث يمكن للآلة تحديد الأنماط في البيانات الخاصة بك. ياب، هو بهذه البساطة. على سبيل المثال، تجد جميع الحيوانات في هذه الصورة ورسم مربع من حولهم. أيضا، اسم هذا الحيوان. مجنون أعرف. للتداول كما يمكنك أن تتخيل أنها مشابهة جدا:
من أجل آلة ل "تعلم"، تحتاج إلى تعليمه ما هو حق أو خطأ (التعلم تحت الإشراف) أو إعطائها مجموعة كبيرة من البيانات والسماح لها حصلت البرية (غير خاضعة للرقابة). لتحديد الأجسام هذا هو مباشرة إلى الأمام ولكن ماذا عن التداول؟
نظرت حولي لمعرفة ما إذا كان هناك أي برنامج تعلم الآلة التي يمكن تحديد خطوط S / R ولكن دون جدوى. لذلك قررت أن أكتب أول برنامج تعلم الآلة في الثعبان الذي يحدد خطوط الدعم والمقاومة في بيثون. آخر أول! الصيحة!
ولكن كيف يمكن للخوارزمية تحديد هذه المجالات؟ Hoooooow؟ السيدات والرجال (والروبوتات)، واسمحوا لي أن أعرض لكم ل مينشيفت، خوارزمية غير خاضعة للرقابة التي تستخدم في الغالب للتعرف على الصور وغير تافهة جدا لإعداد وتشغيل (ولكن أيضا بطيئة جدا).
والفكرة هي أن هذه الخوارزمية سوف تسمح لي تقسيم البيانات الخاصة بي (القراد النقد الاجنبى) في المناطق وبعد ذلك يمكنني استخدام "حواف" كخطوط الدعم والمقاومة. فكرة باردة ولكن هل يعمل؟
نحن نحلل حوالي 12 مليون داتابوانتس من اليورو مقابل الدولار الأميركي في عام 2014 وبضعة أشهر من عام 2015. يتم وضع خطوط المقاومة تلقائيا من خلال خوارزمية التعلم الآلي.
ما هو رائع حقا (ومشبك) هو أن الخوارزمية إلى حد كبير المسامير ذلك. الأظافر من الصعب. فإنه يحصل عصبي حقا عندما نحن ذاهبون لاستخدام خوارزمية لتحديد الهياكل الصغيرة وبدء سلخ فروة الرأس.
النظام قادر على معالجة أي نوع من بيانات المرات (الأسهم، الفوركس، الذهب، أيا كان)، وسوف تجعل الرسم البياني التفاعلية هتمل (مثل الرسم البياني أعلاه) مع البيانات الخاصة بك والآلة ولدت S / L. رمز هنا حتى يذهب مجنون.
الآن دعونا خطوة من خلال التعليمات البرمجية. بعد أن يكون لديك مجموعة من البيانات تحتاج إلى قراءتها وتنظيفها. الاستعداد لبعض السحر الباندا.
نحن إسقاط القيم الفارغة (عطلة نهاية الأسبوع) وبعد ذلك نحن إعادة رسم البيانات إلى 24 ساعة الشمعدانات (أوهكل). وهذا يجعل من الأسهل بكثير مؤامرة. و grouped_data هي البيانات التي سوف تتغذى في خوارزمية مل.
ثم نقوم بإعداد البيانات التي نحن ذاهبون لاستخدامها في الغو.
في المنصب التالي، سنناقش كيفية جعل هذا العمل أفضل، ونناقش بعض النتائج المثيرة جدا للاهتمام (هل يمكن للخوارزمية التنبؤ فعلا بالمستقبل؟) والبدء في استخدامه في التداول الخاص بنا. إذا كنت ترغب في التحقق من المقال التالي وقراءة المزيد عن التداول والاستثمار باستخدام الخوارزميات، الاشتراك في النشرة الإخبارية.
القادمة القادمة: تعلم آلة ذهب البرية - استخدام التعليمات البرمجية!
إذا كان لديك المزيد من ردود الفعل، بينغ لي في جونروميرو أو الاشتراك في النشرة الإخبارية.
قانوني خارجي. هذا هو برنامج تعليمي هندسي حول كيفية بناء منصة ألغوترادينغ للتجريب و فان. أي اقتراحات هنا ليست النصائح المالية. إذا كنت تفقد أي (أو كل) لك المال لأنك اتبعت أي نصائح التداول أو نشر هذا النظام في الإنتاج، لا يمكنك إلقاء اللوم على هذه بلوق عشوائي (و / أو لي). استمتع على مسؤوليتك الخاصة.
تعلم تداول الفوركس الآلي
التوقعات. هذا تحسن كثيرا من عامل الربح (الربح الإجمالي مقسوما على الخسارة الإجمالية) من استراتيجيتنا. نحن نستخدم رافعة مالية لزيادة أو تقليل المخاطر والعائد المتوقع.
عيوب استراتيجية التداول التلقائي.
يمكننا مراقبة السوق والانتظار لتلك اللحظة عندما استراتيجيتنا لا تعمل بعد الآن باستخدام الإحصاءات التي ينبغي أن تتبع استراتيجية مثل الحد الأقصى التراجع التوالي وعن طريق رصد حجم. ثانيا، يمكننا أن نفعل ما يسمى التعلم على الخط حيث يتم باستمرار تحسين استراتيجيتنا على البيانات الجديدة. هذا الخيار الثاني هو ممارسة جيدة لكنه لا يحمي من التغييرات المفاجئة التي هي نموذجية في النقد الاجنبى كل بضع سنوات. الحل الأمثل هو تنفيذ كل من تلك الأساليب عن طريق تحسين استراتيجياتنا بانتظام مع إدراك أن تغيير أعمق في الاستراتيجية سيكون في نهاية المطاف ضروريا.
والنقد الآخر هو أننا لا نفهم أبدا ما يفعله نموذج الصندوق الأسود. ليس هذا هو الحال بالنسبة لنا كما نموذجنا هو بسيط جدا في الواقع، ولكن نحن سوف تأخذ سر قبرنا أو على الأقل حتى الاستراتيجية ليست مربحة بعد الآن.
الميكانيكية الفوركس.
التداول في سوق الفوركس باستخدام استراتيجيات التداول الميكانيكية.
تعلم الآلات في تجارة الفوركس: لماذا العديد من الأكاديميين يفعلون كل شيء خاطئ.
بناء استراتيجيات التعلم آلة التي يمكن الحصول على نتائج لائقة في ظل ظروف السوق الحية كانت دائما تحديا هاما في التداول الخوارزمية. على الرغم من كمية كبيرة من الفائدة والمكافآت المحتملة لا يصدق، لا تزال هناك أي منشورات الأكاديمية التي هي قادرة على إظهار تعلم آلة جيدة النماذج التي يمكن أن تعالج بنجاح مشكلة التداول في السوق الحقيقي (إلى حد علمي، بعد تعليق إذا كان لديك واحد وأنا & # 8217؛ ليرة لبنانية تكون أكثر من سعداء لقراءتها). على الرغم من أن العديد من الأبحاث المنشورة تظهر نتائج واعدة، غالبا ما تكون هذه الأوراق في مجموعة متنوعة من المشاكل التحيز الإحصائية المختلفة التي تجعل نجاح السوق الحقيقي لاستراتيجيات التعلم الآلي الخاصة بهم غير محتملة للغاية. في اليوم & # 8217؛ الصورة سوف أتحدث عن المشاكل التي أرى في البحوث الأكاديمية ذات الصلة مع تعلم الآلة في الفوركس، وكيف أعتقد أن هذا البحث يمكن تحسينها لإعطاء معلومات أكثر فائدة بكثير لكل من المجتمعات الأكاديمية والتجارية.
معظم المزالق في تصميم استراتيجية التعلم الآلي عند القيام تداول الفوركس هي ورثت حتما من عالم مشاكل التعلم الحتمية. عند بناء خوارزمية التعلم الآلي لشيء مثل التعرف على الوجه أو التعرف على الحروف هناك مشكلة محددة جيدا لا يتغير، والتي يتم معالجتها بشكل عام من خلال بناء نموذج التعلم الآلي على مجموعة فرعية من البيانات (مجموعة التدريب) ومن ثم اختبار إذا كان النموذج قادرا على حل المشكلة بشكل صحيح باستخدام تذكير البيانات (مجموعة اختبار). هذا هو السبب في أن لديك بعض مجموعات البيانات الشهيرة وراسخة التي يمكن استخدامها لتحديد نوعية تقنيات التعلم آلة وضعت حديثا. غير أن النقطة الرئيسية هنا هي أن المشاكل التي تناولها التعلم الآلي في البداية كانت حتمية في معظمها ووقت مستقل.
عند الانتقال إلى التداول، وتطبيق هذه الفلسفة نفسها تنتج العديد من المشاكل التي تتعلق بك مع كل من الطابع غير المحدد جزئيا للسوق واعتماده الوقت. مجرد محاولة محاولة اختيار مجموعات التدريب والاختبار يقدم قدرا كبيرا من التحيز (تحيز اختيار البيانات) الذي يخلق مشكلة. إذا تم تكرار الاختيار لتحسين النتائج في مجموعة الاختبار & # 8211؛ والتي يجب أن نفترض يحدث في بعض الحالات على الأقل & # 8211؛ ثم يضيف المشكلة أيضا قدرا كبيرا من البيانات التحيز التعدين. كما أن المسألة الكاملة المتمثلة في القيام بعملية تدريب / التحقق من صحة واحدة تولد أيضا مشكلة تتعلق بكيفية تطبيق هذه الخوارزمية عند التداول المباشر. وبحكم التعريف فإن التداول المباشر سيكون مختلفا لأن اختيار مجموعات التدريب / الاختبار يحتاج إلى إعادة تطبيقه على بيانات مختلفة (كما هو الحال الآن، فإن مجموعة الاختبارات هي بيانات غير معروفة حقا). والتحيز المتأصل في الاختيار الأولي في العينة / خارج العينة، وعدم وجود أي قواعد مختبرة للتداول في ظل بيانات غير معروفة يجعل هذه التقنيات تفشل عادة في التداول المباشر. إذا تم تدريب خوارزمية مع بيانات الفترة 2000-2012 وتم التحقق من صحتها مع بيانات الفترة 2012-2015 ليس هناك ما يدعو إلى الاعتقاد بأن نفس النجاح سيحدث إذا تم تدريبه في بيانات الفترة 2003-2015 ثم تم تداوله مباشرة من 2015 إلى 2017، هي مختلفة جدا في الطبيعة.
قياس نجاح الخوارزمية هي أيضا مشكلة ذات صلة جدا هنا. لا بد من قياس خوارزميات التعلم الآلي المستخدمة للتداول في الجدارة من خلال قدرتها على توليد عوائد إيجابية ولكن بعض الأدبيات تقيس مزايا تقنيات خوارزمية جديدة من خلال محاولة قياس قدرتها على التنبؤات الصحيحة للهيئة. التنبؤات الصحيحة لا تعادل بالضرورة تداول مربح كما يمكنك أن ترى بسهولة عند بناء المصنفات الثنائية. إذا حاولت التنبؤ بالشمعة القادمة و # 8217؛ s الاتجاه لا يزال بإمكانك أن تجعل الخسارة إذا كنت في الغالب الحق على الشموع الصغيرة والخطأ على الشموع أكبر. في الواقع معظم هذا النوع من المصنفات & # 8211؛ معظم تلك التي لا تعمل & # 8211؛ في نهاية المطاف التنبؤ الاتجاه مع دقة أعلى من 50٪، ولكن لم تتجاوز المستوى المطلوب لتجاوز اللجان التي من شأنها أن تسمح تداول الخيارات الثنائية مربحة.
لبناء استراتيجيات التي هي في الغالب التخلص من المشاكل المذكورة أعلاه لقد دعت دائما لمنهجية يتم إعادة تدريب خوارزمية تعلم الآلة قبل اتخاذ أي قرار التدريب. باستخدام نافذة متحركة للتدريب وعدم اتخاذ أكثر من قرار واحد دون إعادة تدريب خوارزمية كاملة يمكننا التخلص من التحيز الاختيار الذي هو متأصل في اختيار مجموعة واحدة في العينة / خارج العينة. وبهذه الطريقة الاختبار كله هو سلسلة من التدريبات / التحقق من صحة التي تنتهي في نهاية المطاف ضمان أن خوارزمية التعلم الآلي يعمل حتى في ظل مجموعات بيانات التدريب مختلفة بشكل كبير. وأنا أيضا أدعو إلى قياس الأداء الفعلي باكتستينغ لقياس خوارزمية التعلم الآلي & # 8217؛ ق الجدارة وعلاوة على ذلك أود أن تذهب إلى حد القول بأن أي خوارزمية يمكن أن تكون قيمة ملحها دون أن يثبت في ظل ظروف حقيقية خارج العينة . تطوير الخوارزميات بهذه الطريقة هو أصعب بكثير وأنا لم أكن العثور على ورقة أكاديمية واحدة التي تتبع هذا النوع من النهج (إذا فاتني أنه لا تتردد في نشر رابط حتى أتمكن من تضمين تعليق!).
هذا لا يعني أن هذه المنهجية هي مشكلة خالية تماما ومع ذلك، فإنه لا يزال يخضع للمشاكل الكلاسيكية ذات الصلة لجميع عمليات بناء استراتيجية، بما في ذلك التحيز منحنى المناسب والتحيز التعدين البيانات. هذا هو السبب في أنه من المهم أيضا لاستخدام كمية كبيرة من البيانات (يمكنني استخدام 25+ سنوات لاختبار النظم، ودائما إعادة التدريب بعد كل آلة التعلم المستمدة القرار) وإجراء اختبارات تقييم التحيز التعدين البيانات الكافية لتحديد الثقة التي نحن يمكن القول أن النتائج لا تأتي من فرصة عشوائية. صديقي ألغوترادرجو & # 8211؛ الذي يحدث أيضا أن يكون عضوا في بلدي التداول المجتمع & # 8211؛ ينمو حاليا موضوع في فوريكسفاكتوري بعد نفس هذا النوع من الفلسفة لتطوير التعلم الآلي، ونحن نعمل على بعض خوارزميات التعلم الآلي جديدة لمجتمع التداول بلدي. يمكنك الرجوع إلى موضوعه أو المشاركات السابقة على بلدي بلوق لعدة أمثلة من خوارزميات التعلم الآلي وضعت بهذه الطريقة.
إذا كنت ترغب في معرفة المزيد عن التطورات في مجال التعلم الآلي وكيف يمكنك أيضا يمكن أيضا تطوير استراتيجيات التعلم الآلي الخاصة بك باستخدام F4 فريميورك يرجى النظر في الانضمام أسيريكوي، موقع مليئة أشرطة الفيديو التعليمية ونظم التداول والتنمية وصوت صادق واتباع نهج شفاف تجاه التداول الآلي.
5 الردود على & # 8220؛ آلة التعلم في تجارة الفوركس: لماذا العديد من الأكاديميين يفعلون كل خطأ & # 8221؛
مادة كبيرة، والمشاكل التي تسليط الضوء هي بالتأكيد صالحة للنظام متانة!
سؤال لدي، هل من الطبيعي أن أقول إي للقيام به بشكل جيد جدا في زوج معين والقيام الرهيبة في جميع الآخرين؟
أو، يجب أن قوية إي القيام بشكل جيد في عدة أزواج على الأقل، من دون أي تغيير في الإعدادات!
شكرا، على أفكارك العظيمة.
هذا السؤال مثير للاهتمام؛ س). وأعتقد أن السؤال هو أفضل صياغة كما & # 8220؛ يمكن أن النظام الذي يبقى على زوج واحد فقط توليد عائدات عندما يعيش تداول؟ & # 8221؛ والجواب هو نعم (سواء من الناحية النظرية ومن تجربتي الخاصة). عدم وجود إرجاع على زوج واحد فقط لا يعني أن النظام & # 8220؛ سيء & # 8221؛ بل يعني ببساطة أنه يستغل عدم الكفاءة التاريخية التي لا توجد إلا على صك واحد. شريطة أن تأخذ الرعاية من مصادر التحيز (مثل التحيز التعدين البيانات والتحيز منحنى المناسب) ليس هناك سبب لماذا هذا لن يعمل.
الآن، إذا كان لديك نظام يعمل عبر العديد من الرموز ثم التحيز التعدين البيانات سوف تكون أضعافا مضاعفة لنظام متساو الذي يعمل فقط على رمز واحد والانحياز المناسب منحنى سيكون أيضا أقل بسبب استخدام المزيد من البيانات. لذلك أود أن أقول أنه & # 8217؛ ق أفضل، ولكن بالتأكيد ليس مطلوبا.
ولكن تذكر، قياس التحيزات الإحصائية الخاصة بك!
أنا سعيد جدا أن قلت أنه ليس من الضروري تحقيق الربح في جميع أزواج! أيضا منحنى المناسب، كيف يمكن للمرء أن يعرف الحد من التغيير والتبديل المسموح به قبل أن تصبح جاهزة؟
وأخيرا، لقد فعلت اختبار بسيط جدا باستخدام معيار عداء متحرك إي على MT4، لمعرفة أي أزواج سوف تتفاعل على نطاق واسع إلى ما. أنا باكستد 52 زوجا لمعرفة كم & # 8216؛ فترة الانتقال & # 8217؛ بين (1-20) من شأنه أن يحقق ربحا، بغض النظر عن السحب. كنت أتساءل ما جعل لكم من النتائج!
* 5 سنوات فترة الاختبار.
* تراجع لا يقاس.
* 52 أزواج اختبار.
* إعدادات اختبار (الفترات 1-20).
1 23 أزواج، لا ربح على أي إعدادات شريط 1-20.
2 6 أزواج، يمكن أن تجعل الربح فقط على 1 الإعداد.
3 14 أزواج فقط، عاد الربح على 5، أو أكثر إعدادات مختلفة.
4 5 أزواج فقط، عاد الربح على 10، أو أكثر إعدادات مختلفة.
1 بتكوسد 19 إعدادات من أصل 20، حققت أرباحا.
تحتاج إلى التمييز بين التحيز منحنى المناسب والتحيز التعدين البيانات (أو على الأقل هذين النوعين مختلف من التحيز، ولكن قد ترغب في الاتصال بهم). التحيز منحنى المناسب هو التحيز التي تم إنشاؤها من خلال إيجاد عدم الكفاءة عبر مجموعة من البيانات، يجيب على السؤال: هو نظام بلدي العثور على شيء عام أو شيء معين للبيانات التي أستخدمها؟ تحييد البيانات التعدين يجيب على السؤال: هو نظام بلدي العثور على عدم الكفاءة التاريخية الحقيقية أو هي النتائج فقط بسبب عملية التعدين بلدي (يعني القادمة من فرصة عشوائية)؟
من خلال زيادة المسافات المعلمة ودرجات الحرية كنت زيادة التحيز التعدين البيانات (أنت أكثر عرضة للعثور على نظام فقط عن طريق الصدفة، بدلا من النظام الذي يتداول عدم الكفاءة التاريخية الحقيقية). يمكنك قياس التحيز استخراج البيانات باستخدام اختبار مثل الأبيض & # 8217؛ ق الاختيار واقع. إن القيام بهذا النوع من الاختبارات أمر أساسي لتصميم الإستراتيجية الموثوق بها.
اقرأ المزيد عن هذا التمييز بين التحيزات هنا:
اقرأ أيضا هذه الورقة حول الموضوع:
قبل السكن في تعقيدات تصميم نظام التداول وإيجاد استراتيجيات للتداول أنا المشورة بقوة الحصول على تشكيل الصلبة في الإحصاءات (كورسيرا إحصاءات الدورات هي بداية مجانية ممتازة). سوف إحصاءات تعطيك القدرة على تحليل النتائج الخاصة بك ومنهجية معالجة أسئلة مثل هذه؛ س)
[& # 8230؛] تعلم الآلات في تجارة الفوركس: لماذا العديد من الأكاديميين يفعلون كل شيء خاطئ [الميكانيكية الفوركس] بناء استراتيجيات التعلم الآلي التي يمكن الحصول على نتائج لائقة في ظل ظروف السوق الحية كانت دائما تحديا هاما في التداول حسابي. على الرغم من قدر كبير من الاهتمام والمكافآت المحتملة لا يصدق، لا تزال هناك أي منشورات الأكاديمية التي هي قادرة على إظهار نماذج جيدة آلة التعلم التي يمكن أن تعالج بنجاح مشكلة التداول في ريال مدريد [& # 8230؛]
بناء استراتيجيات أفضل! الجزء الرابع: تعلم الآلة.
وكان الأزرق العميق أول كمبيوتر فاز في بطولة العالم الشطرنج. كان ذلك عام 1996، واستغرق الأمر 20 عاما حتى برنامج آخر، ألفاغو، يمكن أن هزيمة أفضل لاعب غو الإنسان. كان الأزرق العميق نظاما يستند إلى نموذج مع قواعد الشطرنج هاردويريد. ألفاغو هو نظام استخراج البيانات، شبكة العصبية العميقة المدربة مع الآلاف من الألعاب الذهاب. لم تتحسن الأجهزة، ولكن انفراجة في البرنامج كان ضروريا لخطوة من الضرب كبار لاعبي الشطرنج لضرب كبار اللاعبين الذهاب.
في هذا الجزء 4 من سلسلة مصغرة نحن & # 8217؛ سوف ننظر في نهج استخراج البيانات لتطوير استراتيجيات التداول. هذا الأسلوب لا يهتم بآليات السوق. انها مجرد مسح منحنيات السعر أو مصادر البيانات الأخرى للنماذج التنبؤية. تعلم الآلة أو & # 8220؛ الذكاء الاصطناعي & # 8221؛ لا تشارك دائما في استراتيجيات استخراج البيانات. في الواقع الأكثر شعبية & # 8211؛ والمربحة بشكل مثير للدهشة & # 8211؛ طريقة استخراج البيانات يعمل دون أي الشبكات العصبية الهوى أو آلات ناقلات الدعم.
مبادئ التعلم الآلي.
يتم تغذية خوارزمية التعلم مع عينات البيانات، وعادة ما تستمد بطريقة ما من الأسعار التاريخية. تتكون كل عينة من متغيرات n × 1 .. × n، وتسمى التنبئ أو الميزات. يمكن التنبؤات يمكن أن تكون عائدات السعر من آخر ن القضبان، أو مجموعة من المؤشرات الكلاسيكية، أو أي وظائف أخرى يمكن تخيلها من منحنى السعر (I & # 8217؛ حتى رأيت بكسل من صورة الرسم البياني السعر المستخدمة كمنبؤات لعصبية شبكة الاتصال!). كل عينة تشمل عادة متغير الهدف y، مثل عودة التجارة المقبلة بعد أخذ العينة، أو حركة السعر المقبل. في عملية التدريب، والخوارزمية يتعلم التنبؤ الهدف ذ من التنبؤات × 1 .. س ن. الذاكرة & # 8216؛ الذاكرة & # 8217؛ يتم تخزينها في بنية بيانات اسمها نموذج خاص بالخوارزمية. يمكن أن يكون هذا النموذج وظيفة مع قواعد التنبؤ في كود C، التي تم إنشاؤها بواسطة عملية التدريب. أو يمكن أن يكون مجموعة من أوزان الاتصال للشبكة العصبية.
يجب على المتنبئين تحمل معلومات كافية للتنبؤ الهدف ذ مع بعض الدقة. كما أنها غالبا ما تفي بمتطلبين رسميين. أولا، يجب أن تكون جميع قيم التنبؤ في نفس النطاق، مثل -1 .. +1 (لمعظم خوارزميات R) أو -100 .. +100 (لخوارزميات زورو أو تسب). لذلك تحتاج إلى تطبيع لهم في بعض الطريق قبل إرسالها إلى الجهاز. ثانيا، يجب أن تكون العينات متوازنة، أي موزعة بالتساوي على جميع قيم المتغير المستهدف. لذلك يجب أن يكون هناك حول العديد من الفوز كما تفقد العينات. إذا لم تلاحظ هذين الشرطين، فإنك تتساءل عن سبب حصولك على نتائج سيئة من خوارزمية تعلم الآلة.
تتوقع خوارزميات الانحدار قيمة رقمية، مثل حجم وعلامة حركة السعر التالية. تتنبأ خوارزميات التصنيف بفئة عينة نوعية، على سبيل المثال، ما إذا كانت النتيجة تسبق الفوز أو الخسارة. بعض الخوارزميات، مثل الشبكات العصبية، أشجار القرار، أو دعم ناقلات الآلات، يمكن تشغيلها في كلا الوضعين.
وهناك عدد قليل من الخوارزميات تعلم تقسيم العينات إلى فئات دون الحاجة إلى أي هدف ذ. هذا التعلم غير الخاضع للرقابة، بدلا من التعلم تحت الإشراف باستخدام الهدف. في مكان ما في المنتصف هو التعلم التعزيز، حيث يقوم النظام بتدريب نفسه عن طريق تشغيل المحاكاة مع ميزات معينة، واستخدام النتيجة كهدف التدريب. ألفازيرو، خليفة ألفاغو، استخدم التعلم التعزيز من خلال اللعب الملايين من ألعاب الذهاب ضد نفسها. في مجال التمويل هناك عدد قليل من التطبيقات للتعلم غير الخاضعة للرقابة أو التعزيز. 99٪ من استراتيجيات التعلم الآلي تستخدم التعلم تحت الإشراف.
أيا كانت الإشارات التي نستخدمها للتنبؤات في التمويل، فإنها على الأرجح تحتوي على الكثير من الضجيج وقليل من المعلومات، وسوف تكون غير مستقرة على رأسها. لذلك التنبؤ المالي هو واحد من أصعب المهام في التعلم الآلي. الخوارزميات الأكثر تعقيدا لا تحقق بالضرورة نتائج أفضل. اختيار التنبؤات أمر بالغ الأهمية للنجاح. ليست فكرة جيدة لاستخدام الكثير من التنبؤات، لأن هذا يسبب ببساطة الإفراط في الفشل والفشل في الخروج من عملية العينة. لذلك استراتيجيات استخراج البيانات غالبا ما تطبق خوارزمية الاختيار الأولي الذي يحدد عدد قليل من التنبؤات من مجموعة من العديد. ويمكن أن يستند الاختيار المسبق إلى العلاقة بين المتنبئات، وعلى الأهمية، وعلى محتوى المعلومات، أو ببساطة على نجاح التنبؤ مع مجموعة اختبار. التجارب العملية مع اختيار ميزة يمكن العثور عليها في مقالة حديثة عن بلوق روبوت الثروة.
هنا & # 8217؛ s قائمة من الأكثر شعبية استخراج البيانات الطرق المستخدمة في التمويل.
1. حساء المؤشر.
معظم النظم التجارية نحن & # 8217؛ إعادة البرمجة للعملاء لا تستند إلى نموذج مالي. العميل يريد فقط إشارات التجارة من بعض المؤشرات الفنية، تصفيتها مع المؤشرات الفنية الأخرى في تركيبة مع المزيد من المؤشرات الفنية. وعندما سئل عن كيف يمكن لهذا الخليط من المؤشرات أن يكون استراتيجية مربحة، أجاب عادة: & # 8220؛ ثق بي. I & # 8217؛ م التداول يدويا، وأنه يعمل. & # 8221؛
لقد فعلت ذلك بالفعل. على الأقل في بعض الأحيان. على الرغم من أن معظم تلك النظم لم يمر اختبار وفا (وبعض حتى لا باكتست بسيط)، وعدد كبير من المستغرب فعلت. وكانت تلك أيضا في كثير من الأحيان مربحة في التداول الحقيقي. وقد أجرى العميل تجربة منهجية للمؤشرات الفنية حتى وجد مزيجا يعمل في التداول المباشر مع أصول معينة. هذه الطريقة من التحليل الفني التجريبي والخطأ هو نهج استخراج البيانات الكلاسيكية، مجرد إعدام من قبل الإنسان وليس من قبل آلة. لا أستطيع حقا أن أوصي هذا الأسلوب & # 8211؛ والكثير من الحظ، لا الكلام عن المال، وربما تشارك & # 8211؛ ولكن يمكنني أن أشهد أنه يؤدي أحيانا إلى أنظمة مربحة.
2. أنماط شمعة.
لا ينبغي الخلط مع تلك أنماط الشموع اليابانية التي كان لها أفضل قبل تاريخ طويل، منذ فترة طويلة. المعادل الحديث هو تداول حركة السعر. أنت & # 8217؛ لا تزال تبحث في مفتوحة، عالية، منخفضة، وإغلاق الشموع. أنت & # 8217؛ لا تزال تأمل في العثور على نمط يتنبأ بإتجاه السعر. ولكن أنت & # 8217؛ الآن استخراج البيانات المعاصرة السعر المنحنيات لجمع تلك الأنماط. وهناك حزم برامج لهذا الغرض. يبحثون عن أنماط مربحة من قبل بعض المعايير المعرفة من قبل المستخدم، واستخدامها لبناء وظيفة كشف نمط معين. يمكن أن يبدو مثل هذا واحد (من زورو & # 8217؛ ق نمط محلل):
ترجع الدالة C 1 عندما تطابق الإشارات أحد الأنماط، وإلا 0. يمكنك أن ترى من الشفرة الطويلة أن هذه ليست أسرع طريقة للكشف عن الأنماط. طريقة أفضل، التي يستخدمها زورو عندما لا يتم تصدير وظيفة الكشف، هو فرز الإشارات من حيث حجمها والتحقق من ترتيب الفرز. ومثال على هذا النظام يمكن العثور عليها هنا.
يمكن سعر التداول العمل حقا العمل؟ تماما مثل حساء المؤشر، فإنه لا يستند إلى أي نموذج مالي عقلاني. يمكن للمرء أن يتصور في أفضل الأحوال أن تسلسل تحركات الأسعار يسبب المشاركين في السوق للرد بطريقة معينة، وبهذه الطريقة إنشاء نمط تنبؤي مؤقت. ومع ذلك فإن عدد من أنماط محدودة جدا عند النظر فقط في تسلسل عدد قليل من الشموع المتجاورة. الخطوة التالية هي مقارنة الشموع التي ليست متاخمة، ولكن يتم اختيارها بشكل تعسفي خلال فترة زمنية أطول. وبهذه الطريقة يمكنك الحصول على عدد غير محدود تقريبا من الأنماط & # 8211؛ ولكن على حساب ترك أخيرا مجال العقلاني. من الصعب أن نتخيل كيف يمكن توقع حركة السعر من قبل بعض أنماط الشموع منذ أسابيع.
ومع ذلك، هناك الكثير من الجهد في ذلك. يدير زميل المدون، دانيال فرنانديز، موقع الاشتراك على الانترنت (أسيريكوي) المتخصصة في استخراج البيانات أنماط شمعة. انه صقل نمط التداول وصولا الى أصغر التفاصيل، وإذا كان أي شخص من أي وقت مضى تحقيق أي ربح بهذه الطريقة، سيكون له. ولكن لمشتركيه & # 8217؛ خيبة أمل، تداول أنماطه الحية (كوريكوانت) أنتج نتائج مختلفة جدا من له باكتيستس رائعة. إذا كانت أنظمة العمل السعر مربحة موجودة حقا، على ما يبدو لا أحد قد وجدت لهم حتى الآن.
3. الانحدار الخطي.
أساس بسيط من العديد من خوارزميات التعلم الآلي المعقدة: التنبؤ المتغير الهدف ذ من قبل مزيج خطي من التنبؤات × 1 .. س ن.
والمعاملات a هي النموذج. يتم حسابها لتقليل مجموع الاختلافات المربعة بين القيم الحقيقية y من عينات التدريب وتوقعها y من الصيغة أعلاه:
للعينات الموزعة العادية، والتقليل من الممكن مع بعض الحساب المصفوفة، لذلك لا حاجة التكرارات. في الحالة n = 1 & # 8211؛ مع متغير واحد فقط متغير x & # 8211؛ يتم تقليل صيغة الانحدار إلى.
وهو الانحدار الخطي البسيط، بدلا من الانحدار الخطي متعدد المتغيرات حيث n & غ؛ 1 - الانحدار الخطي البسيط متوفر في معظم منصات التداول، f. i. مع مؤشر لينريغ في تا-ليب. مع y = برايس و x = تايم & # 8217؛ s غالبا ما تستخدم كبديل للمتوسط المتحرك. الانحدار الخطي متعدد المتغيرات متاح في منصة R من خلال الدالة (..) التي تأتي مع التثبيت القياسي. البديل هو الانحدار متعدد الحدود. مثل الانحدار البسيط فإنه يستخدم متغير واحد فقط متغير x، ولكن أيضا مربعه ودرجاته العليا، بحيث x n == x n:
مع n = 2 أو n = 3، غالبا ما يستخدم الانحدار متعدد الحدود للتنبؤ بالسعر المتوسط التالي من الأسعار المسطحة للأشرطة الأخيرة. وظيفة بوليفيت من ماتلاب، R، زورو، والعديد من المنصات الأخرى يمكن أن تستخدم لانحدار متعدد الحدود.
4. بيرسيبترون.
غالبا ما يشار إليها باسم الشبكة العصبية مع واحد فقط من الخلايا العصبية. في الواقع بيرسيبترون هو وظيفة الانحدار مثل أعلاه، ولكن مع نتيجة ثنائية، مما يسمى الانحدار اللوجستي. انها & # 8217؛ s لا الانحدار الرغم من ذلك، انها & # 8217؛ s خوارزمية التصنيف. تولد الدالة زورو & # 8217 s (بيرسيبترون، & # 8230؛) شفرة C ترجع إما 100 أو -100، وتعتمد على ما إذا كانت النتيجة المتوقعة أعلى من عتبة أم لا:
يمكنك أن ترى أن صفيف سيغ يعادل الميزات x n في صيغة الانحدار، والعوامل الرقمية هي المعاملات n.
5. الشبكات الإلكترونية N.
الانحدار الخطي أو اللوجستي يمكن أن تحل المشاكل الخطية فقط. العديد من لا تقع في هذه الفئة & # 8211؛ مثال مشهور هو التنبؤ الناتج من وظيفة شور بسيطة. وعلى الأرجح أيضا التنبؤ الأسعار أو عائدات التجارة. يمكن للشبكة العصبية الاصطناعية (أن) معالجة المشاكل غير الخطية. انها مجموعة من بيرسيبترونس التي ترتبط معا في مجموعة من الطبقات. أي بيرسيبترون هو الخلايا العصبية من الشبكة. خرجها يذهب إلى مدخلات جميع الخلايا العصبية من الطبقة التالية، مثل هذا:
وكما هو الحال في المنظور، تتعلم الشبكة العصبية أيضا من خلال تحديد المعاملات التي تقلل من الخطأ بين التنبؤ بالعينة وهدف العينة. ولكن هذا يتطلب الآن عملية تقريب، وعادة مع باكبروباغاتينغ الخطأ من الإخراج إلى المدخلات، وتحسين الأوزان في طريقها. وتفرض هذه العملية قيادتين. أولا، يجب أن تكون مخرجات الخلايا العصبية الآن وظائف مختلفة بشكل مستمر بدلا من عتبة الإدراك الحسي البسيط. ثانيا، يجب ألا تكون الشبكة عميقة جدا & # 8211؛ يجب ألا يحتوي على عدد كبير جدا من & # 8216؛ الطبقات المخفية & # 8217؛ من الخلايا العصبية بين المدخلات والمخرجات. هذا التقييد الثاني يحد من تعقيد المشاكل التي يمكن أن تحلها الشبكة العصبية القياسية.
عند استخدام الشبكة العصبية للتنبؤ بالصفقات، لديك الكثير من المعلمات التي يمكنك اللعب حولها، وإذا كنت & # 8217؛ لا حذرا، تنتج الكثير من التحيز الاختيار:
عدد الطبقات المخفية عدد الخلايا العصبية في طبقة مخفية عدد دورات باكبروباغاتيون، وعناوين اسمه معدل التعلم، وعرض خطوة من عصر الزخم، عامل الجمود للأوزان التكيف وظيفة التنشيط.
وظيفة التنشيط يحاكي عتبة بيرسيبترون. ل باكبروباغاتيون تحتاج إلى وظيفة التفريق بشكل مستمر أن يولد & # 8216؛ لينة & # 8217؛ خطوة على قيمة x معينة. عادة يتم استخدام وظيفة السيني، تانه، أو سوفتماكس. في بعض الأحيان انها أيضا وظيفة خطية التي ترجع فقط المبلغ المرجح لجميع المدخلات. في هذه الحالة يمكن استخدام الشبكة للانحدار، للتنبؤ بقيمة رقمية بدلا من نتيجة ثنائية.
الشبكات العصبية متوفرة في تركيب R القياسية (نيت، شبكة طبقة مخفية واحدة) وفي العديد من الحزم، على سبيل المثال رسنس و FCNN4R.
6. التعلم العميق.
تستخدم طرق التعلم العميق الشبكات العصبية مع العديد من الطبقات الخفية والآلاف من الخلايا العصبية، والتي لا يمكن تدريبها بشكل فعال بعد الآن من قبل باكبروباغاتيون التقليدية. أصبحت عدة طرق شعبية في السنوات الأخيرة لتدريب مثل هذه الشبكات الضخمة. وهم عادة ما قبل تدريب طبقات الخلايا العصبية الخفية لتحقيق عملية التعلم أكثر فعالية. A بولتزمان مقيدة آلة (ربم) هو خوارزمية تصنيف غير خاضعة للرقابة مع بنية شبكة خاصة لا يوجد لديه اتصالات بين الخلايا العصبية الخفية. يستخدم جهاز الاشتعال المتفرق (ساي) بنية الشبكة التقليدية، ولكن قبل القطارات الطبقات المخفية بطريقة ذكية من خلال إعادة إنتاج إشارات الإدخال على مخرجات الطبقة مع عدد قليل من الاتصالات النشطة ممكن. وتتيح هذه الأساليب لشبكات معقدة جدا لمعالجة مهام التعلم المعقدة للغاية. مثل الضرب العالم & # 8217؛ لاعب أفضل الإنسان الذهاب.
شبكات التعلم العميق متوفرة في حزم ديبنيت و دارتش R. يوفر ديبنيت أوتوينكودر، دارتش آلة بولتزمان مقيدة. أنا لم تجرب حتى الآن مع دارتش، ولكن هنا & # 8217؛ s مثال النصي R باستخدام ديبنيت أوتوينكودر مع 3 طبقات مخفية لإشارات التجارة من خلال زورو & # 8217؛ s العصبية () وظيفة:
7. دعم ناقلات الآلات.
مثل شبكة العصبية، آلة ناقلات الدعم (سفم) هو امتداد آخر للانحدار الخطي. عندما ننظر إلى صيغة الانحدار مرة أخرى،
يمكننا تفسير ملامح x ن كإحداثيات مساحة ميزة n - dimensional. تحديد المتغير الهدف y إلى قيمة ثابتة يحدد مستوي في تلك المساحة، يسمى هبربلان لأنه يحتوي على أكثر من اثنين (في الواقع، ن -1) أبعاد. تفصل اللوحة المفرطة العينات مع y & غ؛ o من العينات مع y & لوت؛ 0. ويمكن حساب المعاملات n بطريقة تجعل مسافات الطائرة أقرب العينات & # 8211؛ والتي تسمى & # 8216؛ ناقلات الدعم & # 8217؛ من الطائرة، وبالتالي اسم الخوارزمية & # 8211؛ هو الحد الأقصى. بهذه الطريقة لدينا المصنف ثنائي مع الفصل الأمثل من العينات الفائزة والخاسرة.
المشكلة: عادة لا تكون هذه العينات قابلة للفصل خطيا & # 8211؛ فهي متناثرة حول بشكل غير منتظم في الفضاء ميزة. لا يمكن أن تقلص طائرة مسطحة بين الفائزين والخاسرين. إذا كان يمكن، كان لدينا أساليب أبسط لحساب تلك الطائرة، f. i. التحليل التمييزي الخطي. ولكن بالنسبة للحالة المشتركة نحن بحاجة إلى خدعة سفم: إضافة المزيد من الأبعاد لمساحة الميزة. لهذا الخوارزمية سفم تنتج المزيد من الميزات مع وظيفة النواة التي تجمع بين أي اثنين من التنبؤات الحالية إلى ميزة جديدة. وهذا يشبه الخطوة أعلاه من الانحدار البسيط إلى الانحدار متعدد الحدود، حيث تضيف أيضا المزيد من الميزات عن طريق أخذ المتنبأ الوحيد بالسلطة n. والمزيد من الأبعاد التي تضيفها، وأسهل هو لفصل العينات مع لوحة مسطحة مسطحة. ثم يتم تحويل هذه الطائرة مرة أخرى إلى الفضاء N - الأبعاد الأصلي، والحصول على التجاعيد وتكتل على الطريق. بواسطة ذكي اختيار وظيفة النواة، ويمكن تنفيذ العملية دون حساب الواقع التحول.
مثل الشبكات العصبية، سفمز يمكن استخدامها ليس فقط للتصنيف، ولكن أيضا للانحدار. كما أنها توفر بعض المعلمات لتحسين عملية التنبؤ وربما تحسينها:
وظيفة النواة. كنت عادة استخدام نواة ربف (وظيفة أساس شعاعي، نواة متماثلة)، ولكن لديك أيضا اختيار حبات أخرى، مثل السيني، متعدد الحدود، والخطي. غاما، وعرض نواة ربف معلمة التكلفة C، و & # 8216؛ ركلة جزاء & # 8217؛ للتصنيفات الخاطئة في عينات التدريب.
سفم المستخدمة في كثير من الأحيان هي مكتبة ليبسفم. كما أنها متوفرة في R في حزمة e1071. في الجزء التالي والأخير من هذه السلسلة أخطط لوصف استراتيجية التداول باستخدام هذا سفم.
8. K - أقرب الجيران.
مقارنة مع أن آن الثقيلة و سفم الاشياء، أن & # 8217؛ ق خوارزمية بسيطة لطيفة مع خاصية فريدة من نوعها: فإنه لا يحتاج إلى التدريب. وبالتالي فإن العينات هي النموذج. هل يمكن استخدام هذه الخوارزمية لنظام التداول الذي يتعلم بشكل دائم عن طريق إضافة المزيد والمزيد من العينات ببساطة. وتحسب خوارزمية الجوار الأقرب المسافات في حيز الميزة من قيم الخصائص الحالية إلى العينات الأقرب k. وتحسب المسافة في الفضاء n الأبعاد من مجموعتين من السمات (x 1 .. x n) و (y 1 .. y n) كما هو الحال في بعدين:
وتتوقع الخوارزمية ببساطة الهدف من متوسط المتغيرات المستهدفة k لأقرب العينات، المرجحة بمسافاتها العكسية. ويمكن استخدامه للتصنيف وكذلك الانحدار. يمكن للحيل البرمجيات اقترضت من الرسومات الكمبيوتر، مثل شجرة ثنائية التكيف (عبت)، جعل أقرب جار البحث بسرعة كبيرة. في حياتي الماضية كما مبرمج لعبة الكمبيوتر، استخدمنا هذه الأساليب في ألعاب لمهام مثل التعلم الذاتي الذكاء العدو. يمكنك استدعاء وظيفة كن في R للتنبؤ أقرب الجار & # 8211؛ أو كتابة وظيفة بسيطة في C لهذا الغرض.
هذه خوارزمية تقريبية للتصنيف غير الخاضع للرقابة. لديها بعض التشابه، وليس فقط اسمها، إلى k - أقرب الجار. لتصنيف العينات، تضع الخوارزمية أولا نقاط عشوائية k في مساحة العنصر. ثم يعين إلى أي من تلك النقاط جميع العينات مع أصغر مسافات إليها. ثم يتم نقل النقطة إلى متوسط هذه العينات الأقرب. وهذا سيولد تخصيص عينات جديدة، لأن بعض العينات هي الآن أقرب إلى نقطة أخرى. وتكرر العملية إلى أن لا يتغير التخصيص بعد الآن بتحريك النقاط، أي أن كل نقطة تكمن بالضبط في متوسط عيناتها الأقرب. لدينا الآن K فئات من العينات، كل في حي واحد من النقاط k.
هذه الخوارزمية بسيطة يمكن أن تنتج نتائج جيدة بشكل مدهش. في R، وظيفة كمينز لا خدعة. مثال على خوارزمية k-مينز لتصنيف أنماط الشموع يمكن العثور عليها هنا: تصنيف الشموع غير الخاضعة للمراقبة من أجل المتعة والربح.
10. نايف بايس.
تستخدم هذه الخوارزمية بايز & # 8217؛ نظرية لتصنيف عينات من الميزات غير الرقمية (أي الأحداث)، مثل أنماط شمعة المذكورة أعلاه. لنفرض أن الحدث X (على سبيل المثال، أن فتح الشريط السابق أقل من فتح الشريط الحالي) يظهر في 80٪ من جميع العينات الفائزة. ما هو احتمالية فوز العينة عندما تحتوي على الحدث X؟ إنه ليس 0.8 كما قد تعتقد. يمكن حساب الاحتمال مع بايز & # 8217؛ نظرية:
P (Y | X) هو احتمال حدوث الحدث Y (f. i الفوز) في جميع العينات التي تحتوي على الحدث X (في مثالنا، أوبين (1) & لوت؛ أوبين (0)). وفقا للصيغة، فإنه يساوي احتمال X يحدث في جميع العينات الفائزة (هنا، 0.8)، مضروبا في احتمال Y في جميع العينات (حوالي 0.5 عندما كنت اتبع نصيحتي أعلاه من عينات متوازنة) وقسمت على احتمال X في جميع العينات.
إذا كنا ساذجة ونفترض أن جميع الأحداث X مستقلة عن بعضها البعض، يمكننا حساب الاحتمال العام أن العينة هو الفوز ببساطة عن طريق ضرب الاحتمالات P (X | الفوز) لكل حدث X. وبهذه الطريقة ننتهي بهذه الصيغة:
مع عامل التحجيم s. لصيغة للعمل، يجب اختيار الميزات بطريقة أنها مستقلة قدر الإمكان، مما يفرض عقبة لاستخدام نايف بايس في التداول. على سبيل المثال، الحدثين إغلاق (1) & لوت؛ كلوز (0) أند أوبين (1) & لوت؛ فتح (0) هي على الأرجح ليست مستقلة عن بعضها البعض. يمكن تحويل التنبؤات العددية إلى الأحداث عن طريق قسمة الرقم إلى نطاقات منفصلة.
خوارزمية نايف بايس هو متاح في حزمة E1071 R في كل مكان.
11 - أشجار القرار والانحدار.
وتتوقع تلك الأشجار نتيجة أو قيمة رقمية استنادا إلى سلسلة من القرارات نعم / لا، في هيكل مثل فروع شجرة. أي قرار هو إما وجود حدث أم لا (في حالة السمات غير العددية) أو مقارنة قيمة ميزة بعتبة ثابتة. تبدو وظيفة شجرة نموذجية، تم إنشاؤها بواسطة أداة إنشاء شجرة زورو & # 8217، كما يلي:
كيف تنتج مثل هذه الشجرة من مجموعة من العينات؟ هناك عدة طرق. يستخدم زورو شانون أنا إنفورماتيون إنتروبي، الذي كان بالفعل ظهور على هذه المدونة في المادة سلخ فروة الرأس. في البداية فإنه يتحقق من واحدة من الميزات، والسماح & # 8217؛ ق يقول × 1. فإنه يضع مفرط مع صيغة الطائرة × 1 = t في مساحة الميزة. تفصل هذه المجموعة الزائدة العينات مع x 1 & غ؛ t من العينات مع x 1 & لوت؛ t. يتم تحديد عتبة تقسيم t بحيث كسب المعلومات & # 8211؛ والفرق من المعلومات الكون من الفضاء كله، لمجموع الكون المعلومات من قسمين المساحات الفرعية & # 8211؛ هو الحد الأقصى. وهذا هو الحال عندما تكون العينات في السطوح الفرعية أكثر تشابها مع بعضها البعض من العينات الموجودة في الحيز كله.
ثم يتم تكرار هذه العملية مع الميزة التالية × 2 واثنين من هيبيربلانس تقسيم اثنين من سوبسباسس. ويعادل كل مقطع مقارنة لمميزة ذات عتبة. عن طريق التقسيم المتكرر، ونحن قريبا الحصول على شجرة ضخمة مع الآلاف من مقارنات العتبة. ثم يتم تشغيل العملية إلى الوراء عن طريق تقليم الشجرة وإزالة جميع القرارات التي لا تؤدي إلى مكاسب كبيرة من المعلومات. وأخيرا نحن في نهاية المطاف مع شجرة صغيرة نسبيا كما هو الحال في التعليمات البرمجية أعلاه.
أشجار القرار لديها مجموعة واسعة من التطبيقات. ويمكن أن تنتج توقعات ممتازة متفوقة على تلك التي من الشبكات العصبية أو آلات ناقلات الدعم. لكنها ليست حل واحد يناسب الجميع، لأن الطائرات تقسيمها هي دائما موازية لمحاور الفضاء ميزة. وهذا يحد من توقعاتهم إلى حد ما. ويمكن استخدامها ليس فقط للتصنيف، ولكن أيضا للتراجع، على سبيل المثال عن طريق إعادة النسبة المئوية للعينات المساهمة في فرع معين من الشجرة. شجرة زورو & # 8217؛ s شجرة الانحدار. خوارزمية شجرة التصنيف الأكثر شهرة هي C5.0، وهي متوفرة في حزمة C50 ل R.
ولتحسين التنبؤ أو تجاوز الحدود الموازية للمحور، يمكن استخدام مجموعة من الأشجار تسمى غابة عشوائية. ثم يتم إنشاء التنبؤ عن طريق المتوسط أو التصويت التنبؤات من الأشجار واحدة. تتوفر الغابات العشوائية في حزم R راندومفوريست، الحارس و ربوريست.
استنتاج.
هناك العديد من البيانات المختلفة وأساليب التعلم الآلي تحت تصرفكم. السؤال الحاسم: ما هو أفضل، على أساس نموذج أو استراتيجية التعلم الآلي؟ ليس هناك شك في أن تعلم الآلة لديها الكثير من المزايا. لا تحتاج إلى الاهتمام بالبنية المجهرية للسوق، أو الاقتصاد، أو علم النفس التاجر، أو الأشياء اللينة المشابهة. يمكنك التركيز على الرياضيات البحتة. التعلم الآلي هو أكثر أناقة، وأكثر جاذبية طريقة لتوليد أنظمة التجارة. لديها كل المزايا على جانبها ولكن واحد. على الرغم من كل المواضيع المتحمسة على المنتديات التاجر، فإنه يميل إلى فشل غامض في التداول المباشر.
كل أسبوع الثاني يتم نشر ورقة جديدة حول التداول مع أساليب التعلم الآلي (ويمكن الاطلاع على عدد قليل أدناه). يرجى أخذ جميع هذه المنشورات مع حبة الملح. ووفقا لبعض الأوراق، حققت معدلات فوز رائعة في حدود 70٪، 80٪، أو حتى 85٪. على الرغم من أن معدل الفوز ليس المعيار الوحيد المناسب & # 8211؛ يمكنك أن تفقد حتى مع ارتفاع معدل الفوز & # 8211؛ 85٪ دقة في التنبؤ الحرف عادة ما يعادل عامل الربح فوق 5. مع مثل هذا النظام العلماء المعنيين يجب أن يكون الملياردير في الوقت نفسه. لسوء الحظ لم أتمكن من إعادة إنتاج معدلات الفوز بهذه الطريقة الموصوفة، ولم تقترب حتى. لذلك ربما الكثير من التحيز الاختيار ذهب إلى النتائج. أو ربما أنا & # 8217؛ م غبي جدا.
وبالمقارنة مع الاستراتيجيات القائمة على نموذج، وأنا & # 8217؛ رأى ليس العديد من أنظمة التعلم الآلي الناجحة حتى الآن. ومن ما يسمعه المرء عن الأساليب الحسابية من خلال صناديق التحوط الناجحة، يبدو أن تعلم الآلة نادرا ما يتم استخدامه. ولكن ربما هذا سوف يتغير في المستقبل مع توافر المزيد من قوة المعالجة والقادم من خوارزميات جديدة للتعلم العميق.
تصنيف باستخدام الشبكات العصبية العميقة: Dixon. et. al.2016 التنبؤ اتجاه السعر باستخدام آن & أمب؛ سفم: Kara. et. al.2011 المقارنة التجريبية لخوارزميات التعلم: Caruana. et. al.2006 التعدين سوق الأوراق المالية ميل باستخدام غا & أمب؛ سفم: Yu. Wang. Lai.2005.
ويتناول الجزء التالي من هذه السلسلة التطوير العملي لاستراتيجية التعلم الآلي.
30 أفكار حول & لدكو؛ بناء استراتيجيات أفضل! الجزء 4: آلة التعلم & رديقو؛
مشاركة لطيفة. هناك الكثير من الإمكانيات في هذه المقاربة نحو السوق.
راجع للشغل هل تستخدم محرر التعليمات البرمجية التي تأتي مع زورو؟ كيف يمكن الحصول على مثل هذا التكوين اللون؟
يتم إنتاج النصي الملونة من قبل وورد. يمكنك تغيير الألوان في محرر زورو، ولكن يمكنك استبدالها مع برامج تحرير أخرى تدعم الألوان الفردية، على سبيل المثال نوتيباد ++.
هل من الممكن بعد ذلك أن المفكرة بالكشف عن المتغيرات زورو في البرامج النصية؟ أعني أن باربيريود هو لاحظ كما هو الحال مع محرر زورو؟
نظريا نعم، ولكن لهذا كان لديك لتكوين تسليط الضوء على بناء المفكرة ++، وأدخل جميع المتغيرات في القائمة. بقدر ما أعرف نوتيباد ++ يمكن أيضا أن لا يتم تكوين لعرض وصف وظيفة في نافذة، كما يفعل محرر زورو. هناك & # 8217؛ s لا أداة مثالية & # 8230؛
توافق على الفقرة الأخيرة. لقد حاولت العديد من تقنيات التعلم الآلي بعد قراءة مختلف & # 8216؛ استعراض الأقران & # 8217؛ أوراق. ولكن إعادة إنتاج نتائجها لا يزال بعيد المنال. عندما أعيش اختبار مع مل يمكنني & # 8217؛ ر يبدو أن يتفوق الإدخال العشوائي.
فشل مل في العيش؟ ربما يجب أن يتم تدريب مل مع بيانات الأسعار التي تشمل أيضا تاريخ الانتشار، لفة، القراد وهلم جرا؟
وأعتقد أن السبب # 1 لفشل الحية هو التحيز استخراج البيانات، والناجمة عن اختيار منحازة المدخلات والمعلمات إلى ألغو.
بفضل المؤلف لسلسلة كبيرة من المقالات.
ومع ذلك، تجدر الإشارة إلى أننا لا نحتاج إلى تضييق وجهة نظرنا مع توقع فقط الخطوة السعر التالية. قد يحدث أن الخطوة التالية تتعارض مع تجارتنا في 70٪ من الحالات ولكن لا يزال يستحق صنع التجارة. يحدث هذا عندما يذهب السعر أخيرا إلى الاتجاه الصحيح ولكن قبل ذلك قد يجعل بعض الخطوات ضدنا. إذا قمنا بتأخير الصفقة بخطوة واحدة فإننا لن نقوم بإدخال 30٪ من الصفقات المذكورة، ولكن لذلك سنزيد من نتيجة بقاء 70٪ خطوة واحدة. لذا فإن المعايير هي القيمة الأعلى: N * average_result أو 0.7 * N * (avergae_result + price_step).
مشاركة لطيفة. إذا كنت ترغب فقط في اللعب حولها مع بعض التعلم الآلي، وأنا نفذت أداة مل بسيطة جدا في الثعبان وأضاف واجهة المستخدم الرسومية. لقد تم تنفيذها للتنبؤ بسلاسل زمنية.
شكرا جسل لقد وجدت مثيرة جدا للاهتمام مقالك. أود أن أسألك من خبرتك في التداول، أين يمكننا تحميل بيانات الفوركس التاريخية الموثوقة؟ وأرى أنه من المهم جدا بسبب حقيقة أن سوق الفوركس هو اللامركزية.
شكرا مقدما!
لا توجد بيانات فوركس موثوق بها حقا، لأن كل وسيط الفوركس يخلق البيانات الخاصة بهم. وتختلف جميعها اعتمادا طفيفا على مقدمي السيولة الذين يستخدمونها. فكسم لديها M1 جيدة نسبيا والبيانات القراد مع عدد قليل من الثغرات. يمكنك تحميل البرنامج مع زورو.
شكرا لكتابة مثل هذه المقالة سلسلة كبيرة جسل & # 8230؛ قراءة ممتعة تماما!
لا بد لي من أن أقول على الرغم من أنني لا & # 8217؛ ر عرض نموذج القائم على واستراتيجيات التعلم الآلي باعتبارها استبعد بعضها بعضا؛ لقد كان بعض النجاح أوس باستخدام مزيج من العناصر التي تصفها.
ولكي تكون أكثر دقة، أبدأ عملية إنشاء النظام من خلال تطوير & # 8216؛ التقليدية & # 8217؛ النموذج الرياضي، ولكن بعد ذلك استخدام مجموعة من خوارزميات التعلم الآلي عبر الإنترنت للتنبؤ بالمصطلحات التالية لمختلف السلاسل الزمنية المختلفة (وليس السعر نفسه) التي يتم استخدامها داخل النموذج. ثم يتم اشتقاق قواعد التداول الفعلية من التفاعلات بين هذه السلاسل الزمنية. لذا، فإنني في الأساس لا أقوم فقط بإلقاء بيانات السوق الأخيرة بشكل أعمق في نموذج مل في محاولة للتنبؤ بالاتجاه نحو السعر، بل بدلا من ذلك وضع إطار يستند إلى مبادئ الاستثمار السليمة من أجل توجيه النماذج في الاتجاه الصحيح. ثم البيانات الألغام المعلمات وقياس مستوى التحيز البيانات التعدين كما كنت & # 8217؛ وصف أيضا.
ومن الجدير بالذكر أن I & # 8217؛ لم يكن لدي الكثير من النجاح مع الفوركس.
على أي حال، حظا سعيدا مع التداول الخاص بك ومواكبة المواد العظيمة!
شكرا لنشر هذه السلسلة الصغيرة العظيمة جسل.
قمت مؤخرا بدراسة عدد قليل من أحدث الأوراق حول التداول مل، التعلم العميق خصوصا. ومع ذلك وجدت أن معظمها قيم النتائج دون مؤشر معدل المخاطر، أي أنها تستخدم عادة منحنى روك، ينل لدعم تجربتهم بدلا من نسبة شارب، على سبيل المثال.
أيضا، نادرا ما ذكروا عن تواتر التداول في نتائج التجربة، مما يجعل من الصعب تقييم الربحية المحتملة لتلك الأساليب. لماذا هذا؟ هل لديك أي اقتراحات جيدة للتعامل مع تلك القضايا؟
أوراق مل تهدف عادة لدقة عالية. إن منحنى منحنى األسهم ليس له فائدة. هذا هو نوع من المبرر لأن نوعية التنبؤ مل يحدد الدقة، وليس التباين.
وبطبيعة الحال، إذا كنت ترغب في التجارة حقا مثل هذا النظام، والتباين وسحب العوامل الهامة. ويمكن في الواقع أن يكون النظام ذو الدقة الأقل والتنبؤ الأسوأ أفضل عندما يكون أقل اعتمادا على شروط السوق.
& # 8220؛ في الواقع الأكثر شعبية - ومربحة للدهشة - طريقة استخراج البيانات يعمل دون أي الشبكات العصبية الهوى أو آلات ناقلات الدعم. & # 8221؛
هل يرجى تسمية تلك الأكثر شعبية & أمب؛ والمربحة بشكل مدهش. حتى أتمكن من استخدامها مباشرة.
كنت أشير إلى استراتيجيات حساء المؤشر. لأسباب واضحة لا أستطيع الكشف عن تفاصيل مثل هذه الاستراتيجية، وقد وضعت أبدا مثل هذه النظم نفسي. نحن & # 8217؛ مجرد ترميز لهم. ولكن يمكنني أن أقول أن الخروج مع حساء مؤشر مربحة يتطلب الكثير من العمل والوقت.
حسنا، أنا مجرد بدء المشروع الذي يستخدم إماس بسيطة للتنبؤ الأسعار، فإنه مجرد اختيار إماس الصحيح على أساس الأداء الماضي واختيار الخوارزمية التي تجعل بعض درجة ريفي من الذكاء.
يقدم Jonathan. orregogmail خدمات كمبرمج إي MT4.
شكرا على writeup جيد. انها في الواقع تستخدم ليكون حساب الترفيه ذلك.
بدو معقدة لأكثر تواضعا تسليمها من أنت!
بالمناسبة، كيف يمكن أن نكون على اتصال؟
هناك قضايا تالية مع مل ومع أنظمة التداول بشكل عام والتي تقوم على تحليل البيانات التاريخية:
1) البيانات التاريخية لا ترميز المعلومات حول تحركات الأسعار في المستقبل.
حركة الأسعار المستقبلية مستقلة ولا تتعلق بتاريخ الأسعار. هناك على الإطلاق أي نمط موثوق بها والتي يمكن استخدامها لاستخراج بانتظام الأرباح من السوق. تطبيق أساليب مل في هذا المجال هو ببساطة بلا طائل ومحاكم الفشل ولن يعمل إذا كنت تبحث عن نظام مربح. بالطبع يمكنك منحنى تناسب أي فترة الماضية والخروج مع نظام مربحة لذلك.
والشيء الوحيد الذي يحدد حركة الأسعار هو العرض والطلب، وهذه غالبا ما تكون نتيجة لعوامل خارجية لا يمكن التنبؤ بها. على سبيل المثال: اندلاع حرب في مكان ما أو غيرها من ضربات الكوارث الكبرى أو شخص يحتاج فقط لشراء كمية كبيرة من العملات الأجنبية لبعض الأعمال / الغرض الاستثماري. هذا النوع من الأحداث سوف يسبب تحولات كبيرة في هيكل العرض الطلب في سوق العملات الأجنبية. ونتيجة لذلك، تبدأ الأسعار في التحرك ولكن لا أحد يهتم حقا تاريخ السعر فقط عن تنفيذ أوامر واردة. An automated trading system can only be profitable if it monitors a significant portion of the market and takes the supply and demand into account for making a trading decision. But this is not the case with any of the systems being discussed here.
2) Race to the bottom.
Even if (1) wouldn’t be true and there would be valuable information encoded in historical price data, you would still face following problem: there are thousands of gold diggers out there, all of them using similar methods and even the same tools to search for profitable systems and analyze the same historical price data. As a result, many of them will discover the same or very similar “profitable” trading systems and when they begin actually trading those systems, they will become less and less profitable due to the nature of the market.
The only sure winners in this scenario will be the technology and tool vendors.
I will be still keeping an eye on your posts as I like your approach and the scientific vigor you apply. Your blog is the best of its kind – keep the good work!
One hint: there are profitable automated systems, but they are not based on historical price data but on proprietary knowledge about the market structure and operations of the major institutions which control these markets. Let’s say there are many inefficiencies in the current system but you absolutely have no chance to find the information about those by analyzing historical price data. Instead you have to know when and how the institutions will execute market moving orders and front run them.
Thanks for the extensive comment. I often hear these arguments and they sound indeed intuitive, only problem is that they are easily proven wrong. The scientific way is experiment, not intuition. Simple tests show that past and future prices are often correlated – otherwise every second experiment on this blog had a very different outcome. Many successful funds, for instance Jim Simon’s Renaissance fund, are mainly based on algorithmic prediction.
One more thing: in my comment I have been implicitly referring to the buy side (hedge funds, traders etc) not to the sell side (market makers, banks). The second one has always the edge because they sell at the ask and buy at the bid, pocketing the spread as an additional profit to any strategy they might be running. Regarding Jim Simon’s Renaissance: I am not so sure if they have not transitioned over the time to the sell side in order to stay profitable. There is absolutely no information available about the nature of their business besides the vague statement that they are using solely quantitative algorithmic trading models…
Thanks for the informative post!
Regarding the use of some of these algorithms, a common complaint which is cited is that financial data is non-stationary…Do you find this to be a problem? Couldn’t one just use returns data instead which is (I think) stationary?
Yes, this is a problem for sure. If financial data were stationary, we’d all be rich. I’m afraid we have to live with what it is. Returns are not any more stationary than other financial data.
Hello sir, I developed some set of rules for my trading which identifies supply demand zones than volume and all other criteria. Can you help me to make it into automated system ?? If i am gonna do that myself then it can take too much time. Please contact me at svadukiagmail if you are interested.
Sure, please contact my employer at infoopgroup. de. They’ll help.
I have noticed you don’t monetize your page, don’t waste your traffic,
يمكنك كسب مبالغ إضافية كل شهر لأنك حصلت على محتوى عالي الجودة.
If you want to know how to make extra $$$, search for: Mrdalekjd methods for $$$
Technical analysis has always been rejected and looked down upon by quants, academics, or anyone who has been trained by traditional finance theories. I have worked for proprietary trading desk of a first tier bank for a good part of my career, and surrounded by those ivy-league elites with background in finance, math, or financial engineering. I must admit none of those guys knew how to trade directions. They were good at market making, product structures, index arb, but almost none can making money trading directions. لماذا ا؟ Because none of these guys believed in technical analysis. Then again, if you are already making your millions why bother taking the risk of trading direction with your own money. For me luckily my years of training in technical analysis allowed me to really retire after laying off from the great recession. I look only at EMA, slow stochastics, and MACD; and I have made money every year since started in 2009. Technical analysis works, you just have to know how to use it!!
Comments
Post a Comment