چکیده:
هدف: معاملات زوجی از معروفترین و قدیمیترین سیستمهای معاملات الگوریتمی است که کارایی و سودآوری آن در بسیاری از پژوهشهایی که تاکنون در بازارهای مالی مختلف صورت گرفته است، اثبات و نشان داده شده است. مهمترین اصل در معاملات زوجی، وجود روابط تعادلی بلندمدت یا همان خاصیت بازگشت به میانگین است. از طرفی در سالهای اخیر تحقیقات شایان توجهی روی معاملات الگوریتمی با استفاده از یادگیری ماشین صورت گرفته است.
روش: در این پژوهش از روش یادگیری تقویتی که برای مدلسازی و بهینهسازی مسائل با انواع مختلف روابط بلندمدت مناسب است، بهمنظور انتخاب آستانههای معاملاتی و پنجرههای زمانی مناسب با هدف ماکزیممسازی بازده و مینیممسازی ریسکهای منفی در معاملات زوجی با رویکرد همانباشتگی استفاده شده است. پژوهش حاضر با بهکارگیری ترکیبی از روش یادگیری تقویتی و رویکرد همانباشتگی در معاملات زوجی اجرا شده است.
یافتهها: نتایج آزمایش روی دیتاهای درونروزی زوج سهام منتخب، نشان میدهد که استفاده از روش یادگیری تقویتی در طراحی سیستم معاملات در معاملات زوجی نسبت به کارهای قبلی انجامشده، برتری چشمگیری دارد.
نتیجهگیری: استراتژی معاملات زوجی با الگوریتم پیشنهادی میتواند بهعنوان استراتژی بازار خنثی در تمامی شرایط بازار اعم از رونق و رکود توسط سرمایهگذاران و معاملهگران حقیقی و حقوقی استفاده شود. همچنین میتوان در نظر گرفتن هزینههای معاملاتی در انجام معاملات در استراتژی معاملات زوجی را بهعنوان موضعی برای پژوهشهای آتی پیشنهاد کرد.
خلاصه ماشینی:
روش : در اين پژوهش از روش يادگيري تقويتي که براي مدل سازي و بهينه سازي مسائل با انواع مختلـف روابـط بلندمـدت مناسـب است ، به منظور انتخاب آستانه هاي معاملاتي و پنجره هاي زماني مناسب با هدف ماکزيمم سازي بازده و مينيمم سازي ريسک هاي منفي در معاملات زوجي با رويکرد هم انباشتگي استفاده شده است .
پس از انتخاب زوج سهام از طريق بررسي وجود روابط مربوطه (روابط هم انباشتگي )، پارامترهاي مدل تخمين زده مي شود و در نهايت ، در مرحله طراحي معاملات مقدار استاندارد شده تفاضل قيمتي ٩ که حاصل از مابه التفاوت بين قيمـت هـاي دو دارايي است ، براي انجام معاملات و اتخاذ موقعيت هاي مناسب ترسيم مي شود.
Dai, Zhang and Zhu 5.
Trading window در مطالعات قبلي اغلب از مقاديري ثابت و مشخص براي اين چهـار پـارامتر اسـتفاده شـده ، در حـالي کـه در ايـن پژوهش از يادگيري تقويتي براي انتخاب مقادير بهينه اين پارامترها و با هدف ماکزيمم سازي نسبت سورتينو استفاده شده است .
انديکاتور و موقعيت هاي معاملاتي روي داده هاي outsample براي زوج سهام ايران خودرو ـ سايپا با روش پيشنهادي همان طور که در شکل هاي ٣ و ٥ مشاهده مي شود در حالت استفاده از الگوريتم RL طول پنجره هـاي معـاملاتي و همين طور فاصله آستانه هاي معاملاتي و حدضررها در هر دوره متغير بوده و توسط عامـل بـا توجـه بـه بـازخوردي کـه دريافت کرده (در جهت ماکزيمم سازي تابع هدف که در واقع ماکزيمم سازي نسبت سورتينو است ) تغيير مي کند.