چکیده:
برای مدیریت سبد سرمایه دارایی هاء کسب سود و کاهش ریسک در بازار های مالی از روش های گوناگونی استفاده می شود. عواملی نظیر محدودیت در زمان و قدرت پردازشی, لزوم تصمیم گیری های آنی و پیچیدگی داده های بازار های مالیء محققین را برای یافتن روش های کارا تر و خودکار به کمک رایانه ها سوق داده است. امروزه شاخه یادگیری تقویتی از دانش هوش مصنوعی, پیشرفت چشمگیری در حل مسائل گوناگون داشته است. با توجه به پیچیدگی بازار های مالی می توان امکان به کارگیری این شاخه را در انجام معاملات الگوریتمی موره مطالعه و بررسی قرار داد. در این مقاله با مدلسازی ریاضی معامله در بازار رمز ارز ها با استفاده از فرایند تصمیم مارکوف. الگوریتم یادگیری بهینه سازی خط مشی تقریبی متعلق به دسته روش های یادگیری تقویتی عمیق منتقد بازیگر به کار گرفته شد. با هدف ارائه ساختاری برای آرزیابی عملکرد الگوریتم های یادگیری تقویتی عمیق به عنوان ابزار معامله هوشمند در بازار رمز ارز» مراحل انجام پژوهش به ترتیب اعم از جمع آوری مطالعات پیشین. پیاده سازی ها و داده های صرافی های رمز ارزء ارائه فرضیه ها و حدس های آزمایش پذیرء مدلسازی و پیاده سازی مسئله ۰ انجام آزمایش و ارائه نتایج تعریف گردید. با آموزش مدل بر روی انواع روند های صعودی» نزولی و خنثی منحصر به فرد استخراج شده از بازار رمز ارز بیت کوین از سال ۲۰۱۳ تا ۲۰۲۲ میلادی مرحله آزمایش با شبیه سازی معامله مدل بر روی هجده بازه تاریخی با روند های گوناگون و متفاوت با بازه های آموزش انجام گردید. عملکرد مدل به کمک معیار هایی نظیر سود سالیانه, ریسک. نرخ موفقیت و مقایسه با روش خرید و نگهداری» ارزیابی گردید. نتایج حاکی از توانایی بالقوه این روش برای مدیریت ریسک سرمایه و امکان کسب سود در معاملات با فرکانس بالا با توجه به نسبت پیش بینی های درست به اشتباه مدل در روند های گوناگون از بازار می باشد.