یک سیستم تجاری پورتفولیوی تطبیقی : یک بهینه‌سازی پرتفوی بازده ریسک با استفاده از یادگیری تقویتی تکراری با حداکثر رسیدن به حد انتظار

Elsevier
سال انتشار :
2017
تعداد صفحات مقاله انگلیسی :
13
نشریه :
الزویر
تعداد رفرنس ها :
40
نوع مقاله :
مقاله ISI
کراس مارک :
Crossmark
keywords :
Recurrent reinforcement learning Expected maximum drawdown Optimal portfolio rebalancing Downside risk
کلمات کلیدی :
یادگیری تقویتی مجدد، حداکثر کاهش چشمگیر، بازخورد بازپرداخت بهینه، خطر ناسازگاری
عنوان فارسی :

یک سیستم تجاری پورتفولیوی تطبیقی : یک بهینه‌سازی پرتفوی بازده ریسک با استفاده از یادگیری تقویتی تکراری با حداکثر رسیدن به حد انتظار

عنوان انگلیسی :

An adaptive portfolio trading system: A risk-return portfolio optimization using recurrent reinforcement learning with expected maximum drawdown

ژورنال :
Expert Systems with Applications
لینک مقاله :
http://www.sciencedirect.com/science/article/pii/S0957417417304402
آدرس DOI :
https://doi.org/10.1016/j.eswa.2017.06.023
وضعیت ترجمه :
انجام نشده.

سال انتشار : 2017

تعداد صفحات مقاله انگلیسی : 12

نشریه : الزویر

تعداد رفرنس ها : 40

نوع مقاله : مقاله ISI

کلمات کلیدی انگلیسی : Recurrent reinforcement learning Expected maximum drawdown Optimal portfolio rebalancing Downside risk

کلمات کلیدی : یادگیری تقویتی مجدد، حداکثر کاهش چشمگیر، بازخورد بازپرداخت بهینه، خطر ناسازگاری

عنوان فارسی : یک سیستم تجاری پورتفولیوی تطبیقی : یک بهینه‌سازی پرتفوی بازده ریسک با استفاده از یادگیری تقویتی تکراری با حداکثر رسیدن به حد انتظار

عنوان انگلیسی : An adaptive portfolio trading system: A risk-return portfolio optimization using recurrent reinforcement learning with expected maximum drawdown

لینک مقاله : http://www.sciencedirect.com/science/article/pii/S0957417417304402



چکیده انگلیسی
Dynamic control theory has long been used in solving optimal asset allocation problems, and a number of trading decision systems based on reinforcement learning methods have been applied in asset allocation and portfolio rebalancing. In this paper, we extend the existing work in recurrent reinforcement learning (RRL) and build an optimal variable weight portfolio allocation under a coherent downside risk measure, the expected maximum drawdown, E(MDD). In particular, we propose a recurrent reinforcement learning method, with a coherent risk adjusted performance objective function, the Calmar ratio, to obtain both buy and sell signals and asset allocation weights. Using a portfolio consisting of the most frequently traded exchange-traded funds, we show that the expected maximum drawdown risk based objective function yields superior return performance compared to previously proposed RRL objective functions (i.e. the Sharpe ratio and the Sterling ratio), and that variable weight RRL long/short portfolios outperform equal weight RRL long/short portfolios under different transaction cost scenarios. We further propose an adaptive E(MDD) risk based RRL portfolio rebalancing decision system with a transaction cost and market condition stop-loss retraining mechanism, and we show that the proposed portfolio trading system responds to transaction cost effects better and outperforms hedge fund benchmarks consistently.

چکیده فارسی
تئوری کنترل پویا برای حل مسائل تخصیص دارایی بهینه استفاده شده است و تعدادی از سیستم های تصمیم گیری تجاری مبتنی بر روش یادگیری تقویت در تخصیص دارایی و تعادل نمونه کارها مورد استفاده قرار گرفته اند. در این مقاله، کارهای موجود را در یادگیری تقویت کننده های عادی (RRL) گسترش می دهیم و یک مجموعه توزیع وزن متغیر بهینه را با یک معیار ریسک کاهش پایدار، حداکثر کاهش انتظار، E (MDD) ایجاد می کنیم. به طور خاص، ما یک روش یادگیری تقویتی مجدد را پیشنهاد می کنیم، با یک تابع اهداف عملکرد سازگار با ریسک منسجم، نسبت کلمر، برای به دست آوردن هر دو سیگنال خرید و فروش و وزن تخصیص دارایی. با استفاده از یک نمونه کارها که شامل صندوق های معامله شده با مبادلات اغلب معامله می شود، نشان می دهیم که تابع هدف اصلی بر اساس ریسک پیش بینی شده انتظار می رود عملکرد برتر در مقایسه با توابع هدف پیشین پیشنهاد شده RRL (یعنی نسبت شارپ و نسبت استرلینگ) وزن RRL اوراق بهادار طولانی / کوتاه از مقادیر برابر RRL پرتفوی طولانی / کوتاهتر از سناریوهای مختلف هزینه معامله بالاتر است. ما همچنان پیشنهاد می کنیم یک سیستم تصدیق بازده متعادل RRL مبتنی بر ریسک E (MDD) با هزینه معامله و مکانیزم بازآموزی توقف ضرر بازار را نشان دهیم و نشان می دهیم که سیستم معاملاتی پیشنهاد شده به اثرات هزینه معامله واکنش نشان می دهد.

موضوعات مقاله