پیش بینی بازده بازار سهام یکی از موثرترین ابزارها برای مدیریت ریسک و تنوع پرتفوی است. چندین تکنیک پیش بینی در ادبیات برای به دست آوردن پیش بینی های دقیق برای تصمیم گیری سرمایه گذاری وجود دارد. مطالعات تجربی متعددی از این روشها برای بررسی بازده شاخصهای مختلف سهام استفاده کردهاند. با این حال، مطالعات بسیار کمی در مورد گروه های بازار سهام یا شاخص ها انجام شده است. یافته های مطالعات قبلی نشان می دهد که هیچ روش واحدی وجود ندارد که بتوان آن را به طور یکسان در همه بازارها اعمال کرد. در این زمینه، این مطالعه با هدف بررسی عملکرد پیشبینی مدلهای خطی، غیرخطی، هوش مصنوعی، حوزه فرکانس و ترکیبی برای یافتن مدلی مناسب برای پیشبینی بازده سهام بازارهای توسعهیافته، نوظهور و مرزی انجام شد. ما بازده روزانه بازار سهام شاخصهای منتخب از بازارهای توسعهیافته، نوظهور و مرزی را برای دوره 2000-2018 در نظر گرفتیم تا عملکرد پیشبینی مدلهای فوق را ارزیابی کنیم. نتایج نشان داد که هیچ مدل واحدی از پنج مدل را نمی توان به طور یکسان در همه بازارها اعمال کرد. با این حال، مدلهای خطی و غیرخطی سنتی در ارائه پیشبینیهای دقیق از هوش مصنوعی و مدلهای حوزه فرکانس بهتر عمل کردند.
مقدمه
مطالعات نظری و تجربی نشان داده اند که رابطه مثبتی بین بازارهای مالی و رشد اقتصادی وجود دارد (به عنوان مثال، لوین، 1997؛ راجان و زینگالس، 1998؛ روسو و واچل، 2000؛ بک و همکاران، 2003؛ گوپتا و رائو، 2018). با توجه به اهمیت بازارهای مالی، پیش بینی بازده مالی جایگاه مهمی در تصمیم گیری سرمایه گذاری دارد. با این حال، بازارهای سهام با نوسان، پویایی و پیچیدگی بالا مشخص می شوند (جانسون و همکاران، 2003؛ کریستلی، 2014؛ ویلند، 2015). تحرکات در بازارهای سهام تحت تأثیر عوامل متعددی از جمله عوامل کلان اقتصادی، رویدادهای بین المللی و رفتار انسانی است. از این رو، پیش بینی بازده سهام می تواند به یک کار چالش برانگیز تبدیل شود. سودآوری سرمایه گذاری در بازارهای سهام به شدت به پیش بینی پذیری حرکت سهام بستگی دارد. اگر یک مدل یا تکنیک پیش بینی بتواند دقیقاً جهت بازار را پیش بینی کند، ریسک سرمایه گذاری و عدم اطمینان را می توان به حداقل رساند. این امر جریان سرمایه گذاری را در بازارهای سهام افزایش می دهد و همچنین برای سیاست گذاران و تنظیم کننده ها در تصمیم گیری مناسب و اتخاذ اقدامات اصلاحی مفید خواهد بود.
دو مکتب فکری متمایز - یعنی تحلیل بنیادی و تحلیل تکنیکال - برای پیشبینی حرکت قیمت سهام وجود دارد. بنیادگرایان قیمت سهام را بر اساس تحلیل های مالی شرکت ها یا صنایع پیش بینی می کنند. در همین حال، تحلیلگران فنی از داده های تاریخی اوراق بهادار استفاده می کنند و قیمت های آتی را با این فرض پیش بینی می کنند که قیمت سهام توسط نیروهای بازار تعیین می شود و تاریخ تمایل به تکرار دارد (لوی، 1967). این نظریه ها برای چندین دهه به عنوان استراتژی هایی برای تصمیم گیری سرمایه گذاری وجود داشتند. این رویکردها در دهه 1960 توسط تئوری پیاده روی تصادفی، که عموماً به عنوان فرضیه بازار کارآمد شناخته می شود، به چالش کشیده شد (فاما، 1970)، که پیشنهاد می کند تغییرات آتی در قیمت سهام را نمی توان از تغییرات قیمت گذشته پیش بینی کرد. برخی از مطالعات تجربی وجود "تحرک تصادفی" را در قیمت سهام نشان داده اند (به عنوان مثال، تانگ و همکاران، 2014؛ کوناک و سکر، 2014؛ اردم و اولوکاک، 2016). با این حال، بیشتر مطالعات تجربی نشان دادهاند که قیمت سهام قابل پیشبینی است (دارات و ژونگ، 2000؛ لو و مککینلی، 2002؛ هریسون و مور، 2012؛ اویدو و همکاران، 2013؛ رادیکوکو، 2014؛ سعید، 2015؛ آلموداف، 2018، 2002)..
تکنیک های مختلف پیش بینی برای پیش بینی سری های زمانی موجود است. مدلهای میانگین متحرک یکپارچه خودرگرسیون (ARIMA) توسط باکس و جنکینز (1970) برای تحلیل سریهای زمانی و پیشبینی پیشنهاد شدند. برخی از مطالعات با استفاده از مدلهای ARIMA برای پیشبینی بازده بازار سهام انجام شده است (الشیب، 2006؛ اوجو و اولتایو، 2009؛ آدبییی و اولوینکا، 2014؛ موندال و همکاران، 2014). تعداد کمی از مطالعات نشان دادند که مدلهای ARIMA پیشبینیهای پایینتری برای دادههای سری زمانی مالی تولید میکنند (ژانگ، 2003؛ آدبییی و اولوینکا، 2014؛ خاندلوال و همکاران، 2015). برای توضیح غیرخطیهای ناشی از تغییرات رژیم در اقتصادها، برخی از محققان از مدلهای تغییر رژیم مارکوف و مدلهای خودرگرسیون آستانه (TAR) با فرض فرآیندهای ثابت غیرخطی برای پیشبینی قیمت سهام استفاده کردهاند (همیلتون، 1989؛ تانگ، 1990). Tasy (1989) یک روش ساده و در عین حال به طور گسترده ای برای ساخت مدل برای مدل های خودرگرسیون آستانه و همچنین آزمونی برای غیرخطی بودن آستانه پیشنهاد کرد. گویجر (1998) تغییر رژیم را در مدل میانگین متحرک (MA) در نظر گرفت و از معیارهای اعتبارسنجی برای انتخاب مدل خودرگرسیون آستانه خود هیجانانگیز (SETAR) استفاده کرد. برخی از مطالعات تجربی که روشهای مختلف را با SETAR مقایسه میکنند، نشان میدهند که این روش نتایج برتری نسبت به مدلهای خطی ایجاد میکند (به عنوان مثال، کلمنتز و اسمیت، 1999؛ بورو و ماروکو، 2002؛ بورو، 2003؛ فیرات، 2017).
در اواخر دهه 1980، دستهای از مدلهای هوش مصنوعی (AI) - مانند مدلهای پیشخور، پس انتشار و شبکههای عصبی مکرر - برای اهداف پیشبینی معرفی شدند. ویژگیهای متمایز شبکههای عصبی مصنوعی (ANN) این است که دادهمحور، غیرخطی و خود انطباقپذیر هستند و مفروضات پیشینی بسیار کمی دارند. این امر شبکه های عصبی مصنوعی را برای پیش بینی سری های زمانی مالی ارزشمند و جذاب می کند. در میان مدلهای ANN، شبکه عصبی پیشخور با یک لایه پنهان، محبوبترین شبکه برای پیشبینی بازده بازار سهام شده است (ژانگ، 2003). بسیاری از مطالعات نشان دادهاند که این مدلها در مقایسه با مدلهای ساده و خطی، پیشبینیهای دقیقتری ارائه میدهند (به عنوان مثال، غیاثی و همکاران، 2005؛ مصطفی، 2010؛ کیو و همکاران، 2016؛ ارس و کوچاکوک، 2016).
علاوه بر این ، مدل های مختلف شبکه عصبی برای پیش بینی بازده سهام وجود دارد. لو و وو (2011) برای پیش بینی شاخص های بازار سهام Nikkei 225 و بورس اوراق بهادار از مدل مخچه مدل کنترل کننده کنترل کننده کنترل کننده (CAMC NN) از مدل مخچه استفاده کردند. نتایج نشان داد که CAMC NN پیش بینی های دقیق تری نسبت به رگرسیون بردار پشتیبانی و مدل های عصبی شبکه (BPNN) ایجاد کرده است. گورسن و همکاران.(2011) مشاهده کرد که مدل های کلاسیک ANN و Perceptron چند لایه (MLP) از مدل های کلاس GARCH برای شاخص NASDAQ بهتر عمل می کنند. Lahmiri (2016) از تجزیه حالت متغیر (VMD) شبکه های عصبی رگرسیون عمومی مبتنی بر چهار مجموعه داده اقتصادی و مالی استفاده کرد و دریافت که مدل های VMD-GRN از مدل ARIMA و سایر مدل های شبکه عصبی بهتر عمل می کنند. شبکه عصبی چند جمله ای متراکم مبتنی بر الگوریتم ژنتیکی نایاک و میرا (2018) ، دقت شاخص های سهام پیش بینی را در مقایسه با شبکه عصبی عملکرد شعاعی (RBFNN) و الگوریتم ژنتیک چند لایه (MLP-GA) بهبود بخشید. Zhong و Enke (2019) اظهار داشتند که تکنیک هایی مانند شبکه های عصبی عمیق با استفاده از تجزیه و تحلیل مؤلفه اصلی (PCA) و شبکه های عصبی مصنوعی بهتر از مدل های سنتی عملکرد دارند. با این حال ، بیشتر مطالعات نشان داده اند که مدل های سنتی ANN ، و همچنین مدل های ANN همراه با مدل های خطی ، پیش بینی های دقیق تری نسبت به سایر مدل ها تولید می کنند (به عنوان مثال ، Asadi et al. ، 2010 ؛ Wang et al. ، 2011 ؛ Khandelwal et al. 2015 ؛ Mallikarjuna و همکاران ، 2018).
اخیراً ، مدلهای دامنه فرکانس ، مانند تجزیه و تحلیل طیفی ، موجک و تحولات فوریه ، برای بهبود دقت پیش بینی سری زمانی مالی پیشنهاد شده است. یکی از تکنیک های گسترده استفاده شده ، تجزیه و تحلیل طیف مفرد (SSA) است که یک روش غیر پارامتری قوی و بدون فرضیات قبلی در مورد داده ها است (Golyandina et al. ، 2001 ؛ Hassani et al. ، 2013a). SSA داده های سری زمانی را در مؤلفه های خود تجزیه می کند و سپس با ترک مؤلفه نویز تصادفی قبل از استفاده از سری بازسازی شده برای پیش بینی نقاط آینده در این سریال ، این سری را بازسازی می کند (Hassani ، 2007 ؛ Ghodsi and Omer ، 2014). از آنجا که بیشتر مجموعه داده های سری زمانی مالی نه الگوهای کاملاً خطی و نه کاملاً غیرخطی ، ترکیبی از خطی و غیرخطی ، یعنی تکنیک های ترکیبی برای مدل سازی ساختارهای داده پیچیده برای دقت بهبود یافته ارائه شده است (Asadi et al. ، 2010 ؛ Khashei و Bijari ،2010 ؛ Khashei and Bijari ، 2012 ؛ Khandelwal et al. ، 2015 ؛ Ince and Trafalis ، 2017). Khashei و Hajirahimi (2017) مدلهای خطی و غیرخطی را با مدل های ترکیبی (HM) مقایسه کردند و نتیجه گرفتند که مدل های ترکیبی عملکرد بهتری نسبت به مدل های فردی دارند.
فقط چند مطالعه با هدف یافتن یک روش مناسب برای پیش بینی بازده سهام گروهی از بازارها انجام شده است. گیدولین و همکاران.(2009) عملکرد مدلهای خطی و غیرخطی را برای پیش بینی بازده دارایی مالی کشورهای G7 ارزیابی کرد. آنها دریافتند که مدل های غیرخطی ، مانند مدل های اتورگرایی آستانه (TAR) و مدلهای خودکار انتقال خودکار (STAR) ، در مورد بازده دارایی ایالات متحده و انگلیس بهتر از مدل های خطی عمل می کنند. در همین حال ، مدل های خطی ساده مانند راهپیمایی تصادفی و مدلهای خودکار برای بازده دارایی فرانسوی ، آلمانی و ایتالیایی بهتر بودند. این نشان می دهد که هیچ مدل واحدی برای پیش بینی بازده کلیه بازارهای سهام مناسب نیست. Awajan و همکاران..
اگرچه تکنیک های مختلفی برای پیش بینی بازده بازار سهام وجود دارد، هیچ روش واحدی را نمی توان به طور یکسان برای بازده همه بازارهای سهام به کار برد. ادبیات نشان میدهد که بین محققین در مورد تکنیکهای پیشبینی بازده بازار سهام اتفاق نظر وجود ندارد. بنابراین، مطالعه حاضر با هدف ارزیابی تکنیکهای مختلف پیشبینی - یعنی مدلهای ARIMA، SETAR، ANN، SSA و HM که به ترتیب نشاندهنده روشهای خطی، غیرخطی، هوش مصنوعی (AI)، حوزه فرکانس و ترکیبی هستند، انجام شد. بازارهای سهام فردیاین مطالعه همچنین مناسب بودن روشهای مختلف پیشبینی را برای هر دسته از بازارهای سهام جهان-یعنی توسعهیافته، نوظهور و مرزی- بررسی کرد. یافتن یک روش واحد که بتواند پیش بینی های بهینه را برای همه بازارها ایجاد کند، می تواند به سرمایه گذاران در صرفه جویی در زمان و منابع و تصمیم گیری بهتر کمک کند. این مطالعه عمدتاً برای سرمایهگذاران بینالمللی و سرمایهگذاران نهادی خارجی که میخواهند ریسکها را به حداقل برسانند و پرتفوی خود را متنوع کنند، با هدف به حداکثر رساندن سود مفید است. اهداف پژوهش حاضر در زیر بیان شده است.
اهداف
پیش بینی بازده بازار سهام با استفاده از روش های خطی، غیرخطی، هوش مصنوعی، حوزه فرکانس و ترکیبی.
یافتن مناسبترین تکنیکهای پیشبینی از میان پنج تکنیک فوق الذکر برای بازارهای توسعهیافته، نوظهور و مرزی.
برای بررسی اینکه آیا هر تکنیک واحدی را می توان در همه بازارها برای به دست آوردن پیش بینی های بهینه اعمال کرد یا خیر.
بقیه این مقاله به شرح زیر سازماندهی شده است. بخش 2 داده ها و روش های مورد استفاده در مطالعه را تشریح می کند. بخش 3 نتایج تجربی را ارائه می کند. در نهایت، نتیجه گیری در بخش 4 آورده شده است.
داده ها و روش شناسی
مطابق با اهداف این مطالعه، ما سه نوع بازار - توسعه یافته، نوظهور و مرزی- را بر اساس طبقهبندی بینالمللی سرمایه مورگان استنلی (MSCI، 2018) در نظر گرفتیم. شاخص های بازار گرفته شده برای دسته توسعه یافته عبارتند از: استرالیا (ASX 200)، کانادا (TSX Composite)، فرانسه (CAC 40)، آلمان (DAX)، ژاپن (NIKKEI 225)، کره جنوبی (KOSPI)، سوئیس (SMI)، متحد. پادشاهی (FTSE 100) و ایالات متحده (S& P 500). بازارهای نوظهور برزیل (BOVESPA)، چین (SSEC)، مصر (EGX 30)، هند (SENSEX)، اندونزی (IDX)، مکزیک (BMV IPC)، روسیه (MOEX)، آفریقای جنوبی (JSE 40)، تایلند هستند.(SET)، و ترکیه (BIST 100). در نهایت، آنهایی که در رده مرزی قرار دارند عبارتند از: آرژانتین (S& P MERVAL)، استونی (TSEG)، کنیا (NSE 20)، سریلانکا (CSE AS) و تونس (TUNINDEX). قیمت پایانی روزانه این شاخص ها برای بازه زمانی 1 ژانویه 2000 تا 30 دسامبر 2018 از وب سایت www. investing. com اخذ شده است.
بازده دارایی (Rتی) از قیمت های پایانی همه شاخص ها با استفاده از فرمول محاسبه شد:
کجا، پتیقیمت دارایی در دوره زمانی جاری و P استt - 1قیمت یک دارایی در دوره زمانی قبلی است.
میانگین متحرک یکپارچه خودرگرسیون (ARIMA)
مدل های ARIMA که توسط جورج باکس و گویلیم جنکینز در سال 1970 پیشنهاد شد، از محبوب ترین مدل های خطی هستند. در مدل های ARIMA، مقدار آینده یک متغیر از طریق یک تابع خطی از برخی مشاهدات گذشته متغیر و برخی از خطاهای تصادفی به دست می آید. فرآیندی که سری های زمانی را تولید می کند به شکل زیر است:
جایی که yتیمتغیری است که در زمان t توضیح داده خواهد شد. c ثابت یا قطع است. ϕمن(i = 1، 2، …p) و θj(j = 1, 2, …. q) پارامترهای مدل هستند. p و q اعداد صحیح هستند و اغلب به ترتیب به عنوان دستورات AR و MA مدل نامیده می شوند. و هتیاصطلاح خطا است. فرض مربوط به خطاهای تصادفی εتیاین است که آنها به طور مستقل و یکسان با میانگین واریانس صفر و ثابت σ 2 توزیع می شوند. این مدل شامل یک فرآیند تکراری سه مرحله ای از شناسایی ، تخمین و بررسی تشخیصی است. مرحله شناسایی شامل تعیین یک مدل آزمایشی با تصمیم گیری در مورد ترتیب شرایط AR (P) و MA (Q) است. پس از مشخص شدن یک مدل آزمایشی ، باید پارامترهای مدل تخمین زده شود ، به گونه ای که اندازه گیری کلی خطاها به حداقل می رسد ، که به طور کلی با یک روش بهینه سازی غیرخطی انجام می شود. پس از برآورد پارامترها ، بررسی تشخیصی برای کفایت مدل باید انجام شود ، که شامل آزمایش اینکه آیا فرضیات مدل در مورد خطاها εتیراضی هستنداگر مدل کافی باشد ، می توان به پیش بینی ادامه داد. اگر اینگونه نباشد ، باید یک مدل آزمایشی جدید پس از برآورد پارامتر و تأیید مدل مشخص شود. این فرآیند با سه مرحله باید تکرار شود تا یک مدل رضایت بخش برای پیش بینی داده ها انتخاب شود.
خود هیجان انگیز Autoregressive (Setar)
مدل SETAR ، که توسط TONG (1983) تهیه شده است ، نوعی از مدل خودکار است که می تواند برای داده های سری زمانی اعمال شود. این مدل در پارامترهایی که دارای رفتار سوئیچینگ رژیم هستند ، انعطاف پذیری بیشتری دارد (واتیر و ریچاردسون ، 1995). تعویض رژیم در این مدل مبتنی بر خودکشی متغیر وابسته ، یعنی خودآگاهی است. به عبارت دیگر ، مقدار آستانه در مدل SETAR به متغیر درون زا مربوط می شود در حالی که ، در مدل TAR ، مربوط به یک متغیر برونزا است. این مدل یک فرآیند خودکار متفاوت را مطابق با مقادیر آستانه خاص فرض می کند. مدل های SETAR این مزیت را دارند که یک پدیده غیرخطی را که معمولاً مشاهده می شود ، که نمی تواند توسط مدلهای خطی مانند صافی نمایی و مدل های ARIMA اسیر شود.
اگر متغیر آستانه به عنوان یک مقدار عقب مانده از سری زمانی گرفته شود ، می توان یک مدل خودکار آستانه را به یک مدل SetAR تبدیل کرد. مدل SETAR با دو رژیم به صورت مشخص شده است:
جایی که αمنو βمنضرایب اتورگرایی هستند ، P ترتیب مدل SetAR ، D پارامتر تأخیر و y استt - dمتغیر آستانه است ، εتییک سری از متغیرهای تصادفی است که مستقل هستند و با میانگین 0 و واریانس \ (_^2 \) توزیع می شوند. τ مقدار آستانه است و اگر مقدار τ شناخته شده باشد ، مشاهدات را می توان بر اساس ارزش آنها در مقایسه با آستانه ، یعنی اینکه آیا y از هم جدا شود ، از هم جدا شود.t - dدر زیر یا بالاتر از آستانه است. سپس ، با استفاده از روش معمولی مربعات معمولی ، مدل AR تخمین زده می شود (اسماعیل و عیسی ، 2006). مقدار آستانه باید همراه با سایر پارامترهای مدل SETAR تعیین شود ، زیرا مقدار آستانه به طور کلی ناشناخته است.
شبکه های عصبی مصنوعی (ANN)
شبکه های عصبی مصنوعی یکی از چارچوب های محاسباتی انعطاف پذیر هستند که می توانند برای مدل سازی طیف گسترده ای از داده های غیرخطی مورد استفاده قرار گیرند. مهمترین مزایای مدل های ANN این است که آنها تقریب داده های داده و جهانی هستند که می توانند کلاس بزرگی از کارکردها را با دقت بسیار زیاد تقریب دهند. این فرآیند تولید مدل به هیچ فرضیه قبلی در مورد فرم مدل احتیاج ندارد زیرا ویژگی های داده ها مدل شبکه را تعیین می کنند. یک شبکه عصبی تغذیه ای با یک لایه پنهان یکی از روشهای پرکاربرد برای پیش بینی داده های سری زمانی است (ژانگ ، 2003). ساختار مدل توسط شبکه ای از سه لایه از واحدهای پردازش ساده متصل به پیوندهای آسیكلیك تعریف شده است. بازنمایی ریاضی رابطه بین خروجی yتیو ورودی ها (yt - 1، yt - 2،… .. yt - p) را می توان به عنوان:
جایی که wj(j = 0 ، 1 ، 2 ،… ، q) و wIJ(i = 0 ، 1 ، 2 ،…. p ؛ j = 0 ، 1 ، 2 ،… ، q) وزن اتصال یا پارامترهای مدل هستند ، p تعداد گره های ورودی است و q تعداد گره های پنهان استوادعملکرد انتقال لایه پنهان توسط عملکرد لجستیک داده می شود:
از این رو ، مدل ANN در Eq. 4 نقشه برداری عملکردی غیرخطی را از مشاهدات گذشته انجام می دهد (yt - 1، yt - 2،… .. yt - p) به ارزش آینده yتی-به این معنا که،
جایی که F تابعی است که توسط ساختار شبکه و وزن اتصال تعیین می شود و W بردار همه پارامترها است. بنابراین ، این مدل شبکه عصبی شبیه به یک مدل خودکار با عملکرد غیرخطی است.
انتخاب مقدار q به داده ها بستگی دارد، زیرا هیچ معیار استانداردی برای تعیین این پارامتر خاص وجود ندارد. یکی دیگر از وظایف حیاتی مدلسازی ANN، انتخاب بعد بردار ورودی و تعداد مشاهدات با تأخیر است. این شاید مهمترین پارامتری باشد که باید در یک مدل شبکه عصبی مصنوعی تخمین زده شود، زیرا تعیین ساختار خودهمبستگی غیرخطی سریهای زمانی به این پارامتر بستگی دارد. با این حال، هیچ قانون کلی وجود ندارد که بتوان از آن برای انتخاب مقدار p پیروی کرد. بنابراین، اغلب آزمایشهایی برای انتخاب مقدار بهینه p و q انجام میشود. پس از تعیین ساختار شبکه با پارامترهای p و q آماده آموزش می باشد. این کار با الگوریتمهای بهینهسازی غیرخطی کارآمد، مانند الگوریتمهای گرادیان نزولی و الگوریتمهای گرادیان مزدوج، به غیر از الگوریتم آموزشی انتشار پسانداز (Hung, 1993) انجام میشود.
در شبکه های عصبی مصنوعی، پرکاربردترین توابع فعال سازی، توابع سیگموئید هستند. اخیراً در یادگیری عمیق، چندین تابع دیگر به عنوان جایگزین برای تابع سیگموئید پیشنهاد شده است، مانند تابع مماس هذلولی (tanh)، واحدهای خطی اصلاح شده (ReLU)، softmax و گاوسی. این توابع در زیر آورده شده است.
تابع مماس هذلولی (tanh) یکی از جایگزین های تابع سیگموئید است. می توان آن را اینگونه تعریف کرد:
این تابع شبیه تابع سیگموئید است، با این حال، عدد واقعی را در محدوده ای بی ن-1 و 1 فشرده می کند. یعنی tanh ( x ) ∈ (-1, 1).
واحدهای خطی اصلاح شده (ReLU) به صورت زیر تعریف می شوند:
جایی که x ورودی یک نورون است. به عبارت دیگر، فعال سازی به سادگی در آستانه صفر تنظیم می شود. محدوده ReLU بین 0 و ∞ است.
تابع softmax که به عنوان تابع نمایی نرمال شده نیز نامیده می شود، تعمیم تابع لجستیکی است که بردار K بعدی Z را از مقادیر واقعی تصادفی به بردار K بعدی σ(z) مقادیر واقعی در محدوده [0، فشرده می کند. 1]، که جمع آنها به 1 می رسد. تابع به صورت زیر تعریف می شود:
توابع فعال سازی گاوسی منحنی های زنگوله ای هستند که پیوسته هستند. خروجی گره بسته به نزدیک بودن ورودی خالص برای یک مقدار میانگین انتخاب شده، یعنی بر حسب عضویت در کلاس (1 یا 0) تفسیر می شود. تابع به صورت زیر تعریف می شود:
تجزیه و تحلیل طیف منفرد (SSA)
برخی از مطالعات از روش SSA برای پیشبینی سریهای زمانی مالی استفاده کردهاند (حسنی و همکاران، 2013b؛ قدسی و عمر، 2014). روش SSA شامل دو مرحله است، یکی تجزیه و دیگری بازسازی است. در مرحله اول سری زمانی برای جداسازی سیگنال و نویز تجزیه می شود، سپس در مرحله دوم سری با نویز کمتر بازسازی شده و با استفاده از مراحل زیر برای پیش بینی اعمال می شود (حسنی، 1386):
مرحله 1. جاسازی. جاسازی را می توان یک نقشه برداری در نظر گرفت که یک سری زمانی یک بعدی Y را منتقل می کندN = (y1,…, yN) به یک سری X چند بعدی1, …,XKبا بردارهای Xi = (yi,…, yi + L − 1) T ε R L ، که در آن L (2 ≤ L ≤ N - 1) طول پنجره است و K = N - L + 1. نتیجه این مرحله ماتریس مسیر است.
مرحله 2. تجزیه مقدار منفرد (SVD). در این مرحله SVD X پیاده سازی می شود. با λ نشان داده می شود1…. , ,λLمقادیر ویژه XX T به ترتیب کاهشی مرتب شده اند (λ1, , ≥ … ≥ λL≥ 0) و توسط U1…. , ,ULبردارهای ویژه مربوطهSVD X را می توان به صورت X = X نوشت1 + … + XL، جایی که، \(<\mathrm
مرحله 3. گروه بندی. این مرحله شامل تقسیم ماتریس های ابتدایی به چند گروه و سپس اضافه کردن ماتریس های درون هر گروه است.
مرحله 4. میانگین گیری مورب. هدف اصلی از میانگینگیری مورب تبدیل یک ماتریس به شکل ماتریس Hankel است که میتواند بعداً به یک سری زمانی تبدیل شود.
مرحله 5. پیش بینی. دو شکل از پیشبینی SSA وجود دارد: تحلیل طیف منفرد مکرر (RSSA) و تحلیل طیف منفرد برداری (VSSA). در این مطالعه، ما از RSSA استفاده کردیم. اجازه دهید \(^2=<\pi>_1^2+\dots +<\pi>_r^2 \) جایی که πiآخرین جزء بردار ویژه U استمن(i = 1، …، r). علاوه بر این، برای هر بردار U ε R L، با U ∇ ε R L − 1 بردار را که از اولین L − 1 جزء بردار U تشکیل شده است نشان دهید. اجازه دهید YN + 1، …YN + hشرایط h پیش بینی مکرر SSA را نشان دهید. سپس با استفاده از فرمول زیر می توانیم پیش بینی های h-step ahead را بدست آوریم.
جایی که \( \overset\ \left(i=1،\dots، N1ight) \) سری بازسازی شده است و بردار A = (α, …, αL - 1
) را می توان توسط
مدل هیبریدی (HM)
یا مدل های کاملاً خطی یا کاملاً غیرخطی ممکن است برای پیش بینی بازده سهام کافی نباشد زیرا بازده سهام از نظر ماهیت پیچیده است. حتی ANN های مبتنی بر داده ها نتایج مختلط را در پیش بینی داده های سری زمانی ایجاد کرده اند. به عنوان مثال ، دنتون (1995) از داده های شبیه سازی شده استفاده کرد و دریافت که وقتی در داده ها چند قطبی یا خارج از کشور وجود دارد ، شبکه های عصبی می توانند داده ها را بهتر از مدل های رگرسیون خطی پیش بینی کنند. اندازه نمونه و سطح سر و صدا نقش مهمی در تعیین عملکرد ANN ها برای مشکلات رگرسیون خطی دارد (مارکام و راکس ، 1998). بنابراین ، ممکن است استفاده از ANN ها برای انواع داده ها مفید نباشد.
با توجه به پیچیدگی های موجود در داده های بازار سهام ، روشی که می تواند داده های خطی و غیرخطی را اداره کند ، یعنی مدل ترکیبی ممکن است جایگزینی برای پیش بینی باشد. جنبه های خطی و غیرخطی الگوهای اساسی در داده ها را می توان با ترکیب مدل های مختلف ضبط کرد.
ممکن است در نظر گرفتن داده های سری زمانی متشکل از ساختار همبستگی خطی و یک مؤلفه غیرخطی مفید باشد. به این معنا که،تیحرفتیحرفتیحرف
باقیمانده را در زمان T از مدل خطی مشخص کنید ، سپس:<\hat
_t \) مقدار پیش بینی در زمان t از رابطه برآورد شده از Eq است. 13. باقیمانده ها در تشخیص کفایت مدلهای خطی بسیار مهم هستند زیرا وجود همبستگی خطی در باقیمانده ها نشانگر عدم کفایت مدل خطی است. علاوه بر این ، هر الگوی غیرخطی قابل توجهی در باقیمانده ها نیز محدودیت در مدل خطی را نشان می دهد. روابط غیرخطی را می توان با مدل سازی باقیمانده با استفاده از ANN کشف کرد. مدل ANN برای باقیمانده با گره های ورودی N خواهد بود:تیحرف<\hat
_t \) ، پیش بینی ترکیبی خواهد بود:<\hat
_t \) مقدار تخمین زده شده از مدل ترکیبی است که ترکیبی از مدل های خطی و غیرخطی است. ما از نسبت خطای پیش بینی مربع معکوس (MSFE) برای تعیین وزن بهینه برای مدلهای ترکیبی استفاده کردیم زیرا این روش به طور گسترده ای با پیشینه نظری قوی است (بیتس و همکاران ، 1969).
_t \) ، پیش بینی ترکیبی خواهد بود:<\hat
_ \) پیش بینی نقطه برای H قدم های جلوتر در زمان t از مدل m است. به طور خلاصه ، این روش ترکیبی شامل دو مرحله است. اولین قدم استفاده از ARIMA برای مدل سازی قسمت خطی داده ها است. مرحله دوم استفاده از ANN برای مدل سازی باقیمانده های به دست آمده از Arima است ، این باقیمانده ها اطلاعاتی در مورد غیرخطی بودن در داده ها دارند. نتایج حاصل از مدل ANN می تواند به عنوان پیش بینی برای اصطلاحات خطا برای مدل ARIMA استفاده شود. به روشی که در بالا ذکر شد ، مدل ترکیبی ویژگی های مدل های ARIMA و ANN را در داده های سری زمانی مدل سازی شامل می شود. بنابراین ، استفاده از مدل های ترکیبی برای بهبود صحت پیش بینی ها می تواند مفید باشد.
پیش بینی اقدامات عملکرد
دقت پیش بینی ها نشان می دهد که یک مدل پیش بینی به خوبی متغیر انتخاب شده را پیش بینی می کند. از اقدامات دقت مختلفی برای اعتبارسنجی مناسب بودن یک مدل برای یک مجموعه داده معین استفاده می شود. چندین اقدامات دقت در ادبیات وجود دارد ، مانند میانگین خطای (ME) ، میانگین خطای مطلق (MAE) ، میانگین خطای درصد مطلق (MAPE) ، میانگین خطای مربع (MSE) و خطای میانگین مربعات ریشه (RMSE). در این مطالعه ، ما از RMSE استفاده کردیم زیرا این یکی از مناسب ترین روش ها برای اندازه گیری دقت پیش بینی برای داده ها در همان مقیاس است و این معیار در چندین مطالعه قبلی به کار رفته است (لو و وو ، 2011 ؛ وانگ و همکاران ، 2011؛ Hyndman and Athanasopoulos ، 2015 ؛ Makridakis et al. ، 2015). همچنین ، Chai و Draxler (2014) اظهار داشتند که RMSE یک معیار مناسب برای مدل هایی با خطاهای عادی توزیع شده است. مطالعه حاضر نشان داد كه خطاها در بیشتر مدل ها از توزیع عادی پیروی می كنند.تیحرفتیحرف