در این مقاله روشی برای پیش بینی نوسانات قیمت ارزهای رمزنگاری شده ، که به طور فزاینده ای برای معاملات آنلاین در سراسر جهان استفاده می شود ، پیشنهاد می کند. تحقیقات کمی در مورد پیش بینی نوسانات در قیمت و تعداد معاملات انواع ارزهای رمزپایه انجام شده است. علاوه بر این ، چند روش ارائه شده برای پیش بینی نوسان در قیمت ارز ناکارآمد است زیرا آنها نمی توانند تفاوت های مربوط به ویژگی های بین ارزهای واقعی و ارزهای رمزنگاری شده را در نظر بگیرند. در این مقاله نظرات کاربر در جوامع رمزنگاری آنلاین برای پیش بینی نوسانات قیمت ارزهای رمزنگاری شده و تعداد معاملات مورد بررسی قرار گرفته است. این مقاله با تمرکز روی سه ارز رمزنگاری ، هر یک با اندازه بزرگ بازار و پایگاه کاربر ، سعی در پیش بینی چنین نوسانات با استفاده از یک روش ساده و کارآمد دارد.
استناد: کیم YB ، Kim JG ، Kim W ، Im JH ، Kim TH ، Kang SJ ، et al.(2016) پیش بینی نوسانات در معاملات cryptocurrency بر اساس نظرات و پاسخ های کاربر. PLOS ONE 11 (8): E0161197. https://doi. org/10. 1371/journal. pone. 0161197
ویراستار: وی-Xing ژو ، دانشگاه علوم و فناوری شرق چین ، چین
دریافت: 19 آوریل 2016 ؛پذیرفته شده: 31 ژوئیه 2016 ؛منتشر شده: 17 اوت 2016
کپی رایت: © 2016 کیم و همکاران. این یک مقاله دسترسی آزاد است که تحت شرایط مجوز انتساب Creative Commons توزیع شده است ، که امکان استفاده ، توزیع و تولید مثل بدون محدودیت در هر رسانه را فراهم می کند ، مشروط بر اینکه نویسنده و منبع اصلی اعتبار داشته باشند.
در دسترس بودن داده ها: کلیه داده های مربوطه در داخل مقاله و پرونده های اطلاعاتی پشتیبانی آن قرار دارند.
-2015R1A1A1A05001196).
منافع رقابتی: نویسندگان اعلام کرده اند که هیچ منافع رقابتی وجود ندارد.
معرفی
همه گیر بودن دسترسی به اینترنت باعث ظهور ارزهای متمایز از موارد مورد استفاده در سیستم پولی رایج شده است. ظهور ارزهای رمزپایه بر اساس روشی منحصر به فرد به نام "معدن" باعث ایجاد تغییرات چشمگیر در فعالیت های اقتصادی آنلاین کاربران شده است. ارزهای مختلف رمزنگاری از سال 2008 ، هنگامی که بیت کوین برای اولین بار معرفی شد ، پدید آمده است [1 ، 2]. امروزه ، ارزهای رمزنگاری شده اغلب در معاملات آنلاین مورد استفاده قرار می گیرند و استفاده از آنها هر سال از زمان معرفی آنها افزایش یافته است [3 ، 4].
ارزهای رمزنگاری شده در درجه اول با نوسانات در قیمت و تعداد معاملات آنها مشخص می شود [2 ، 3]. به عنوان مثال ، مشهورترین cryptocurrency ، بیت کوین ، تا پایان سال 2013 شاهد نوسانات قابل توجهی در قیمت و تعداد معاملات آن نبوده است [3] ، هنگامی که شروع به جلب توجه در سراسر جهان کرد ، و شاهد افزایش و نوسان قابل توجهی در قیمت آن بود. تعداد معاملاتبه عنوان مثال دیگر ارزهای رمزنگاری شده - به عنوان مثال ، نوسانات قابل توجهی ناپایدار از پایان دسامبر 2013 نشان داده شده اند [5]. چنین نوسانات ناپایدار به عنوان فرصتی برای حدس و گمان برای برخی از کاربران در حالی که بیشتر دیگران را از استفاده از ارزهای رمزنگاری می کند [2 ، 6 ، 7] است.
تحقیقات در مورد ویژگیهای ارزهای دیجیتال پیشرفت ثابتی داشته است، اما راه زیادی در پیش دارد. اکثر محققان احساسات کاربران مربوط به ارزهای دیجیتال را در رسانه های اجتماعی، به عنوان مثال، توییتر، یا پرس و جوهای جستجوی وب در موتورهای جستجو مانند گوگل، و همچنین نوسانات قیمت و حجم معاملات را برای تعیین هر رابطه ای تجزیه و تحلیل می کنند [8-12]. مطالعات گذشته محدود به بیتکوین بوده است، زیرا حجم زیادی از دادههایی که ارائه میکند، نیاز به ساخت مدلی برای پیشبینی نوسانات قیمت و تعداد تراکنشهای ارزهای دیجیتال متنوع را از بین میبرد.
بنابراین، این مقاله روشی را برای پیشبینی نوسانات قیمت و تعداد تراکنشهای ارزهای دیجیتال پیشنهاد میکند. روش پیشنهادی نظرات کاربران را در مورد انجمنهای ارزهای دیجیتال آنلاین تجزیه و تحلیل میکند، و یک تحلیل ارتباطی بین این نظرات و نوسانات در قیمت و تعداد تراکنشهای ارزهای دیجیتال برای استخراج عوامل مهم و فرمولبندی یک مدل پیشبینی انجام میدهد. این روش برای پیش بینی نوسانات در ارزهای دیجیتال بر اساس ویژگی های جوامع آنلاین در نظر گرفته شده است.
جوامع آنلاین به عنوان انجمنی عمل می کنند که در آن افراد نظرات خود را در مورد موضوعات مورد علاقه مشترک به اشتراک می گذارند [13-17]. بنابراین، چنین جوامعی پاسخهای روزانه بسیاری از کاربران به ارزهای دیجیتال خاص را منعکس میکنند. ارزهای رمزپایه عمدتاً به صورت آنلاین معامله می شوند، جایی که بسیاری از کاربران برای تصمیم گیری در مورد فروش یا خرید آنها به اطلاعات موجود در وب متکی هستند [4، 18]. در این مقاله، موضوعات روزانه و نظرات/پاسخهای مرتبط در انجمنهای ارزهای دیجیتال برای تعیین اینکه چگونه نظرات کاربران جامعه با نوسانات قیمت و تعداد تراکنشهای ارزهای دیجیتال به صورت روزانه مرتبط است، تحلیل میشوند.
روش پیشنهادی برای طیف وسیعی از ارزهای رمزنگاری شده قابل اجرا است و میتواند نوسانات قیمت ارزهای دیجیتال مانند بیتکوین، ریپل و اتریوم را تا حد معینی پیشبینی کند (تقریباً ۷۴٪ دقت میانگین وزنی). علاوه بر این، افزایش و کاهش تعداد تراکنش های بیت کوین و اتریوم تا حدودی قابل پیش بینی است.
مواد و روش ها
بررسی اجمالی سیستم
برای سیستم پیشنهادی، ما تمام نظرات و پاسخهای ارسال شده در انجمنهای آنلاین مربوط به ارزهای دیجیتال را بررسی کردیم [19-21]. سپس داده ها (نظرات و پاسخ ها) را تجزیه و تحلیل کردیم و میزان مثبت یا منفی بودن هر موضوع و همچنین هر نظر و پاسخ را برچسب گذاری کردیم. به دنبال آن، ما رابطه بین قیمت و تعداد تراکنشهای ارزهای دیجیتال را بر اساس نظرات کاربران و پاسخها به دادههای انتخابی (نظرات و پاسخها) که رابطه معنیداری نشان میدهند، آزمایش کردیم. در نهایت، ما یک مدل پیشبینی از طریق یادگیری ماشین بر اساس دادههای انتخاب شده برای پیشبینی نوسانات ایجاد کردیم (شکل 1).
خزیدن داده های نظرات کاربر
ما دادههای مورد نیاز برای ایجاد مدل پیشبینی را خزیدیم. هنگامی که محیط معاملات ارزهای دیجیتال بین کاربران ایجاد شد، تراکنش بین کاربران منجر به نوسانات قیمت می شود [4]. ما فرض کردیم که نظرات کاربران در برخی از جوامع ارزهای دیجیتال آنلاین ممکن است بر نوسانات قیمت و حجم معاملات آنها تأثیر بگذارد. بنابراین، ما داده های مربوطه را خزیدیم. تا فوریه 2016 تقریباً 670 نوع ارز دیجیتال وجود داشته است [22]. از بین موارد موجود، ما جوامع آنلاین را برای سه مورد برتر از نظر ارزش بازار، یعنی بیت کوین، اتریوم و ریپل بررسی کردیم. ما لایت کوین را در این مطالعه لحاظ نکردیم زیرا به نظر میرسید که جوامع آنلاین آن بهاندازه کافی فعال نیستند تا در این آزمایش در نظر گرفته شوند، علیرغم حجم بالای بازار و پایگاه کاربر گسترده آن.
از آنجایی که بیت کوین اولین ارز دیجیتال بود، جامعه کاربری زیادی دارد. در جامعه بیت کوین [19]، اقلام داده از دسامبر 2013، زمانی که ارز دیجیتال به طور گسترده در دسترس قرار گرفت، جمع آوری شد. در جامعه اتریوم [20]، دادهها از 7 آگوست 2015 جمعآوری شد، از زمانی که جامعه به حدی تثبیت شد که حداقل یک موضوع از آن زمان هر روز پست شده و دادههای تراکنش در دسترس است. از جامعه ریپل [21]، تمام داده ها از زمان ایجاد جامعه جمع آوری شد. در تمام جوامع مورد علاقه، ما داده ها را به روشی قانونی و مطابق با شرایط و ضوابط آنها جمع آوری کردیم. با این حال، دادههای جمعآوریشده شامل هیچ گونه اطلاعات قابل شناسایی شخصی نمیشود.
ارزهای رمزنگاری شده مورد علاقه در این مقاله دارای جوامع آنلاینی بودند که در آن کاربران نظرات خود را در مورد موضوعات مربوطه به اشتراک گذاشتند. جامعه بیت کوین [19] به چهار بخش تقسیم می شود، به عنوان مثال، یک بخش «بیت کوین» در مورد موضوعات مرتبط با بیت کوین، یک بخش «اقتصاد» در مورد تراکنش ها، یک بخش «ارزهای دیجیتال جایگزین» مربوط به سایر ارزهای دیجیتال، و یک بخش «سایر» برایموضوعات دیگرهر بخش دارای سه تا پنج زیربخش است. بخش «بیت کوین» شامل «بحث بیت کوین»، «بحث توسعه و فنی»، «معدن»، «پشتیبانی فنی» و «توسعه پروژه» بود. بخش «ارزهای دیجیتال جایگزین» ساختار مشابهی داشت. برای این مقاله، بخشهای فرعی بحث را برای موضوعات مرتبط با هر یک از ارزهای دیجیتال بررسی کردیم.
نظرات و پاسخهای مرتبط ارسال شده توسط کاربران در تابلوی اعلانات در هر جامعه خزیده شد. علاوه بر این، زمان ارسال هر نظر و پاسخ به آن، تعداد پاسخها به هر نظر و تعداد بازدیدها نیز خزیده شد. پاسخهایی که نظرات قبلی را نقل میکنند و پاسخها به استثنای جملات همپوشانی خزیده میشوند. صفحه HTML هر جامعه با استفاده از پایتون [23] خزیده شد. با استفاده از regex پایتون، تگها را در صفحات HTML تجزیه کردیم تا تعداد موضوعات، تعداد پاسخها، تاریخهایی که موضوعات و پاسخها در آن پست شدهاند و URL هر موضوع از تابلوهای اعلانات استخراج شود. بر اساس URL موضوعات استخراج شده، مطالب و پاسخ به آنها استخراج شد. موضوعات استخراجشده، تاریخهایی که در آن پست شدهاند، محتویات موضوع، محتوای پاسخ و تاریخهای پاسخ در قالب json. ذخیره میشوند که به نوبه خود به قالبهای دیگر (مانند csv) مناسب برای اهداف مختلف تبدیل شده است. فایلهای json. انجمنهای خزیده شده را میتوان در اطلاعات پشتیبانی مشاهده کرد. یک محقق خزیدن را روی یک رایانه شخصی به مدت 48 انجام داد~72 ساعت ، جایی که زمان با اندازه جامعه متفاوت بود. تالارهای بیت کوین و اتریوم به ترتیب در تاریخ 1 و 8 فوریه 2016 خزیده شدند ، در حالی که مجمع ریپل در 21 ژانویه 2016 خزیده شد. جدول 1 ترتیب داده های نظر جمع آوری شده را تشریح می کند.
داده های خزنده شامل زباله ، به عنوان مثال ، تبلیغات و ارسال های بی معنی و پاسخ های بی معنی است. برای حذف چنین داده های زباله ، چند تکنیک فیلتر اسپم مورد بررسی قرار گرفت [15 ، 24-29]. هر ارسال بیش از دو جمله که بیش از پنج بار در روز یافت می شد ، هرزنامه در نظر گرفته می شد و به این ترتیب رفتار می شد.
برچسب زدن داده های نظرات کاربر
در این مرحله ، پاسخ های مثبت/منفی به داده های اظهار نظر کاربر خزنده برچسب گذاری شد. بسیاری از مطالعات گذشته به طبقه بندی داده های کاربر یا داده های اظهار نظر پرداخته اند [15 ، 30-35]. در این راستا ، از بررسی های کاربر برای ایجاد طبقه بندی بر اساس یادگیری ماشین استفاده شده است [36-40] ، و نظرات کاربر در وب از نظر آماری برای برچسب زدن احساسات مورد تجزیه و تحلیل قرار گرفته است [41-43].
تحقیقات گذشته بیشتر در طبقه بندی نظرات کاربر در زمینه های خاص متمرکز شده است. نظرات در مورد جوامع آنلاین شامل استفاده قابل توجهی از نئولوژیک ها ، عامیانه و شکلک هایی است که از کاربرد گرامری فراتر می رود. C. J. Hutto و اریک گیلبرت الگوریتمی به نام Vader [44] را برای تجزیه چنین عباراتی معرفی کردند و روشی را برای تجزیه و تحلیل متون رسانه های اجتماعی با ترسیم یک مدل مبتنی بر قانون ارائه دادند. جوامع آنلاین مورد علاقه در این مقاله متون رسانه های اجتماعی موازی بودند. بنابراین ، داده های اظهار نظر کاربر بر اساس این الگوریتم برچسب گذاری شدند.
مدل سازی پیش بینی
داده های اظهار نظر کاربر خزنده برای ایجاد یک مدل پیش بینی برچسب گذاری شدند. برای ایجاد مدل پیش بینی ، انتخاب داده ها دوباره انجام شد. همه نظرات از نظرات و پاسخ های بسیار منفی تا بسیار مثبت می توانست مورد استفاده قرار گیرد. با این حال ، ما قصد داشتیم نتایج کیفی را بهبود بخشیم و هزینه عملکرد را به حداقل برسانیم. برای انتخاب داده ها ، ما یک تجزیه و تحلیل ارتباط بین نتایج تجزیه و تحلیل نظر و نوسانات در قیمت های رمزنگاری انجام دادیم. در این مقاله ، آزمون علیت گرنجر ، که به طور گسترده در تحقیقات در مورد ارزش سهام و ارز استفاده می شود ، تصویب شد [45].
همانطور که در EQ 1 نشان داده شده است ، نتایج تجزیه و تحلیل نظر بر اساس مباحث و پاسخ ها (مقادیر برچسب گذاری شده مبتنی بر Vader) ، تعداد مباحث ارسال شده ، تعداد پاسخ های ارسال شده و تعداد دیدگاه های کل مباحث ارسال شده در یک خاصروز برای استاندارد سازی در برابر 10 روز گذشته به نمودارهای Z تبدیل شد. به همین ترتیب ، نوسانات قیمت و تعداد معاملات ارزهای رمزنگاری شده برای استاندارد سازی در برابر 10 روز گذشته به Z-Scores تبدیل شد. در یک تاریخ خاص t (t = 10 در مقاله) ، نمره z یک مورد خاص ، با مشخصات ، به این ترتیب تعریف شده است: (1) به ترتیب و به ترتیب میانگین و انحراف استاندارد هر مورد را برای هر تاریخ نشان می دهد. شکل 2 نمونه ای از نتایج آزمون را با مقایسه نوسانات در قیمت های رمزنگاری و نتایج تجزیه و تحلیل نظر Z نشان می دهد.
شکل 2. نمرات Z از نوسانات در قیمت های رمزنگاری با نتایج تجزیه و تحلیل نظر همپوشانی دارد.
برخی از نظرات روند مشابهی با نوسانات قیمت cryptocurrency را نشان می دهد.
نمودارهای Z استاندارد شده تحت آزمایش علیت گرنجر برای تعیین اهمیت ارتباط قرار گرفتند. آزمون علیت گرنجر به این فرض متکی است که اگر یک متغیر X باعث Y شود ، تغییر در X به طور سیستماتیک قبل از تغییر در Y رخ خواهد داد [46]. همانطور که در مطالعات قبلی نشان داده شده است ، مقادیر تاخیر از x همبستگی آماری معنی داری با Y نشان می دهد [15 ، 46]. با این حال ، همبستگی علیت را اثبات نمی کند. ما در حال آزمایش علیت واقعی نیستیم ، بلکه فقط این که آیا مجموعه زمانی جامعه از نظرات حاوی اطلاعات پیش بینی کننده در مورد نوسانات قیمت cryptocurrency است.
سری زمانی ما برای قیمت های ارزهای رمزپایه و تعداد معاملات ، مشخص شده توسط sحرف، تغییرات روزانه در قیمت های ارزهای رمزپایه و تعداد معاملات را منعکس می کند. برای آزمایش اینکه آیا نظرات جامعه در سری زمانی می تواند تغییرات در نوسانات قیمت cryptocurrency را پیش بینی کند ، ما واریانس توضیح داده شده توسط دو مدل خطی را مقایسه کردیم ، همانطور که در Eqs 2 و 3 نشان داده شده است.حرف(یعنی St −1، ⋯ ، st - n) برای پیش بینی ، در حالی که مدل دوم از مقادیر تاخیر N هر دو استفاده می کندحرفو قیمت فروش سری زمان مورد ، مشخص شده توسط xt −1، ⋯ ، xt - nوادما تست علیت Granger را با توجه به مدل های موجود در Eqs 2 و 3 انجام دادیم.
بر اساس نتایج آزمون علیت گرنجر ، می توانیم فرضیه تهی را رد کنیم ، به موجب آن سری زمانی نظرات جامعه نوسانات قیمت رمزنگاری را پیش بینی نمی کند - یعنی ، βb >≠ 0-با اعتماد به نفس بالایی از نظرات جامعه با بالاترین رابطه علیت گرنجر (مقدار P< 0.05) were extracted.
آزمون علیت گرنجر برای هر ارز به مدت 1 تا 13 روز بر روی هر ارز انجام شد. از نظر تجربی ، تاخیر زمانی 14 روز و طولانی تر ناچیز بود. بسته به تفاوت در هر اندازه گیری تاخیر در هر زمان ، عناصری که ارتباطات معنی داری را نشان می دهند مشخص شدند. برای پیش بینی ، نوسانات قیمت رمزنگاری به روشی باینری تعیین شد. ما مدل پیش بینی را بر اساس برآوردگرهای یک وابستگی متوسط (AODE) تولید و تأیید کردیم [47]. بر اساس AODE ، ما احتمال کلاس باینری Y را تخمین زده ایم ، با توجه به اینکه یک مجموعه از ویژگی های مربوط به آیتم x است1، ⋯ xحرف، P (y | x1,⋯ xحرف). این احتمال به شرح زیر تخمین زده شده است: (4) در جایی که برآورد P (⋅) را نشان می دهد ، F (⋅) فرکانس است ، و M حد فرکانس تعیین شده در 1 در این مقاله است. در بخش بعدی ، ما در مورد نتایج سیستم کاربردی بحث می کنیم.
نتایج تجربی
با استفاده از مدل خود ، ما در مورد سه ارز رمزنگاری (بیت کوین ، اتریوم و ریپل) پیش بینی کردیم. در مطابقت با روزهایی که داده ها از این جوامع جمع آوری شده است ، قیمت روزانه هر یک از رمزنگاری ها و تعداد معاملات خزیده شده است. اطلاعات مربوط به قیمت و تعداد معاملات بیت کوین از طریق Coindesk خزیده شد [19] ، در حالی که اطلاعات قیمت برای Ethereum از طریق CoinmarketCap [22] خزیده شد و اطلاعات معامله آن از طریق Etherscan خزیده شد [48]. اطلاعات مربوط به قیمت Ripple از طریق Ripplecharts [49] خزیده شد ، در حالی که اطلاعات معامله آن خزیده نشده بود. تمام داده های جمع آوری شده در حوزه عمومی بوده و اطلاعات شخصی را مستثنی کرده اند. در جدول 3 ترتیب داده های بازار جمع آوری شده است.
عناصری که ارتباطات قابل توجهی در مدل سازی برای پیش بینی ها نشان داده اند برای یادگیری استفاده شده است (جداول 4-8). مقادیر P در جدول فقط برای عناصر با قیمت 0. 05 یا کمتر نشان داده شده است.
جدول 4. اهمیت آماری (مقادیر P) همبستگی علیت گرنجر دو متغیره برای قیمت بیت کوین و نظر جامعه.
جدول 5. اهمیت آماری (مقادیر p) همبستگی علیت گرنجر دو متغیره برای تعداد معاملات و نظر جامعه برای بیت کوین.
جدول 6. اهمیت آماری (مقادیر p) همبستگی علیت گرنجر دو متغیره برای قیمت و نظر جامعه اتریوم.
جدول 7. اهمیت آماری (مقادیر p) همبستگی علیت گرنجر دو متغیره برای تعداد معاملات و نظر جامعه برای اتریوم.
جدول 8. اهمیت آماری (مقادیر p) همبستگی علیت گرنجر دو متغیره برای قیمت و نظر جامعه ریپل.
نمونه ای از داده های ورودی قابل اجرا در جدول 9 نشان داده شده است. نتایج نوسانات پیش بینی شده در قیمت و تعداد معاملات هر cryptocurrency در زیر بحث شده است.
نمره z () از داده ها برای 10 روز گذشته به عنوان مقادیر a استفاده شد~j ، که نشان دهنده ارزش جمع نظر هر جامعه در تاریخ معین است. اینجا ، x~z مقادیر داده های موضوع (تعداد مباحث ، جمع پاسخ ها ، مجموع دیدگاه ها) را در تاریخ معین نشان دهید.
از میزان دقت ، اندازه F و ضریب همبستگی Matthews (MCC) برای ارزیابی عملکرد مدلهای پیشنهادی استفاده شد. محاسبه این اقدامات ارزیابی نیاز به برآورد دقت و فراخوان ، که از مثبت مثبت (TP) ، مثبت کاذب (FP) ، منفی واقعی (TN) و منفی کاذب (FN) ارزیابی می شود. این پارامترها در معادلات 5 ، 6 ، 7 و 8 تعریف شده است: (5) (6) (7) (8)
میزان دقت ، میانگین وزنی اندازه گیری F (اندازه گیری F-حرف) و MCC در معادلات 9 ، 10 ، 11 ، 12 و 13 تعریف شده است.
از داده های مربوط به بیت کوین به مدت 793 روز ، 88 ٪ اول (برای 697 روز) و 12 ٪ باقیمانده (برای 94 روز) به ترتیب برای یادگیری و تأیید استفاده شد. نوسانات قیمت بیت کوین به طور قابل توجهی با تعداد مباحث ، نظرات مثبت/بسیار مثبت و پاسخ های مثبت همراه است. نتیجه پیش بینی بالاترین میزان زمانی بود که تاخیر زمان شش روز با دقت 79. 57 ٪ بود (جدول 10). علاوه بر این ، نوسانات تعداد معاملات به طور قابل توجهی با بخشی که تعدادی از موضوعات روزانه ، نظرات بسیار مثبت و پاسخ های بسیار مثبت مشاهده شده است ، به طور قابل توجهی همراه است. نتیجه پیش بینی شده از نوسان تعداد معاملات ثابت شده است که وقتی تاخیر زمانی سه روز با دقت 77. 895 ٪ (جدول 10) بود.
یک اعتبار متقابل 10 برابر برای کل روزها (برای 187 روز) در اتریوم انجام شد. بر خلاف بیت کوین ، اتریوم ارتباط معنی داری در آزمون علیت گرنجر با بخشی که تعدادی از نظرات منفی/بسیار منفی یافت شد ، نشان داد. ارتباط قابل توجهی با تعدادی از پاسخ های کاربر مثبت نیز یافت شد. نتیجه پیش بینی شده بالاترین میزان زمانی بود که تاخیر زمان شش روز با دقت 71. 823 ٪ (جدول 11). نوسان در تعداد معاملات ارتباطات ناچیز با اکثر بخش ها را نشان داد ، اما وقتی تاخیر زمانی 11 بود با پاسخ های بسیار منفی همراه بود~13 روزنوسانات پیش بینی شده در تعداد معاملات زمانی که یک روز تاخیر یک روز بود ، دقت 66. 129 ٪ را به همراه داشت (جدول 11).
سرانجام ، ریپل برای کل روزها (برای 137 روز) تحت اعتبار متقاطع 10 برابر قرار گرفت. نوسانات پیش بینی شده در قیمت ریپل ثابت شد که وقتی تاخیر زمانی هفت روز با دقت 71. 756 ٪ بود (جدول 12).
مانند اتریوم ، ریپل ثابت کرد که با نظرات بسیار منفی همراه است و با پاسخ های منفی وقتی تاخیر زمان هفت روز و طولانی تر بود. پیش بینی نوسان در تعداد معاملات Ripple به دلیل مشکلات در دستیابی به داده های مربوطه نمی تواند انجام شود.
برای تعیین اثربخشی مدل پیش بینی پیشنهادی ، ما یک سرمایه گذاری شبیه سازی شده در بیت کوین انجام دادیم ، با استفاده از تکنیک سرمایه گذاری شبیه سازی شده که معمولاً در مطالعات گذشته در مورد پیش بینی قیمت سهام استفاده می شود [50]. ما در بیت کوین سرمایه گذاری کردیم که مدل پیش بینی کرد که قیمت روز بعد افزایش می یابد و وقتی انتظار می رفت که قیمت روز بعد طبق مدل کاهش یابد ، سرمایه گذاری نکردیم. سرمایه گذاری شبیه سازی شده براساس این قاعده بود که به موجب آن ما از سرمایه گذاری (M) توسط R به دست می آوریم یا از دست می دهیم ، که نشان دهنده افزایش یا کاهش قیمت بیت کوین است (M = M + M × R یا M = M - M × R ،به ترتیب). تاخیر شش روزه ، که مطابق با بهترین نتیجه در این مطالعه بود ، در مدل پیش بینی استفاده شد. مدل پیش بینی بر اساس داده های مربوط به دوره از اول دسامبر 2013 تا 10 نوامبر 2015 ایجاد شده است. داده های 84 روزه یا 12 هفته ای برای دوره از 11 نوامبر 2015 تا 2 فوریه 2016 در این آزمایش استفاده شد.
شکل 3 نتایج برنامه سرمایه گذاری شبیه سازی شده را بر اساس شرایط فوق نشان می دهد. میانگین سرمایه گذاری تصادفی به میانگین 10 سرمایه گذاری شبیه سازی شده بر اساس پیش بینی قیمت بیت کوین تصادفی اشاره دارد. در طی 12 هفته ، قیمت بیت کوین 19. 29 ٪ افزایش یافته است در حالی که میزان سرمایه گذاری 35. 09 ٪ رشد داشته است. در سرمایه گذاری تصادفی ، میزان سرمایه گذاری تقریباً 10. 72 ٪ افزایش یافته است که از افزایش قیمت بیت کوین پایین تر بود.
بحث و نتیجه گیری
در این مقاله نظرات کاربر در جوامع آنلاین برای پیش بینی قیمت و تعداد معاملات ارزهای رمزنگاری شده تجزیه و تحلیل شده است. روش پیشنهادی نوسانات در قیمت ارزهای رمزپایه را با هزینه کم پیش بینی کرد. از نظر نرخ پیش بینی برای بیت کوین و سایر ارزهای رمزپایه بر اساس منابع محدود در جوامع آنلاین ، روش پیشنهادی موازی مطالعات قبلی است که برای اهداف مشابه طراحی شده است [15 ، 51]. علاوه بر این ، نظرات و پاسخ های کاربر در جوامع آنلاین ثابت شد که بر تعداد معاملات بین کاربران تأثیر می گذارد. روش پیشنهادی برای خرید و فروش ارزهای رمزپایه قابل استفاده است و جنبه های تأثیرگذار بر نظرات کاربر را روشن می کند. علاوه بر این ، سرمایه گذاری شبیه سازی شده نشان داد که روش پیشنهادی برای تجارت cryptocurrency کاربرد دارد.
بر اساس دادههای یادگیری در زمان نرخهای پیشبینی بالاتر، انواع نظراتی که بیشترین تأثیر را بر نوسانات قیمت و تعداد تراکنشهای هر ارز دیجیتال داشتند، شناسایی شدند. نظراتی که بر نوسانات قیمت ها تأثیر می گذارد در بین ارزهای دیجیتال متفاوت است. نظرات مثبت کاربران به طور قابل توجهی بر نوسانات قیمت بیت کوین تأثیر می گذارد، در حالی که نظرات دو ارز دیگر به طور قابل توجهی تحت تأثیر نظرات و پاسخ های منفی کاربران قرار گرفته است. علاوه بر این، ارتباط با تعداد موضوعات ارسال شده روزانه نشان داد که تنوع در فعالیت های جامعه می تواند بر نوسانات قیمت تأثیر بگذارد. علاوه بر این، برخلاف قیمت ارزهای دیجیتال، تعداد تراکنشها بهجای نظرات ارسالشده، به طور قابلتوجهی با پاسخهای کاربران مرتبط است. بر اساس نتایج پیشبینی، نظرات کاربران برای پیشبینی نوسانات در 6 مفید بود~7 روز (جدول 10).
نوسانات پیشبینیشده در قیمت هر ارز دیجیتال شکاف دقتی تقریباً ۸ درصدی را نشان میدهد. نتیجه پیشبینیشده دقیقترین نتیجه در بیتکوین بود، که به نظر میرسد به مقدار دادههای انباشتهشده و فعالیتهای متحرک جامعه (16. 91 نظر، 473. 81 پاسخ کاربر و 27443. 18 بازدید به طور متوسط روزانه) نسبت داده شود، که تأثیر مستقیمی بر نوسانات قیمت داشته است. ارز رمزنگاری شدهنتیجه پیشبینیشده در Ripple کمترین دقت را داشت، که بدون در نظر گرفتن اندازه بازار، کوچکترین جامعه را داشت (3. 41 نظر، 29. 14 پاسخ کاربر و 1661. 99 بازدید به طور متوسط روزانه). انجمن آنلاین ریپل در سپتامبر 2015 با داده های کمی انباشته شده و فعالیت های کاربر کمی آغاز شد. این یافته ها نشان می دهد که تفاوت در اندازه جامعه ممکن است تأثیر مستقیمی بر نوسانات قیمت ارزهای دیجیتال داشته باشد.
بهبود دقت پیشبینی نیازمند چند پیشرفت است. علیرغم تحلیل ارتباطی که برای فیلتر کردن نظرات و پاسخهای کاربران استفاده میشود، معیارهای انتخاب کیفی بیشتری برای ساخت یک مدل پیشبینی مورد نیاز است. این مقاله بر روی جوامع آنلاین برای تعیین انجمن ها و پیش بینی نوسانات متمرکز شده است. با این حال، مانند مطالعات گذشته، استفاده از داده ها در وب [52، 53]، تجزیه و تحلیل داده های شبکه های اجتماعی [46] و مراجعه به حجم جستجو در گوگل [10، 12] منجر به نتایج دقیق تر می شود. علاوه بر این، تا حدی اتخاذ تکنیک پیشبینی بازار سهام مورد استفاده در مطالعات قبلی [54] ممکن است به افزایش نرخ دقت کمک کند.
در این مقاله، ما اطلاعاتی را از کاربران در جوامع آنلاین بهعنوان منبعی مناسب برای تحقیق در مورد ارزهای دیجیتال به دست آوردیم. در همین راستا، به نظر می رسد احساسات بیان شده توسط نظرات و پاسخ های کاربران در جوامع آنلاین برای تجزیه و تحلیل و درک بیشتر ارزهای دیجیتال قابل استفاده است. علاوه بر این، تمایلات کاربران جامعه آنلاین ممکن است به درک ویژگیهای ارز دیجیتال مربوطه کمک کند. علاوه بر این، اطلاعات غنی در جوامع آنلاین می تواند به درک ارزهای دیجیتال از دیدگاه های مختلف کمک کند.
ارزهای رمزنگاری شده به طور فزاینده ای مورد استفاده قرار می گیرند و قابلیت استفاده از آنها از دیدگاه های مختلف توجه را به خود جلب کرده است [2-5]. تحقیقات در مورد ارزهای دیجیتال کافی نیست، زیرا به ندرت ارز دیگری به جز بیت کوین مورد بررسی قرار گرفته است. روش پیشنهادی برای پیشبینی نوسانات در قیمت و حجم معاملات ارزهای دیجیتال بر اساس نظرات و پاسخهای کاربران در جوامع آنلاین احتمالاً درک و در دسترس بودن ارزهای دیجیتال را در صورت اجرای طیف وسیعی از بهبودها و برنامهها افزایش میدهد. علاوه بر این، انتظار میرود رویکردهای متفاوت به نظرات و پاسخهای کاربران در جوامع آنلاین نتایج قابل توجهتری را در زمینههای مختلف به همراه داشته باشد.