دانلود پایان نامه

استفاده کردند.
لیاو و همکاران139 (2011) با تأکید بر مزایای سرمایه گذاری در پرتفوهای بین المللی، بیان می کنند که با تمایل جاری نسبت به کار در بازارهای جهانی، اهمیت درک و پیش بینی نرخ مبادله ارز زیادتر می شود. آنها با بررسی رابطه میان نرخ مبادله ارز و شاخص های بازار بین المللی تایوان به وسیله قواعد تلازمی، به تولید قوانینی برای تولید پرتفوهای بهینه سرمایه گذاری در بازار تایوان با در نظر گرفتن نرخ مبادله ارز پرداخته و با استفاده از داده کاوی قوانینی را برای استفاده در روش تشکیل پرتفو مارکویتز تشریح کرده اند.
چنج و کانگ140 (2014) در تحقیق جالبی سهام را از نظر سرماایه گذاران به دو دسته سهام ارزشمند 141و سهام در حال رشد142، تقسیم کرده و با تعریف دو معیار ارزش دفتری به ارزش بازار143 و بازده سهام144 به ترتیب برای سهام ارزشمند و سهام در حال رشد، سهام موجود در بازار تایوان را در چهار دسته قرار دادند که عبارتند از : ارزشمند145، با ارزش پایین146، با رشد سریع147 و با رشد پایین148. سپس با استفاده از تکنیک داده کاوی سری های زمانی به بررسی چگونگی رفتار سرمایه گذاران با این سهام ها کرده و الگوهایی یافتند. از جمله این الگوها نیز عبارتند از : سهام ارزشمند و با ارزش پایین با عکس العمل بیش از حد سرمایه گذاران149، سهام با رشد بالا و با رشد پایین دارای عکس العمل معمولی همراه بوده و سهام ارزشمند به صورت فصلی دارای افت شدیدی هستند.
با استفاده از یک دسته بندی کننده شرکتی150، چین و چن151 (2010) به دسته بندی و پیش بینی قیمت از طریق حجم زیادی از داده های ورودی مثل داده های تحلیل تکنیکال و شاخص های بازار پرداخته اند. مشکلی که الگوریتم دسته بند شرکتی دارد این است که نمی تواند با داده های زیاد کار کند و لذا آنها با طراحی دسته بند مبتنی بر ژنتیک به پیش بینی سیگنال های خرید و فروش پرداختند. نتایج به دست آمده حاکی از توان بالای الگوریتم پیشنهادی و توانایی رقابت آن با بسیاری از متدهای دیگر دسته بندی مثل دسته بندهای آماری داشت.

2-6-4- کاربرد شبکه عصبی و داده کاوی در پیش بینی قیمت سهام
زکیک152 (1998) نشان داد که دقت شبکه های عصبی بیشتر در بازه 70-80 درصد تغییر می کند. این میزان به نسبت روشهای آماری 5-20 درصد به صورت میانگین، بهتر است. نویسنده در این مقاله به این نتیجه می رسد که در صورت به کارگیری سیستم های خبره در شبکه های عصبی، دقت شبکه های عصبی به صورت میانگین، از میزان ذکر شده نیز بالاتر می رود.
وانستون، فینی و تن153 (2004) توضیح می دهند که شبکه های عصبی مصنوعی می توانند در تشخیص سهامی که به صورت بالقوه توانایی معناداری از لحاظ شاخص های فاندامنتالی برای رشد دارند؛ به کار روند. همچنین آنها نشان دادند که معماری شبکه های عصبی از الگوریتم های مشابه کلاسیک و هوش مصنوعی که از نورون ها استفاده نمی کنند، بهتر عمل می کنند. در این پژوهش، قواعدی جهت انجام معامله با حد آستانه 50 و بالاتر، توسط شبکه های عصبی پیدا شدند که توانایی رسیدن به 100 درصد اهداف را داشتند. از نتایج دیگر پژوهش، می توان به این اشاره کرد که محققان به این نتیجه رسیدند که با ادامه استفاده از شبکه های عصبی در طول زمان، قدرت پیش بینی این شبکه افزایش می یابد.
آدیا و کلوپی154 (1998) با مطالعه و بررسی نوزده مقاله به این نتیجه رسیدند که شبکه های عصبی در پیش بینی سهام قدرت بالایی داشته و نسبت به تمام جایگزین های خود عملکرد بهتری را داشته اند.
دشپنده، امراواتی و تاکاره155 (2010) کاربرد داده کاوی در حوزه های زیادی در مورد تصمیم گیری بررسی کرده و قدرت بالای داده کاوی در بهبود نتایج را تصدیق کرده اند. حوزه های بررسی شده عبارتند از : علوم پزشکی در خصوص تشخیص بیماری، حوزه های ورزشی در خصوص انتخاب بازیکن ها، استراتژی بازی ها، پیش بینی ورشکستگی مالی بانک ها، بهبود پیش بینی تقاضای محصولات، بهینه سازی طبقه بندی، انتخاب کالای مناسب، مقایسه طبقه بندی خرده فروشان و تولید کنندگان، پیش بینی برنامه های تولیدی کارخانجات، تصمیم گیری در مورد قواعد بله / خیر کارهای پیوسته، ایجاد نقشه های تجانسی برای سهام داران و سرمایه گذاران.
نی156 (2008) بسیاری از متدهای شبکه های عصبی در داده کاوی را تشریح کرده است. نویسنده در این تحقیق به بررسی فرآیند داده کاوی بر پایه شبکه های عصبی پرداخته است. وی با تمرکز بر روی کاربردهای مختلف داده کاوی بر مبنای شبکه های عصبی، به توضیح دیدگاه ها و تکنیک هایی برای به کارگیری داده کاوی بر مبنای شبکه های عصبی می پردازد.
وایس لا و باهات157 (2010) ثابت کردند که شبکه های عصبی نسبت به روشهای آماری در پیش بینی قیمت سهام عملکرد بهتری دارند. آنها آزمایشی بر مبنای طراحی متدی جهت پیش بینی قیمت روزانه سهام طراحی کرده و نتایج به دست آمده از شبکه های عصبی و متدهای آماری را مقایسه کردند. آنها ثابت کردند که در صورتی که شبکه عصبی به درستی آموزش ببیند، به درستی طراحی شود، ورودی ها و خروجی های مناسب را داشته باشند می توانند به خوبی قیمت را پیش بینی کنند. علاوه بر این برتری تکنیک معرفی شده توسط نویسندگان، با پیچیده شدن مدل نسبت به روش های آماری بیشتر هم شد و بنابراین شبکه های عصبی می توانند به عنوان یک جایگزین مناسب برای پیش بینی قیمت سهام به صورت روزانه به کار روند.
آرکی و دی دی158 (2010) تلاش کردند تا با تجمیع قابلیت های شبکه های عصبی، به پیش بینی بازار سهام بپردازند. محققان، با اعتراف به اینکه پیش بینی شاخص
قیمت های جهانی کاری مشکل است، در این مقاله با تکیه بر قابلیت های شبکه های عصبی به پیش بینی شاخص قیمت سهام می پردازند. آنها با بررسی مدلهای کلاسیک و نوین سری های زمانی به این نتیجه رسیدند که پیش بینی با این مدل ها دارای چالش های فراوانی بوده و شبکه های عصبی برای این کار مناسب تر است. شبکه های عصبی این قابلیت را دارند که داده های مفید را از میان حجم بالای داده ها استخراج کنند. پژوهشگران در این تحقیق، با بررسی ادبیات انجام شده در زمینه کاربرد شبکه های عصبی در پیش بینی قیمت سهام، به این نتیجه رسیدند که شبکه های عصبی برای پیش بینی قیمت سهام بسیار مفید هستند.
رازی و اتاپیلی159 (2005) اثبات کردند که شبکه های عصبی و دسته بندی و رگرسیون به وسیله درخت تصمیم(cart)، پیش بینی های بهتری از رگرسیون غیر خطی انجام می دهند. آنها همچنین به این نتیجه رسیدند که شبکه های عصبی و الگوریتم های دسته بندی و رگرسیون درخت تصمیم، در زمینه کار با متغیرهای باینری و اسمی و همچنین متغیرهای پیوسته قابلیت های بهتری نسبت به رگرسیون دارند. در هر حال، نتایج این تحقیق حاکی از برتری هیچ یک از شبکه های عصبی و مدل های رگرسیون و دسته بندی درخت تصمیم نمی باشد.
لو160 (2010) از طریق نتایج عملی اثبات کرد که آنالیز اجزاء مستقل یکپارچه (ica) بر مبنای نقشه فیلترینگ اغتشاش های موجود در میان داده ها به همراه شبکه های عصبی جهت پیش بینی قیمت، عملکرد بهتری نسبت به فیلترینگ بر اساس امواج الیوت به همراه شبکه های عصبی، شبکه های عصبی به تنهایی و مدل قدم زدن تصادفی دارد. بر مبنای نتایج به دست آمده، نویسنده نتیجه می گیرد که متد پیشنهادی می تواند برای شناسایی و از بین بردن اغتشاشات موجود در قیمت سهام و بهبود کارایی شبکه های عصبی کارایی مناسبی داشته باشد.
رای و رای161 (2011) از طریق مقایسه، کشف کردند که مسئله پیش بینی شاخص سهام یکی از بزرگترین و مهمترنی چالش ها به عنوان هدفی برای بسیاری از متدها در حوزه مالی و اقتصاد است. در مقاله آنها، انواع مختلف شبکه های عصبی برای پیش بینی قیمت سهام با هم مقایسه شده اند. از جمله این متدها می توان به شبکه های عصبی مبتنی بر arima، شبکه های عصبی مبتنی بر الگوریتم ژنتیک و شبکه های عصبی چند شاخه ای اشاره کرد. نویسندگان همچنین به مقایسه عملکرد این معماری ها با یکدیگر پرداخته اند.

مطلب مشابه :  نیارم

فصل سوم
روش تحقیق

3-1- مقدمه
آنگونه که در فصل دوم این پژوهش بررسی شد، شبکه های عصبی توانایی بسیار خوبی برای تخمین و برازش مدل های پیچیده غیر خطی دارند. مشکلی که در این میان وجود دارد این است که این شبکه ها اغلب دچار بیش برازش1 می شوند. به این معنا که مدل را پیچیده تر از آنچه که هست تخمین می زنند. این اتفاق به این دلیل می افتد که بسیاری از نوسانات موجود در قیمت سهام به دلایل خاصی اتفاق می افتند که یا قابل پیش بینی نیست و یا این دلایل بسیار زود گذر بوده و تکرار پذیر نیستند. به صورت مشخص، هیچ مدل پیش بینی نمی تواند کاملا درست به مدل اصلی برازش شود و لذا در تمام مدل ها و متدهای پیش بینی مقدار باقی مانده و اختلاف حاصل بین مقدار پیش بینی و مقدار واقعی را تا حدی طبیعی دانسته و آن را به عنوان جزء تصادفی قلمداد می کنند که به هیچ صورتی قابل پیش بینی نیست؛ دلایل این امر همانگونه که گفته شد، پیش بینی پذیر نبودن عوامل رقم زننده مقدار تصادفی و تکرار ناپذیر بودن آنها است. بنابراین می توان گفت که مدل اصلی داده های واقعی به حدی که به نظر می رسد پیچیده نیست، و نوسانات حول آن جنبه تصادفی داشته و قسمتی از مدل واقعی به حساب نمی آیند. در واقع مدل اصلی ساده تر از آنچه که به نظر می آید است. شبکه های عصبی اما با توجه به قدرت بسیار زیاد در برازش، تلاش می کنند تا این جزء تصادفی را به صفر برسانند و برای این کار مدل را پیچیده تر از حد واقعی آن تخمین می زنند. این مسئله در مورد داده های آموزشی شبکه عصبی مشکلی ایجاد نمی کند. اما در هنگام کار با داده های آزمون، خطای مدل را بالا برده و دقت شبکه پایین تخمین زده می شود.
برای جلوگیری از این مشکل، از ابزارهای متعدد معرفی شده توسط علم داده کاوی که به اختصار در فصل دوم توضیح داده شد بهره گرفته می شود. این ابزارها، آن دسته از داده ها را که دارای جزء تصادفی زیادی می باشند، شناسایی کرده و از میان داده ها حذف می کنند تا شبکه تحت تأثیر آنها قرار نگیرد؛ چرا که شبکه عصبی سعی می کند تا حد زیادی آن داده ها را نیز درست تخمین بزند و لذا دچار بیش برازش می شود. علاوه بر این، این ابزارها با کاهش شاخص های تعریف شده، تعداد ورودی های شبکه را کاهش داده و عواملی که کمک زیادی به پیش بینی نمی کنند را حذف می کند. دلیل این امر نیز همانگونه که ذکر شده، دائمی نبودن تأثیر این متغیرها و لذا افزایش احتمال بیش برازش شبکه عصبی است. همچنین با بهره گیری از ابزار داده کاوی سری های زمانی، به شناسایی و به کارگیری سری های زمانی مشابه پرداخته و از آنها به عنوان ورودی شبکه عصبی استفاده می شود.
همانگونه که در فصل دوم توضیح داده شد، تحلیل های تکنیکی و بنیادین با استفاده از ابزارهای متنوعی به پیش بینی می پردازند. به گونه ای که تحلیل تکنیکی برای پیش بینی های کوتاه مدت و تحلیل بنیادین برای پیش بینی های بلند مدت استفاده می شوند. از آنجا که بنا داریم در این تحقیق به پیش بینی قیمت سهام در یک دوره زمانی جلوتر2 بپردازیم، از اندیکا
تورهای تحلیل تکنیکی استفاده کرده و آنها را به عنوان ورودی شبکه عصبی انتخاب می کنیم. بنابراین در این تحقیق از دو نوع ورودی، شامل اطلاعات سری های زمانی مشابه و اندیکاتورهای تحلیل تکنیکی استفاده می کنیم.
در ادامه این فصل، در ابتدا به چگونگی استفاده از داده کاوی برای پیش پردازش داده ها و انتخاب داده ها پرداخته و سپس به طراحی شبکه عصبی می پردازیم و در نهایت با معرفی الگوریتم های رقیب و معیارهای سنجش خوبی عملکرد مدل برازش شده توسط شبکه عصبی خواهیم پرداخت. خلاصه مراحل انجام تحقیق به صورت گرافیکی در شکل 3-1 نشان داده شده است.

مطلب مشابه :  منابع مقاله با موضوعBilly، not، narrator، one

شکل 3-1 : شمای کلی مراحل انجام تحقیق
3-2- جمع آوری داده ها
داده های مورد نیاز این پژوهش عبارتند از قیمت های بالا3، پایین4، بسته شدن5 و حجم معاملات6؛ با استفاده از این داده ها اندیکاتورهای تحلیل تکنیکال حساب شده و برای پیش بینی مورد استفاده قرار می گیرند. همچنین برای اعتبارسنجی هرچه بهتر مدل، آن را در میان سه صنعت از صنایع حاضر در بورس اوراق بهادار تهران آزمایش می کنیم. برای هر یک از صنایع، یکی از شرکت های حاضر را انتخاب و پژوهش پیش رو را برای آن انجام می دهیم. صنایع و شرکت های منتخب در جدول 3-1 شرح داده شده اند.
جدول 3-1 : صنایع و شرکت های انتخاب شده جهت انجام پژوهش
صنعت
شرکت
نماد
بانک ها و مؤسسات اعتباری
بانک پارسیان
وپارس
محصولات شیمیایی
صنایع شیمیایی فارس
شفارس
فلزات اساسی
فولاد مبارکه اصفهان
فولاد

بنابراین، در هر صنعت، پژوهش، بر روی شرکت معرفی شده انجام می گردد و برای شناسایی سری های زمانی مشابه نیز از شرکت های موجود در همان صنعت استفاده خواهد شد.

3-3- پیش پردازش داده ها
همانگونه که شرح داده شد، برای هر یک از سه شرکت مذکور اندیکاتورهای تکنیکی به دست خواهد آمد و علاوه بر این سری های زمانی مشابه نیز شناسایی خواهند شد. بر طبق متدهای داده کاوی در ابتدا باید پیش پردازشی روی داده ها انجام گیرد و کاهش سطری صورت پذیرد، اطلاعات لازم ساخته شده و متغیرها و پارامترها شناسایی شوند و پس از آن برای جلوگیری از بیش برازش شبکه عصبی باید بر اساس متدهای داده کاوی کاهش ستونی نیز صورت گیرد.

3-3-1- کاهش سطری داده ها
داده های به دست آمده در مورد هر شرکت و سری های زمانی مشابه آن باید در ابتدا مورد بررسی قرار گیرند تا داده های مغشوش7 و داده های پرت8 شناسایی و از میان پایگاه داده حذف گردند. داده های مغشوش شامل داده هایی هستند که اعداد آنها غیرمنطقی بوده و قابل استفاده نیستند و داده های پرت نیز همانگونه که گفته شد، دارای تأثیر به سزایی در کاهش دقت شبکه بوده و آن را دچار بیش برازش می کند. در این راستا همانگونه که در ادامه خواهیم دید، در ابتدا به حذف داده های مغشوش و سپس داده های پرت خواهیم پرداخت.

3-3-1-1- حذف رکوردهای مغشوش
همانگونه که گفته شد، داده های مورد نیاز این پژوهش عبارت از قیمت های بالا، پایین، بسته شدن و حجم معاملات. تعریف داده های مغشوش در یکی از سه حالت زیر رخ خواهند داد :
قیمت بالا کمتر از قیمت پایین باشد
قیمت بالا کمتر از قیمت بسته شدن باشد
قیمت بسته شدن کمتر از قیمت پایین باشد
مشخص است که بر طبق قواعد بالا، داده های با این وضعیت کاملا غیر منطقی بوده و به دلایل خطاهای ثبتی ایجاد شده اند و لذا از میان پایگاه داده حذف

دیدگاهتان را بنویسید