امروزه داده کاوی به عنوان یک ابزار و روش علمی جدید برای بررسی و تحلیل دادهها در پایگاههای بزرگ داده مطرح شده است. با استفاده از تکنیکهای این روش میتوان حجم وسیعی از دادههای خام را به اطلاعات مفید و قابل استفاده تبدیل کرد. داده کاوی تکنیکها و الگوریتمهای متنوع و متفاوتی برای تحلیل داده دارد. از این بین میتوان به معروفترین آنها از جمله شبکههای عصبی، درخت تصمیم، رگرسیون لجستیک، قوانین انجمنی و آنالیز خوشهای اشاره کرد. یکی از پرکاربردترین این روشها، رگرسیون لجستیک است. در شرایطی که متغیر پاسخ مورد نظر یک متغیر دو حالتی باشد، از این روش برای طبقه بندی یا پیش بینی متغیر پاسخ استفاده میشود. مزیت این روش نسبت به سایر روشها، قدرتمند و دقیق بودن آن و عدم نیاز به پیش شرطهای معمول است. در این پایاننامه مدل رگرسیون لجستیک و نحوه استفاده از آن بررسی میشود. سپس رگرسیون لجستیک برای پیش بینی دو متغیر مهم اقتصادی با استفاده از دادههای واقعی به کار گرفته میشود و در مورد ساخت یک مدل مناسب یا انتخاب بهترین مدل در بین مدلهای موجود بحث میشود.