یکی از گروه های مهم از لحاظ اقتصادی ترکیبات نیترو آروماتیکی هستند که در ردیف مهمترین مواد اولیه و محصولات شیمی صنعتی قرار می گیرند. از این ترکیبات برای تهیه ی داروها، کودهای شیمیایی، رنگ های نساجی، مواد منفجره و ... استفاده می شود. سری داده ها شامل مجموعه ای از انواع مختلف ترکیبات نیترو آروماتیکی است که برای توسعه ی مدل های روابط کمی ساختار-خاصیت برای پیش بینی مقادیر ثابت سرعت های احیایی شامل ثابت سرعت های کاتالیزوری (kcat) و دو مولکولی (kcat/Km) به وسیله ی آنزیم کینون اکسیدوردوکتاز NQO1 استفاده می شود. مدل سازی ها با استفاده از رگرسیون خطی چند متغیره (MLR) و رگرسیون اجزای اصلی (PCR) انجام می شود. در رگرسیون خطی چند متغیره، ابتدا توصیف گرهای ساختاری بر اساس نرم افزار دراگون دسته بندی می شوند، سپس انتخاب مرحله ای روی هر گروه ا نجام می شوند (MLR1)، یکبار هم انتخاب مرحله ای روی تمام توصیف گرهای محاسبه شده اعمال می شود (MLR2). به شیوه ای مشابه، توصیف گرهای ساختاری برای مدل سازی های PCR به کار گرفته می شوند، ابتدا مبتنی بر انتخاب اجزای اصلی از هر کدام از دسته های مختلف توصیف گرها (PCR1) و در مرحله بعدی انتخاب اجزای اصلی بر اساس مجموعه کل توصیف گرها (PCR2). در هر دو مرحله تعداد اجزای اصلی به صورتی می باشند که بیشتر از 95% واریانس کل داده ها را در بر داشته باشند. مدل های ایجاد شده با استفاده از ارزیابی تقاطعی( یکی را در بیرون گذاشتن) و ارزیابی خارجی (کالیبراسیون-پیش-بینی) مورد ارزیابی قرار می گیرند. هر دو روش MLR نتایج دقیقی نشان می دهند هرچند مدل های QSPR ایجاد شده توسط MLR1 از جنبه ی آماری با اهمیت تراز MLR2 می باشند. روش PCR1 نسبت به تمام روش ها مدل های QSPR با دقت بیشتری به دست می دهد در حالیکه نتایج حاصل از روش PCR2بسیار ضعیف تر می باشد. به طور کلی ضرایب همبستگی ارزیابی تقاطعی و پیش بینی حاصل از روش های MLR1و MLR2 و PCR1 نزدیک به %90 می باشد که بیان گر توانایی بالای این روش ها در پیش بینی وارزیابی ثابت های سرعت مورد مطالعه می باشد.