کشف داده های پرت قبل از تحلیل داده ها باید صورت گیرد. پیچیدگی این کار زمانی آشکار می شود که داده ها به صورت چند بعدی و یا آمیخته توزیع شده باشند. از آنجا که داده های پرت با عموم داده ها تفاوت داشته و در اقلیت هستند، انتظار می رود در نواحی اتفاق بیفتند که دارای چگالی کمتری هستند. بر اساس این ایده اولیه ابتدا به روش برآورد تابع چگالی کرنل، توزیع داده ها برآورد می شود سپس به کمک توابع زیان، چگالی به دست آمده توزین می شود به نحوی که اگر داده ها دارای چگالی کم و یا در واقع کم وزن باشند وزن آنها مجدداً کاهش یافته و درصورتی که وزن آنها زیاد باشد مجدداً وزن آنها افزایش می یابد. به این ترتیب وزنهای حاصل می تواند به عنوان معیاری برای کشف داده های پرت به کار رود. از مزایای این روش این است که بر اساس تنضیمات پارامتری های تابع زیان خروجی این فرآیند می تواند به صورت برچسب داده پرت و یا داده معمولی باشد یا اینکه به وسیله وزن حاصل برای هر داده شدت پرت بودن آن را مشخص نمود.