چالشی که همواره در کار با داده ها وجود دارد، آلوده بودن آن ها با مشاهدات پرت است. کشف داد های پرت مخصوصاً در ابعاد بالا می تواند بسیار مورد توجه و حیاتی باشد. وابستگی داده ها به همدیگر ممکن است کار را پیچیده تر کند. مشاهدات ممکن است به دلایل مختلفی به هم وابستگی داشته باشند، مثل داده های سری زمانی یا داده های فضایی. داده های پرت اعتبار برازش مدل رگرسیونی را نیز به سادگی دچار تردید می کند. می توان به کمک روش های موجود مثل حداقل حجم بیضی گون (MVE) یا روش ماکسیمم درستنمایی داده های مشکوک را پیدا کرد. سپس با یک روش احتمالی بیزی و در نظر گرفتن وابستگی بین داده ها، شدت پرت بودن داده ها را تعیین کرد.