Eksik Verileri Doldurma (Python ile Makine Öğrenmesi – 2)

Bu yazımızda veri setimizdeki eksik verileri nasıl bir strateji ile doldurmayı öğreneceğiz. Bunun için sklearn kütüphanesini kullanacağız.

eksikveriler.csv dosyasını okuttuğumuz zaman boş olan yerler NaN olarak pythonda gözükmektedir.

Bu verileri manuel olarak doldurabiliriz ama veri boyutu çok yüksek olduğunda bir strateji belirleyip otomatik yapmak en kolayıdır. Bunun için sklearn kütüphanesini kullanacağız.

Yükelemek için terminale yazın: pip install sklearn

Kod kısmı aşağıdaki gibidir.

İlk önce sadece sayısal verileri çekiyor. Sonra sklearn ile stratejimizi belirliyoruz. Bu strateji Nan değerleri yerine, sutundaki değerlerin ortalaması alınıp yazılması olarak ayarlıyoruz. Stratejimizi fit komutu ile uygulayıp transform komutu ile yüklemeyi yapıyoruz.

Sonuç:

Kaynak: https://scikit-learn.org/stable/modules/generated/sklearn.impute.SimpleImputer.html

Bir cevap yazın

E-posta hesabınız yayımlanmayacak.

This site uses Akismet to reduce spam. Learn how your comment data is processed.