Test ve Öğrenme olarak Veri kümesinin Bölünmesi (Python ile Makine Öğrenmesi – 5)

Bu dersimizde veri setimizin test ve öğrenme olarak nasıl bölüneceğini öğreneceğiz. Bu bölme (split) işlemi, verinin ne kadarına test ne kadarına öğrenme yapacağımızı göstermektedir. Genelde 1/3ü test, 2/3 öğrenme oranına bölünür.

Daha önceki derslerimizde oluşturduğumuz dataframe tablomuzu hatırlayın. Bu tablodaki cinsiyet sutunu tahmin etmek istiyorsak, veri kümemizi cinsiyet ve diğer sutunlar şeklinde bölmemeiz gerekiyor. Bunun için sklearn kütüphanesinden yararlanıyoruz. train_test_split komutu ile x_train, x_test olarak belirlediğimiz değişkenlere s olarak oluşturduğumuz cinsiyet hariç veri kümelerini, y_train ve y_test olarak berlilediğimiz değişkenlere ise sonuc3 te yazan sadece cinsiyet verilerini bölerek yüklüyoruz.

Sonuçları yazdırmak istediğimiz zaman bölünmüş olarak görüyoruz.

Sonuç

İyi çalışmalar,

Bir cevap yazın

E-posta hesabınız yayımlanmayacak.

This site uses Akismet to reduce spam. Learn how your comment data is processed.