Bu dersimizde veri setimizin test ve öğrenme olarak nasıl bölüneceğini öğreneceğiz. Bu bölme (split) işlemi, verinin ne kadarına test ne kadarına öğrenme yapacağımızı göstermektedir. Genelde 1/3ü test, 2/3 öğrenme oranına bölünür.
Daha önceki derslerimizde oluşturduğumuz dataframe tablomuzu hatırlayın. Bu tablodaki cinsiyet sutunu tahmin etmek istiyorsak, veri kümemizi cinsiyet ve diğer sutunlar şeklinde bölmemeiz gerekiyor. Bunun için sklearn kütüphanesinden yararlanıyoruz. train_test_split komutu ile x_train, x_test olarak belirlediğimiz değişkenlere s olarak oluşturduğumuz cinsiyet hariç veri kümelerini, y_train ve y_test olarak berlilediğimiz değişkenlere ise sonuc3 te yazan sadece cinsiyet verilerini bölerek yüklüyoruz.
from sklearn.model_selection import train_test_split # verisetinin test ve eğitim için yüzde kaçının kullanılacağının kararını veriyor. 1/3 # s makinenin öğrenme için kullanacağı veri seti, testin alınacağı bağımsız değişken sonuc3 x_train, x_test, y_train, y_test = train_test_split(s, sonuc3, test_size = 0.33, random_state = 0)
Sonuçları yazdırmak istediğimiz zaman bölünmüş olarak görüyoruz.
print(x_train) print(x_test) print(y_train) print(y_test)
Sonuç
fr tr us boy kilo yas 8 0.0 1.0 0.0 177.0 60.0 22.00 6 0.0 1.0 0.0 190.0 80.0 25.00 16 1.0 0.0 0.0 193.0 90.0 28.45 4 0.0 1.0 0.0 129.0 38.0 12.00 2 0.0 1.0 0.0 135.0 34.0 10.00 5 0.0 1.0 0.0 180.0 90.0 30.00 17 1.0 0.0 0.0 187.0 80.0 27.00 9 0.0 0.0 1.0 185.0 105.0 33.00 7 0.0 1.0 0.0 175.0 90.0 35.00 18 1.0 0.0 0.0 183.0 88.0 28.00 3 0.0 1.0 0.0 133.0 30.0 9.00 0 0.0 1.0 0.0 130.0 30.0 10.00 15 1.0 0.0 0.0 174.0 70.0 47.00 12 0.0 0.0 1.0 160.0 58.0 28.45 fr tr us boy kilo yas 20 1.0 0.0 0.0 164.0 66.0 32.0 10 0.0 0.0 1.0 165.0 55.0 27.0 14 0.0 0.0 1.0 167.0 62.0 55.0 13 0.0 0.0 1.0 162.0 59.0 41.0 1 0.0 1.0 0.0 125.0 36.0 11.0 21 1.0 0.0 0.0 166.0 56.0 42.0 11 0.0 0.0 1.0 155.0 50.0 44.0 19 1.0 0.0 0.0 159.0 40.0 29.0 cinsiyet 8 k 6 e 16 e 4 e 2 k 5 e 17 e 9 e 7 e 18 e 3 k 0 e 15 e 12 k cinsiyet 20 k 10 k 14 k 13 k 1 e 21 k 11 k 19 k
İyi çalışmalar,
0 yorum