Bu dersimizde veri setimizin test ve öğrenme olarak nasıl bölüneceğini öğreneceğiz. Bu bölme (split) işlemi, verinin ne kadarına test ne kadarına öğrenme yapacağımızı göstermektedir. Genelde 1/3ü test, 2/3 öğrenme oranına bölünür.

Daha önceki derslerimizde oluşturduğumuz dataframe tablomuzu hatırlayın. Bu tablodaki cinsiyet sutunu tahmin etmek istiyorsak, veri kümemizi cinsiyet ve diğer sutunlar şeklinde bölmemeiz gerekiyor. Bunun için sklearn kütüphanesinden yararlanıyoruz. train_test_split komutu ile x_train, x_test olarak belirlediğimiz değişkenlere s olarak oluşturduğumuz cinsiyet hariç veri kümelerini, y_train ve y_test olarak berlilediğimiz değişkenlere ise sonuc3 te yazan sadece cinsiyet verilerini bölerek yüklüyoruz.

from sklearn.model_selection import train_test_split
# verisetinin test ve eğitim için yüzde kaçının kullanılacağının kararını veriyor. 1/3
# s makinenin öğrenme için kullanacağı veri seti, testin alınacağı bağımsız değişken sonuc3
x_train, x_test, y_train, y_test = train_test_split(s, sonuc3, test_size = 0.33, random_state = 0)

Sonuçları yazdırmak istediğimiz zaman bölünmüş olarak görüyoruz.

print(x_train)
print(x_test)

print(y_train)
print(y_test)

Sonuç

     fr   tr   us    boy   kilo    yas
8   0.0  1.0  0.0  177.0   60.0  22.00
6   0.0  1.0  0.0  190.0   80.0  25.00
16  1.0  0.0  0.0  193.0   90.0  28.45
4   0.0  1.0  0.0  129.0   38.0  12.00
2   0.0  1.0  0.0  135.0   34.0  10.00
5   0.0  1.0  0.0  180.0   90.0  30.00
17  1.0  0.0  0.0  187.0   80.0  27.00
9   0.0  0.0  1.0  185.0  105.0  33.00
7   0.0  1.0  0.0  175.0   90.0  35.00
18  1.0  0.0  0.0  183.0   88.0  28.00
3   0.0  1.0  0.0  133.0   30.0   9.00
0   0.0  1.0  0.0  130.0   30.0  10.00
15  1.0  0.0  0.0  174.0   70.0  47.00
12  0.0  0.0  1.0  160.0   58.0  28.45

     fr   tr   us    boy  kilo   yas
20  1.0  0.0  0.0  164.0  66.0  32.0
10  0.0  0.0  1.0  165.0  55.0  27.0
14  0.0  0.0  1.0  167.0  62.0  55.0
13  0.0  0.0  1.0  162.0  59.0  41.0
1   0.0  1.0  0.0  125.0  36.0  11.0
21  1.0  0.0  0.0  166.0  56.0  42.0
11  0.0  0.0  1.0  155.0  50.0  44.0
19  1.0  0.0  0.0  159.0  40.0  29.0

   cinsiyet
8         k
6         e
16        e
4         e
2         k
5         e
17        e
9         e
7         e
18        e
3         k
0         e
15        e
12        k

   cinsiyet
20        k
10        k
14        k
13        k
1         e
21        k
11        k
19        k

İyi çalışmalar,


0 yorum

Bir yanıt yazın

Avatar placeholder

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Bu site, istenmeyenleri azaltmak için Akismet kullanıyor. Yorum verilerinizin nasıl işlendiği hakkında daha fazla bilgi edinin.