Test ve Öğrenme olarak Veri kümesinin Bölünmesi (Python ile Makine Öğrenmesi – 5)

Bu dersimizde veri setimizin test ve öğrenme olarak nasıl bölüneceğini öğreneceğiz. Bu bölme (split) işlemi, verinin ne kadarına test ne kadarına öğrenme yapacağımızı göstermektedir. Genelde 1/3ü test, 2/3 öğrenme oranına bölünür.

Daha önceki derslerimizde oluşturduğumuz dataframe tablomuzu hatırlayın. Bu tablodaki cinsiyet sutunu tahmin etmek istiyorsak, veri kümemizi cinsiyet ve diğer sutunlar şeklinde bölmemeiz gerekiyor. Bunun için sklearn kütüphanesinden yararlanıyoruz. train_test_split komutu ile x_train, x_test olarak belirlediğimiz değişkenlere s olarak oluşturduğumuz cinsiyet hariç veri kümelerini, y_train ve y_test olarak berlilediğimiz değişkenlere ise sonuc3 te yazan sadece cinsiyet verilerini bölerek yüklüyoruz.

from sklearn.model_selection import train_test_split
# verisetinin test ve eğitim için yüzde kaçının kullanılacağının kararını veriyor. 1/3
# s makinenin öğrenme için kullanacağı veri seti, testin alınacağı bağımsız değişken sonuc3
x_train, x_test, y_train, y_test = train_test_split(s, sonuc3, test_size = 0.33, random_state = 0)

Sonuçları yazdırmak istediğimiz zaman bölünmüş olarak görüyoruz.

print(x_train)
print(x_test)

print(y_train)
print(y_test)

Sonuç

     fr   tr   us    boy   kilo    yas
8   0.0  1.0  0.0  177.0   60.0  22.00
6   0.0  1.0  0.0  190.0   80.0  25.00
16  1.0  0.0  0.0  193.0   90.0  28.45
4   0.0  1.0  0.0  129.0   38.0  12.00
2   0.0  1.0  0.0  135.0   34.0  10.00
5   0.0  1.0  0.0  180.0   90.0  30.00
17  1.0  0.0  0.0  187.0   80.0  27.00
9   0.0  0.0  1.0  185.0  105.0  33.00
7   0.0  1.0  0.0  175.0   90.0  35.00
18  1.0  0.0  0.0  183.0   88.0  28.00
3   0.0  1.0  0.0  133.0   30.0   9.00
0   0.0  1.0  0.0  130.0   30.0  10.00
15  1.0  0.0  0.0  174.0   70.0  47.00
12  0.0  0.0  1.0  160.0   58.0  28.45

     fr   tr   us    boy  kilo   yas
20  1.0  0.0  0.0  164.0  66.0  32.0
10  0.0  0.0  1.0  165.0  55.0  27.0
14  0.0  0.0  1.0  167.0  62.0  55.0
13  0.0  0.0  1.0  162.0  59.0  41.0
1   0.0  1.0  0.0  125.0  36.0  11.0
21  1.0  0.0  0.0  166.0  56.0  42.0
11  0.0  0.0  1.0  155.0  50.0  44.0
19  1.0  0.0  0.0  159.0  40.0  29.0

   cinsiyet
8         k
6         e
16        e
4         e
2         k
5         e
17        e
9         e
7         e
18        e
3         k
0         e
15        e
12        k

   cinsiyet
20        k
10        k
14        k
13        k
1         e
21        k
11        k
19        k

İyi çalışmalar,

Bir cevap yazın

E-posta hesabınız yayımlanmayacak.

This site uses Akismet to reduce spam. Learn how your comment data is processed.