Belajar Pengkodean Label Dalam Python

AbdUmar 00:53 0 Komentar

Saat melakukan klasifikasi, biasanya akan menangani banyak label. Label ini bisa berbentuk kata, angka, atau yang lainnya. Fungsi mesin learning di sklearn mengharapkan mereka menjadi angka. Jadi kalau sudah ada angka, kita bisa pakai langsung untuk memulai pelatihan. Tetapi biasanya tidak demikian.

Dalam dunia nyata, label berbentuk kata-kata, karena kata-kata dapat dibaca oleh manusia. Misalnya diberi label data pelatihan dengan kata-kata sehingga pemetaan dapat dilacak. Untuk mengubah kata label menjadi angka, kita perlu menggunakan label encoder ( Pengkodean Label). Pengkodean label mengacu pada proses mengubah label kata menjadi bentuk numerik. Ini memungkinkan algoritme untuk beroperasi data.

Lebih jelasnya kode python berikut dapat dicoba:

import numpy as np
from sklearn import preprocessing

# Sample input labels
input_labels = ['red', 'black', 'red', 'green', 'black', 'yellow', 'white']

# Create label encoder and fit the labels
encoder = preprocessing.LabelEncoder()
encoder.fit(input_labels)

# Print the mapping
print("\nLabel mapping:")
for i, item in enumerate(encoder.classes_): print(item, '-->', i)

# Encode a set of labels using the encoder
test_labels = ['green', 'red', 'black']
encoded_values = encoder.transform(test_labels)
print("\nLabels =", test_labels)
print("Encoded values =", list(encoded_values))

# Decode a set of values using the encoder
encoded_values = [3, 0, 4, 1]
decoded_list = encoder.inverse_transform(encoded_values)
print("\nEncoded values =", encoded_values)
print("Decoded labels =", list(decoded_list))