SDC-multi-classifier / test_messages.py
DocUA's picture
Initial commit without sensitive data
9c5a6d0
import pandas as pd
def test_messages_with_labels(path_csv="messages_with_labels.csv"):
# 1) Завантажуємо CSV
df_labeled = pd.read_csv(path_csv)
# 2) Подивимося на перші 5 рядків
print("Перші 5 рядків з messages_with_labels.csv:")
print(df_labeled.head())
# 3) Порахуємо, скільки в кожному класі (Target)
print("\nРозподіл за мітками (Target):")
print(df_labeled["Target"].value_counts())
# (Додатково) Якщо у вас є справжня колонка, напр. "TrueLabel", можна порахувати Accuracy
if "TrueLabel" in df_labeled.columns:
accuracy = (df_labeled["Target"] == df_labeled["TrueLabel"]).mean()
print(f"\nAccuracy (Target vs TrueLabel): {accuracy:.2%}")
else:
print("\nКолонка 'TrueLabel' відсутня — не можемо автоматично оцінити точність.")
# Викликаємо:
if __name__ == "__main__":
test_messages_with_labels()