Spaces:

IVSD
/

EasyMachineLearningDemo

Sleeping

EasyMachineLearningDemo / analysis /markov_model.py

LLH

2024/02/14/01:14

bd39f54 over 1 year ago

3.49 kB

	import numpy as np
	import pandas as pd
	from hmmlearn import hmm


	def train_and_predict_hidden_markov_model(df):
	window_size = 10

	# train_df = df[['point_won', 'point_loss', 'ace', 'winner', 'double_fault', 'unf_err', 'net_point', 'net_point_won', 'break_pt', 'break_pt_won', 'break_pt_miss']]

	train_df = df
	# "p1_winner",
	# "p2_winner",
	# "winner_shot_type",
	# "p1_double_fault",
	# "p2_double_fault",
	# "p1_unf_err",
	# "p2_unf_err",
	# "p1_net_pt_won",
	# "p2_net_pt_won",
	# "p1_break_pt_won",
	# "p2_break_pt_won",
	# "rally_count",
	# "serve_width",
	# "serve_depth",
	# "return_depth"
	df["observation"] = 0

	# mapping = {}
	# counter = 0
	# for i in range(len(train_df)):
	# cur_combination = train_df.iloc[i].to_list()
	#
	# if str(cur_combination) not in mapping.keys():
	# mapping[str(cur_combination)] = counter
	# df.loc[i, "observation"] = counter
	# counter += 1
	# else:
	# df.loc[i, "observation"] = mapping[str(cur_combination)]

	observation_list = df["observation"].to_list()

	# value_separated_observation_list = [observation_list[i - window_size: i] for i in range(window_size, len(observation_list))]
	# value_separated_observation_list = [[0] * window_size] * window_size + value_separated_observation_list

	observations = np.array([np.sum(np.array([train_df.iloc[j].to_list() for j in range(i-window_size, i)]).astype(int), axis=0) for i in range(window_size, len(train_df))])

	observations = abs(np.min(observations)) + observations

	observations = observations.astype(int)

	m_observations = np.concatenate(
	(np.array([observations[0].tolist()] * window_size), observations),
	axis=0
	)

	df = pd.concat([df, pd.DataFrame({"window_observation": m_observations.tolist()})], axis=1)

	hidden_markov_model = hmm.MultinomialHMM(n_components=5, n_iter=50, tol=0.01)

	hidden_markov_model.fit(observations)

	start_prob = hidden_markov_model.startprob_
	transition_prob = hidden_markov_model.transmat_
	emission_prob = hidden_markov_model.emissionprob_

	neg_log_likelihood, pred = calculate_momentum(df, hidden_markov_model, m_observations)

	_, hidden2observation = hidden_markov_model.score_samples(observations)

	state_impacts = np.sum(hidden2observation, axis=0)

	return state_impacts, neg_log_likelihood, pred, start_prob, transition_prob, emission_prob

	state_impacts = np.zeros((num_states, num_obs))

	for t in range(num_obs):
	for i in range(num_states):
	state_impacts[i, t] = (forward_prob[t, i] * backward_prob[t, i]) / np.sum(
	forward_prob[t, :] * backward_prob[t, :])

	return neg_log_likelihood, pred, start_prob, transition_prob, emission_prob


	def calculate_momentum(df, hidden_markov_model, m_observations):
	# pred_list = []
	# neg_log_likelihood_list = []
	# for i in range(len(df)):
	# neg_log_likelihood, pred = hidden_markov_model.decode(np.array([df.loc[i, "window_observation"]]))
	# pred_list.append(pred[0])
	# neg_log_likelihood_list.append(neg_log_likelihood)
	#
	# return pred_list, neg_log_likelihood_list

	neg_log_likelihood, pred = hidden_markov_model.decode(m_observations)

	return neg_log_likelihood, pred