# jupyter nbconvert HW9.ipynb --TagRemovePreprocessor.remove_cell_tags='{"remove-cell"}' --to pdf 
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import math
from qpsolvers import solve_qp
from scipy.optimize import minimize
from sklearn.metrics import confusion_matrix
from sklearn.metrics import ConfusionMatrixDisplay
import seaborn as sns

%matplotlib inline
%config InlineBackend.figure_format = 'png'

from pylab import rcParams
rcParams.update({"axes.grid" : True})
rcParams['figure.figsize'] = (6,4)
rcParams['lines.linewidth'] = 1
rcParams['image.cmap'] = 'Greys'
rcParams['axes.spines.right'] = False
rcParams['axes.spines.top'] = False
rcParams['font.weight'] = 400
rcParams['font.size'] = 9
rcParams['xtick.color'] = '#111111'
rcParams['ytick.color'] = '#111111'
rcParams['grid.color'] = '#dddddd'
rcParams['grid.linestyle'] = '-'
rcParams['grid.linewidth'] = 0.5
rcParams['axes.titlesize'] = 12
rcParams['axes.titleweight'] = 500
rcParams['axes.labelsize'] = 10
rcParams['axes.labelweight'] = 400
rcParams['axes.linewidth'] = 0.5
rcParams['axes.edgecolor'] = [.25,.25,.25]


train = np.array(pd.read_csv('./data/train-q1.csv'))
test = np.array(pd.read_csv('./data/test-q1.csv'))
train_x = train[:,0:2]
train_y = train[:,2]
test_x = test[:,0:2]
test_y = test[:,2]


def gaus(x,z,sigma=1):
    exp_this = -np.sum((x-z)**2)/(2*sigma**2)
    return np.exp(exp_this)

k = np.zeros((200,200))

for i, row in enumerate(train_x):
    for j, row2 in enumerate(train_x):
        k[i,j] = gaus(row, row2)
        
plt.matshow(k)
plt.show()


lam = 0.01
n = train.shape[0]
I = np.identity(n)
alpha = np.linalg.inv(k+n*lam*I)@train_y


k_test = np.zeros((300,200))

for i, row in enumerate(test_x):
    for j, row2 in enumerate(train_x):
        k_test[i,j] = gaus(row, row2)
plt.matshow(k_test)
plt.show()


preds = k_test @ alpha
prediction_error = ((preds - test_y)**2).mean()
print(f'Kernel ridge regression error: {prediction_error:0.4f}.')
print('This was less than the error from ridge regression from glmnet package (3.226).')

Kernel ridge regression error: 0.7996.
This was less than the error from ridge regression from glmnet package (3.226).


train = np.array(pd.read_csv('./data/train-q2.csv'))
test = np.array(pd.read_csv('./data/test-q2.csv'))
train_x = train[:,0:2]
train_y = train[:,2]
test_x = test[:,0:2]
test_y = test[:,2]


# TO-DO: above
def loss(y, f_x):
    return np.log(1+np.exp(-y*f_x))

def SVMfn(b, K, y, lam):
    n = len(y)
    
    to_return = 0
    for i in range(n):
        to_return = to_return + loss(y[i],K[:,i].T@b)
        
    to_return = to_return/n + lam*b.T@K@b
    return to_return


def SVMgr(b, K, y, lam):
    grad = 0
    n = len(y)
    
    for i in range(n):
        grad = grad - (y[i] * K[:,i])/(1+np.exp(y[i]*K[:,i].T@b))

    grad = grad / n + 2 * lam * K @ b 
    
    return grad

def SVMfnAndgn(b,K,y,lam):
    return (SVMfn(b,K,y,lam), SVMgr(b,K,y,lam))


# TO-DO: above

sigma = 0.2
lam = 0.01
initial_guess = np.zeros(200)

# 1. calculate ur train kernel
K_train = np.zeros((200,200))

for i, row in enumerate(train_x):
    for j, row2 in enumerate(train_x):
        K_train[i,j] = gaus(row, row2, sigma)
    
# 2. use that to optimize SVMfn using SVMfnAndgn
minimization_results = minimize(SVMfnAndgn, initial_guess, args=(K_train, train_y, lam), method='BFGS', jac=True)


# 3. report the optimal loss function
print(f'Optimal Loss: {minimization_results.fun:0.4f}')

# 4. determine training predictions
pred_train = K_train @ minimization_results.x
mask = pred_train > 0
pred_train[mask] = 1
pred_train[~mask] = -1

# 5. report the confusion table of the training data
cm = confusion_matrix(train_y, pred_train)
f = sns.heatmap(cm, annot=True, fmt='d')
f.set_title('Training Confusion Matrix')

# 6. report the misclassification rate on training data
print(f'Training misclassification rate: {np.mean(pred_train != train_y)}')

# 7. calculate ur test kernel
K_test = np.zeros((300,200))

for i, row in enumerate(test_x):
    for j, row2 in enumerate(train_x):
        K_test[i,j] = gaus(row, row2, sigma)
        
# 8. use that to calculate test predictions
preds_test = K_test @ minimization_results.x
mask = preds_test > 0
preds_test[mask] = 1
preds_test[~mask] = -1

# 9. report classification error
print(f'Testing misclassification rate: {np.mean(preds_test != test_y):0.4f}')

Optimal Loss: 0.6036
Training misclassification rate: 0.01
Testing misclassification rate: 0.0867

About HW9¶

Question 1 [45 Points] Kernel Ridge Regression¶

Question 2 [55 Points] Non-linear SVM as Penalized Version¶