# jupyter nbconvert HW5.ipynb --TagRemovePreprocessor.remove_cell_tags='{"remove-cell"}' --to pdf 
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import statsmodels.api as sm
from scipy.optimize import minimize
%matplotlib inline
%config InlineBackend.figure_format = 'png'

from pylab import rcParams
rcParams.update({"axes.grid" : True})
rcParams['figure.figsize'] = (6,4)
rcParams['lines.linewidth'] = 1
rcParams['image.cmap'] = 'Greys'
rcParams['axes.spines.right'] = False
rcParams['axes.spines.top'] = False
rcParams['font.weight'] = 400
rcParams['font.size'] = 9
rcParams['xtick.color'] = '#111111'
rcParams['ytick.color'] = '#111111'
rcParams['grid.color'] = '#dddddd'
rcParams['grid.linestyle'] = '-'
rcParams['grid.linewidth'] = 0.5
rcParams['axes.titlesize'] = 12
rcParams['axes.titleweight'] = 500
rcParams['axes.labelsize'] = 10
rcParams['axes.labelweight'] = 400
rcParams['axes.linewidth'] = 0.5
rcParams['axes.edgecolor'] = [.25,.25,.25]


# TO-DO: implement the data generation in python... I just saved the iimportant stuff in r and loaded here
X_org = np.array(pd.read_csv('./data/X_org.csv'))
y_org = np.array(pd.read_csv('./data/y_org.csv')).reshape(-1)

mean_X = X_org.mean(axis=0)
sd_X = X_org.std(axis=0)

mean_y = y_org.mean()
sd_y = y_org.std()

X = np.array(pd.read_csv('./data/X.csv'))
y = np.array(pd.read_csv('./data/y.csv')).reshape(-1)


def soft_th(b, lam):
    half_lam = lam/2
    if(b > half_lam):
        return b - half_lam
    elif(b < -half_lam):
        return b + half_lam
    else:
        return 0


lam = 0.3

dict = {
        'b = 1' : [soft_th(1, lam)],
        'b = -1' : [soft_th(-1, lam)],
        'b = -0.1' : [soft_th(-0.1, lam)],
       }

df = pd.DataFrame(dict)
df = df.rename(index={0: 'lambda = 0.3'})
display(df.T)


def myLasso(X, y, lam, beta_init, tol, max_iter):
    beta = beta_init

    for k in range(max_iter):
        r = y - X @ beta
        beta_to_set = np.zeros(X.shape[1])
        for j in range(p):
            r = r + X[:,j] * beta[j]
            beta_ols_j = np.mean(r * X[:,j])
            beta_to_set[j] = soft_th(beta_ols_j, lam)
            r = r - X[:,j] * beta_to_set[j]
            
        # tolerance check    
        if(np.linalg.norm((beta - beta_to_set), ord=1) <= tol):
            #print(f'Converged at {k} ({np.linalg.norm((beta - beta_to_set), ord=1)})')
            return beta
        beta = beta_to_set
        
        
    return beta


n = 100
p = 200
betas_lasso = myLasso(X, y, lam, np.zeros(p), 1e-7, 100)
print('First 8 betas:')
print(betas_lasso[0:8])

# I saved the betas from the R file and loaded here:
betas_glmnet = np.array(pd.read_csv('./data/glmnet_betas.csv')).reshape(-1)
first_eight_betas_glmnet = betas_glmnet[0:8] 
L1_norm = np.linalg.norm((first_eight_betas_glmnet - betas_lasso[0:8]), ord=1)
print(f'L1 Norm: {L1_norm}')

First 8 betas:
[ 0.          0.15823488  0.42964715 -0.51944529 -0.17147606 -0.00664524
  0.          0.        ]
L1 Norm: 3.221376238462647e-05


lambda_all = np.array(pd.read_csv('./data/lambda_all.csv')).reshape(-1)


def myLasso_pw(X, y, lambda_all, tol, maxitr):
    sorted_lambdas = np.flip(np.sort(lambda_all))
    output = []
    beta_init = np.zeros(X.shape[1])

    for i in range(len(sorted_lambdas)):
        lam = sorted_lambdas[i]
        betas_i = myLasso(X, y, lam, beta_init, tol, maxitr)
        output.append(betas_i)
        beta_init = betas_i
    return np.array(output).T


myLasso_pw_betas = myLasso_pw(X, y, lambda_all, 1e-7, 100)


# loaded scaled and recovered betas here:
rLasso_pw_betas = np.array(pd.read_csv('./data/rlassobeta_unscaled.csv'))
rLasso_pw_betas_recovered = np.array(pd.read_csv('./data/rlassobeta_scaled.csv'))

for i in range(8):
    plt.plot(np.log(lambda_all), rLasso_pw_betas[i,:], label=f'Beta {i+1}')
plt.title('glmnet Betas')
plt.xlabel('Log Lambda')
plt.ylabel('Estimated Beta')
plt.legend()
plt.show()

for i in range(8):
    plt.plot(np.log(lambda_all), myLasso_pw_betas[i,:], label=f'Beta {i+1}')
plt.title('My Pathwise Lasso')
plt.xlabel('Log Lambda')
plt.ylabel('Estimated Beta')
plt.legend()
plt.show()


discrepancy = []

for i in range(len(lambda_all)):
    discrepancy.append(np.linalg.norm((rLasso_pw_betas[1:,i] - myLasso_pw_betas[:,i]), ord=1))
discrepancy = np.array(discrepancy)

plt.plot(np.log(lambda_all), discrepancy)
plt.title('log( lambda ) vs. discrepancy')
plt.xlabel('log( lambda )')
plt.ylabel('discrepancy')
plt.show()


myLass_pw_recovered = []
for i in range(len(lambda_all)):
    gamas = myLasso_pw_betas[:,i][0:9]
    recovered_betas = []
    recovered_intercept = mean_y - np.sum(mean_X[1:9]*((sd_y*gamas[1:])/sd_X[1:9]))
    recovered_betas.append(recovered_intercept)
    for j in np.arange(1,9):
        recovered_betas.append((sd_y*gamas[j])/sd_X[j])
    myLass_pw_recovered.append(recovered_betas)
myLass_pw_recovered = np.array(myLass_pw_recovered).T


for i in range(9):
    plt.plot(np.log(lambda_all), myLass_pw_recovered[i,:], label=f'Beta {i+1}')

plt.title('glmnet - Recovered Betas')
plt.xlabel('Log Lambda')
plt.ylabel('Estimated Beta')
plt.legend()
plt.show()

for i in range(9):
    plt.plot(np.log(lambda_all), myLass_pw_recovered[i,:], label=f'Beta {i+1}')

plt.title('My Pathwise Lasso - Recovered Betas')
plt.xlabel('Log Lambda')
plt.ylabel('Estimated Beta')
plt.legend()
plt.show()


discrepancy_rec = []
for i in range(len(lambda_all)):
    discrepancy_rec.append(np.linalg.norm((rLasso_pw_betas_recovered[0:9,i] - myLass_pw_recovered[:,i]), ord=1))
discrepancy = np.array(discrepancy)
print(f'Max discrepency {np.max(discrepancy_rec)}')

Max discrepency 10.508252901876533

About HW5¶

Question 1 [50 Points] Lasso solution for fixed $\lambda$¶

Question 2 [50 Points] Path-wise Coordinate Descent¶

	lambda = 0.3
b = 1	0.85
b = -1	-0.85
b = -0.1	0.00