日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区

您的位置:首頁技術文章
文章詳情頁

如何用Python徒手寫線性回歸

瀏覽:32日期:2022-06-29 11:11:28

對于大多數數據科學家而言,線性回歸方法是他們進行統計學建模和預測分析任務的起點。這種方法已經存在了 200 多年,并得到了廣泛研究,但仍然是一個積極的研究領域。由于良好的可解釋性,線性回歸在商業數據上的用途十分廣泛。當然,在生物數據、工業數據等領域也不乏關于回歸分析的應用。

另一方面,Python 已成為數據科學家首選的編程語言,能夠應用多種方法利用線性模型擬合大型數據集顯得尤為重要。

如果你剛剛邁入機器學習的大門,那么使用 Python 從零開始對整個線性回歸算法進行編碼是一次很有意義的嘗試,讓我們來看看怎么做吧。

數據

機器學習問題的第一步是獲取數據,沒有可以學習的數據就沒有機器學習。本文將使用非常常規的線性回歸數據集——房價預測數據集。

這是一個包含俄勒岡州波特蘭市房價的簡單數據集。該數據集中第一列是房屋面積(以平方英尺為單位),第二列是臥室的數量,第三列是房屋價格。該數據集中有多個特征(例如,house_size 和房間數),因此我們將研究多元線性回歸,標簽 (y) 是我們將要預測的房價。

首先定義用于加載數據集的函數:

def load_data(filename): df = pd.read_csv(filename, sep=',', index_col=False) df.columns = ['housesize', 'rooms', 'price'] data = np.array(df, dtype=float) plot_data(data[:,:2], data[:, -1]) normalize(data) return data[:,:2], data[:, -1]

我們稍后將調用上述函數來加載數據集。此函數返回 x 和 y。

歸一化數據

上述代碼不僅加載數據,還對數據執行歸一化處理并繪制數據點。在查看數據圖之前,我們首先了解上述代碼中的 normalize(data)。

查看原始數據集后,你會發現第二列數據的值(房間數量)比第一列(即房屋面積)小得多。該模型不會將此數據評估為房間數量或房屋面積,對于模型來說,它們只是一些數字。機器學習模型中某些列(或特征)的數值比其他列高可能會造成不想要的偏差,還可能導致方差和數學均值的不平衡。出于這些原因,也為了簡化工作,我們建議先對特征進行縮放或歸一化,使其位于同一范圍內(例如 [-1,1] 或 [0,1]),這會讓訓練容易許多。因此我們將使用特征歸一化,其數學表達如下:

Z = (x — μ) / σ μ : mean σ : standard deviation

其中 z 是歸一化特征,x 是非歸一化特征。有了歸一化公式,我們就可以為歸一化創建一個函數:

def normalize(data): for i in range(0,data.shape[1]-1):data[:,i] = ((data[:,i] - np.mean(data[:,i]))/np.std(data[:, i]))

上述代碼遍歷每一列,并使用每一列中所有數據元素的均值和標準差對其執行歸一化。

繪制數據

在對線性回歸模型進行編碼之前,我們需要先問「為什么」。

為什么要使用線性回歸解決這個問題?這是一個非常有用的問題,在寫任何具體代碼之前,你都應該非常清楚要使用哪種算法,以及在給定數據集和待解決問題的情況下,這是否真的是最佳選擇。

我們可以通過繪制圖像來證明對當前數據集使用線性回歸有效的原因。為此,我們在上面的 load_data 中調用了 plot_data 函數,現在我們來定義一下 plot_data 函數:

def plot_data(x, y): plt.xlabel(’house size’) plt.ylabel(’price’) plt.plot(x[:,0], y, ’bo’) plt.show()

調用該函數,將生成下圖:

如何用Python徒手寫線性回歸

房屋面積與房屋價格關系圖。

如上圖所示,我們可以粗略地擬合一條線。這意味著使用線性近似能夠做出較為準確的預測,因此可以采用線性回歸。

準備好數據之后就要進行下一步,給算法編寫代碼。

假設

首先我們需要定義假設函數,稍后我們將使用它來計算代價。對于線性回歸,假設是:

如何用Python徒手寫線性回歸

但數據集中只有 2 個特征,因此對于當前問題,假設是:

如何用Python徒手寫線性回歸

其中 x1 和 x2 是兩個特征(即房屋面積和房間數量)。然后編寫一個返回該假設的簡單 Python 函數:

def h(x,theta): return np.matmul(x, theta)

接下來我們來看代價函數。

代價函數

使用代價函數的目的是評估模型質量。

代價函數的等式為:

如何用Python徒手寫線性回歸

代價函數的代碼如下:

def cost_function(x, y, theta): return ((h(x, theta)-y).T@(h(x, theta)-y))/(2*y.shape[0])

到目前為止,我們定義的所有 Python 函數都與上述線性回歸的數學意義完全相同。接下來我們需要將代價最小化,這就要用到梯度下降。

梯度下降

梯度下降是一種優化算法,旨在調整參數以最小化代價函數。

梯度下降的主要更新步是:

如何用Python徒手寫線性回歸

因此,我們將代價函數的導數乘以學習率(α),然后用參數(θ)的當前值減去它,獲得新的更新參數(θ)。

def gradient_descent(x, y, theta, learning_rate=0.1, num_epochs=10): m = x.shape[0] J_all = [] for _ in range(num_epochs): h_x = h(x, theta) cost_ = (1/m)*(x.T@(h_x - y)) theta = theta - (learning_rate)*cost_ J_all.append(cost_function(x, y, theta)) return theta, J_all

gradient_descent 函數返回 theta 和 J_all。theta 顯然是參數向量,其中包含假設的θs 值,J_all 是一個列表,包含每個 epoch 后的代價函數。J_all 變量并非必不可少,但它有助于更好地分析模型。

整合到一起

接下來要做的就是以正確的順序調用函數

x,y = load_data('house_price_data.txt')y = np.reshape(y, (46,1))x = np.hstack((np.ones((x.shape[0],1)), x))theta = np.zeros((x.shape[1], 1))learning_rate = 0.1num_epochs = 50theta, J_all = gradient_descent(x, y, theta, learning_rate, num_epochs)J = cost_function(x, y, theta)print('Cost: ', J)print('Parameters: ', theta)#for testing and plotting cost n_epochs = []jplot = []count = 0for i in J_all: jplot.append(i[0][0]) n_epochs.append(count) count += 1jplot = np.array(jplot)n_epochs = np.array(n_epochs)plot_cost(jplot, n_epochs)test(theta, [1600, 2])

首先調用 load_data 函數載入 x 和 y 值。x 值包含訓練樣本,y 值包含標簽(在這里就是房屋的價格)。

你肯定注意到了,在整個代碼中,我們一直使用矩陣乘法的方式來表達所需。例如為了得到假設,我們必須將每個參數(θ)與每個特征向量(x)相乘。我們可以使用 for 循環,遍歷每個樣本,每次都執行一次乘法,但如果訓練的樣本過多,這可能不是最高效的方法。

在這里更有效的方式是使用矩陣乘法。本文所用的數據集具備兩個特征:房屋面積和房間數,即我們有(2+1)三個參數。將假設看作圖形意義上的一條線,用這種方式來思考額外參數θ0,最終額外的θ0 也要使這條線符合要求。

如何用Python徒手寫線性回歸

有利的假設函數圖示。

現在我們有了三個參數和兩個特征。這意味著θ或參數向量(1 維矩陣)的維數是 (3,1),但特征向量的維度是 (46,2)。你肯定會注意到將這樣兩個矩陣相乘在數學上是不可能的。再看一遍我們的假設:

如何用Python徒手寫線性回歸

如果你仔細觀察的話,實際上這很直觀:如果在特征向量 (x) {維度為 (46, 3)} 的開頭添加額外的一列,并且對 x 和 theta 執行矩陣乘法,將得出 hθ(x) 的方程。

記住,在實際運行代碼來實現此功能時,不會像 hθ(x) 那樣返回表達式,而是返回該表達式求得的數學值。在上面的代碼中,x = np.hstack((np.ones((x.shape[0],1)), x)) 這一行在 x 開頭加入了額外一列,以備矩陣乘法需要。

在這之后,我們用零初始化 theta 向量,當然你也可以用一些小隨機值來進行初始化。我們還指定了訓練學習率和 epoch 數。

定義完所有超參數之后,我們就可以調用梯度下降函數,以返回所有代價函數的歷史記錄以及參數 theta 的最終向量。在這里 theta 向量定義了最終的假設。你可能注意到,由梯度下降函數返回的 theta 向量的維度為 (3,1)。

還記得函數的假設嗎?

如何用Python徒手寫線性回歸

所以我們需要三個θ,theta 向量的維度為 (3,1),因此 theta [0]、theta [1] 和 theta [2] 實際上分別為θ0、θ1 和 θ2。J_all 變量是所有代價函數的歷史記錄。你可以打印出 J_all 數組,來查看代價函數在梯度下降的每個 epoch 中逐漸減小的過程。

如何用Python徒手寫線性回歸

代價和 epoch 數量的關系圖。

我們可以通過定義和調用 plot_cost 函數來繪制此圖,如下所示:

def plot_cost(J_all, num_epochs): plt.xlabel(’Epochs’) plt.ylabel(’Cost’) plt.plot(num_epochs, J_all, ’m’, linewidth = '5') plt.show()

現在我們可以使用這些參數來找到標簽,例如給定房屋面積和房間數量時的房屋價格。

測試

現在你可以測試調用測試函數的代碼,該函數會將房屋面積、房間數量和 logistic 回歸模型返回的最終 theta 向量作為輸入,并輸出房屋價格。

def test(theta, x): x[0] = (x[0] - mu[0])/std[0] x[1] = (x[1] - mu[1])/std[1] y = theta[0] + theta[1]*x[0] + theta[2]*x[1] print('Price of house: ', y)完整代碼

import numpy as npimport matplotlib.pyplot as pltimport pandas as pd#variables to store mean and standard deviation for each featuremu = []std = []def load_data(filename): df = pd.read_csv(filename, sep=',', index_col=False) df.columns = ['housesize', 'rooms', 'price'] data = np.array(df, dtype=float) plot_data(data[:,:2], data[:, -1]) normalize(data) return data[:,:2], data[:, -1]def plot_data(x, y): plt.xlabel(’house size’) plt.ylabel(’price’) plt.plot(x[:,0], y, ’bo’) plt.show()def normalize(data): for i in range(0,data.shape[1]-1): data[:,i] = ((data[:,i] - np.mean(data[:,i]))/np.std(data[:, i])) mu.append(np.mean(data[:,i])) std.append(np.std(data[:, i]))def h(x,theta): return np.matmul(x, theta)def cost_function(x, y, theta): return ((h(x, theta)-y).T@(h(x, theta)-y))/(2*y.shape[0])def gradient_descent(x, y, theta, learning_rate=0.1, num_epochs=10): m = x.shape[0] J_all = [] for _ in range(num_epochs): h_x = h(x, theta) cost_ = (1/m)*(x.T@(h_x - y)) theta = theta - (learning_rate)*cost_ J_all.append(cost_function(x, y, theta)) return theta, J_all def plot_cost(J_all, num_epochs): plt.xlabel(’Epochs’) plt.ylabel(’Cost’) plt.plot(num_epochs, J_all, ’m’, linewidth = '5') plt.show()def test(theta, x): x[0] = (x[0] - mu[0])/std[0] x[1] = (x[1] - mu[1])/std[1] y = theta[0] + theta[1]*x[0] + theta[2]*x[1] print('Price of house: ', y)x,y = load_data('house_price_data.txt')y = np.reshape(y, (46,1))x = np.hstack((np.ones((x.shape[0],1)), x))theta = np.zeros((x.shape[1], 1))learning_rate = 0.1num_epochs = 50theta, J_all = gradient_descent(x, y, theta, learning_rate, num_epochs)J = cost_function(x, y, theta)print('Cost: ', J)print('Parameters: ', theta)#for testing and plotting cost n_epochs = []jplot = []count = 0for i in J_all: jplot.append(i[0][0]) n_epochs.append(count) count += 1jplot = np.array(jplot)n_epochs = np.array(n_epochs)plot_cost(jplot, n_epochs)test(theta, [1600, 3])總結

這就是線性回歸的全部代碼了。

現在你已經學會了從零開始成功編寫線性回歸模型。能夠理解和編寫整個算法并不是一件容易的事,你或許需要時不時地回看才能完全理解。但這些努力是值得的,線性回歸通常是人們學習機器學習算法的第一步,在這之后你可以選擇另一個適用于線性回歸處理的數據集,并嘗試剛寫好的算法。

原文鏈接:

https://towardsdatascience.com/coding-linear-regression-from-scratch-c42ec079902

以上就是如何用Python徒手寫線性回歸的詳細內容,更多關于python 手寫線性回歸的資料請關注好吧啦網其它相關文章!

標簽: Python 編程
相關文章:
日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区
高清日韩中文字幕| 午夜亚洲一区| 国产精品久久久久久妇女| 美女尤物久久精品| 99亚洲视频| 先锋亚洲精品| 亚洲三级精品| 亚洲一区不卡| 亚洲一区免费| 亚洲v天堂v手机在线| 日韩在线网址| 国产精品观看| 中国字幕a在线看韩国电影| 国产粉嫩在线观看| 日韩精品一卡| 国产精品日韩欧美一区| 婷婷综合国产| 老司机精品视频在线播放| 成人午夜网址| 91精品综合| 久久最新视频| 日韩高清一区| 国产日韩欧美一区在线| 久久精品伊人| 日韩欧美少妇| 香蕉久久久久久久av网站| 涩涩涩久久久成人精品| 国产精品成人国产| 日韩免费福利视频| 香蕉精品999视频一区二区| 97久久超碰| 国产精品麻豆久久| 99综合视频| 国产日韩三级| 成人羞羞视频在线看网址| 国产一级一区二区| 久久国内精品| 超碰99在线| 99在线精品视频在线观看| 日韩精品久久久久久| 激情久久一区二区| 黑丝一区二区| 久久精品72免费观看| 欧美日韩免费看片| 一区二区国产在线| 精品久久97| 亚洲欧洲另类| 日韩不卡免费视频| 成人va天堂| 蜜桃av一区二区三区电影| 久久成人福利| 狠狠久久婷婷| 国产精品午夜av| 宅男在线一区| 国产精品一区二区精品视频观看| 日韩影院二区| 日日夜夜免费精品| 在线人成日本视频| 一本综合精品| 色偷偷偷在线视频播放| 亚洲三级视频| 青青久久av| 国产亚洲高清在线观看| 欧美丝袜一区| 国产欧美综合一区二区三区| 国产99久久| 国产精品一区二区99| 免费视频国产一区| 欧美日韩一区二区高清| 久久精品国产亚洲夜色av网站| 91精品国产自产在线丝袜啪| 久久国产欧美| 国产精品视频一区视频二区| 黄色日韩在线| 97精品一区| 国产日韩中文在线中文字幕| 久久不射网站| 精品捆绑调教一区二区三区| 国产欧美日韩影院| 麻豆91精品| 日韩综合精品| 美女性感视频久久| 色综合视频一区二区三区日韩 | 久久久久久久久99精品大| 国产欧美日韩综合一区在线播放| 亚洲欧美日韩国产一区二区| 久久精品青草| 国产拍在线视频| 国产日韩1区| 在线看片日韩| 中文亚洲免费| 激情综合在线| 久久久久久网| 免费在线播放第一区高清av| 综合激情一区| 亚洲一区二区三区高清| 正在播放日韩精品| 老牛国内精品亚洲成av人片 | 国产精选一区| 日韩中文av| 亚洲三级观看| 亚洲午夜免费| 免费不卡在线视频| 亚洲一级在线| 99视频一区| 欧美日韩日本国产亚洲在线| 99久久视频| 啪啪国产精品| 播放一区二区| 日韩欧美网址| 久久久国产精品网站| 国产精品夜夜夜| 日韩av二区在线播放| 中文字幕中文字幕精品| 久久亚洲电影| 亚洲深深色噜噜狠狠爱网站| 国产精品人人爽人人做我的可爱| 欧美日韩国产精品一区二区亚洲| 欧美特黄一级大片| 欧美丝袜一区| 精品一区免费| 国产高清一区| 中日韩男男gay无套| 亚洲精品123区| 亚洲主播在线| 99视频精品全国免费| 久久天堂成人| 欧美另类专区| 亚洲无线观看| 91精品国产经典在线观看| 久久国产生活片100| 国产精品一卡| 成人日韩av| 午夜精品成人av| 欧美日韩一二三四| 亚洲一区二区三区高清| 亚洲精品九九| 国产亚洲欧美日韩精品一区二区三区 | 奇米色欧美一区二区三区| 日韩av在线免费观看不卡| 久久激情五月婷婷| 国产乱人伦精品一区| 麻豆久久久久久| 欧美日韩免费看片| 亚洲精品一二三区区别| 丝袜美腿一区二区三区| 日韩高清二区| 国产伊人久久| 激情综合网站| 亚洲aa在线| 麻豆久久久久久久| 天堂中文av在线资源库| 日韩视频久久| 日本少妇一区二区| 久久精品三级| 久久国产精品成人免费观看的软件| 国产一在线精品一区在线观看| 伊人久久大香线蕉av超碰演员| 亚洲资源在线| 久久字幕精品一区| 激情欧美一区| 亚洲精品成a人ⅴ香蕉片| 国产精品亚洲人成在99www| 精品在线网站观看| 99久久久久| 日韩精品乱码av一区二区| 国产一区二区三区不卡av| 9色国产精品| 国产福利亚洲| 欧美日韩国产精品一区二区亚洲| 69堂免费精品视频在线播放| 国产精品99在线观看| 亚洲女同一区| 日本不卡不码高清免费观看| 成人午夜网址| 视频一区视频二区在线观看| 欧美aⅴ一区二区三区视频| 激情六月综合| 国产精品国码视频| 免费观看不卡av| 欧美在线精品一区| 久久婷婷一区| 国产欧美一区二区三区国产幕精品 | 国产一区国产二区国产三区| 亚洲手机在线| 国产视频网站一区二区三区| 久久久久久久久久久9不雅视频| 亚洲精品第一| 91精品婷婷色在线观看| 久久狠狠久久| 国产亚洲毛片在线| 国产成人精选| 日欧美一区二区| 日韩毛片在线| 国产精品v日韩精品v欧美精品网站 | 国产视频一区二区在线播放| 欧美一级精品| 欧美国产免费| 在线观看亚洲精品福利片| 日韩精品免费一区二区在线观看|