專欄推薦

正文

深度學習框架pytorch擁有自動求導的機制，自動求導是 PyTorch 中非常重要的特性，能夠讓我們避免手動去計算非常複雜的導數，這能夠極大地減少了我們構建模型的時間。

導入的包

import torch

from torch.autograd import Variable

對標量進行自動求導

x = Variable(torch.Tensor([2]), requires_grad=True)

y = x + 2

z = y ** 2 + 3

print(z)

z.backward()

print(x.grad)

我們可以看到變量x在申明的時候，指定了requires_grad=True，這樣和x進行運算的所有變量都相當於設置了requires_grad=True，比如y、z都相當於設置了requires_grad=True。這樣我們就可以使用反向傳播了，本例中z.backward()就是表示的執行反向傳播，最後x.grad表示的是z對x的偏導數。

對矩陣求梯度

x = Variable(torch.randn(10, 20), requires_grad=True)

y = Variable(torch.randn(10, 5), requires_grad=True)

w = Variable(torch.randn(20, 5), requires_grad=True)

out = torch.mean(y - torch.matmul(x, w))

out.backward()

print(x.grad)

print(w.grad)

本例中我們申明瞭三個矩陣，分別是x、y、w，然後我們對其進行計算操作。torch.matmul 是做矩陣乘法，torch.mean是做均值化。然後執行反向傳播就可以獲取到矩陣x的梯度了。

在pytorch0.4之後Variable 正式合併入Tensor, Variable 本來實現的自動微分功能，Tensor就能支持，所以我們可以直接在創建tensor的時候，使用autograd功能，只需要設置tensor.requries_grad=True.

x = t.ones(2, 2, requires_grad=True)

這樣這個x就可以自動求導了

y = w * x + b

x=torch.ones(1)

b=torch.rand(1,requires_grad=True)

w=torch.rand(2,requires_grad=True)

z=w*x

y=z+b

y.backward()#自動求導，它會對所有需要求梯度的變量進行求導，然後得到他們的梯度。y.backward（）等價於y.backward（torch.FloatTensor([1])），因為我們上面求得梯度都是標量（維度是1，所以torch.FloatTensor([1])），backward中的參數就沒有必要來寫了。

求完梯度之後，我們就可以使用屬性grad來求出每個變量的梯度

print (x.grad) #求變量x的梯度，梯度為w，也就是2

print(w.grad)#求變量w的梯度，梯度為x，也就是1

print (b. grad)#求變量b的梯度，梯度為常數1