「c++11」我理解的右值引用、移動語義和完美轉發

C++中引入了右值引用和移動語義,可以避免無謂的複製,提高程序性能。有點難理解,於是花時間整理一下自己的理解。需要資料的可以私信我哦,感謝大家的關注轉發!

左值、右值

C++中所有的值都必然屬於左值、右值二者之一。左值是指表達式結束後依然存在的持久化對象,右值是指表達式結束時就不再存在的臨時對象。所有的具名變量或者對象都是左值,而右值不具名。很難得到左值和右值的真正定義,但是有一個可以區分左值和右值的便捷方法:看能不能對錶達式取地址,如果能,則為左值,否則為右值。

看見書上又將右值分為將亡值和純右值。純右值就是c++98標準中右值的概念,如非引用返回的函數返回的臨時變量值;一些運算表達式,如1+2產生的臨時變量;不跟對象關聯的字面量值,如2,'c',true,"hello";這些值都不能夠被取地址。

而將亡值則是c++11新增的和右值引用相關的表達式,這樣的表達式通常時將要移動的對象、T&&函數返回值、std::move()函數的返回值等,

不懂將亡值和純右值的區別其實沒關係,統一看作右值即可,不影響使用。

示例:

int i=0;// i是左值, 0是右值

class A {

public:

int a;

};

A getTemp()

{

return A();

}

A a = getTemp(); // a是左值 getTemp()的返回值是右值(臨時變量)

左值引用、右值引用

c++98中的引用很常見了,就是給變量取了個別名,在c++11中,因為增加了右值引用(rvalue reference)的概念,所以c++98中的引用都稱為了左值引用(lvalue reference)。

int a = 10;

int& refA = a; // refA是a的別名, 修改refA就是修改a, a是左值,左移是左值引用

int& b = 1; //編譯錯誤! 1是右值,不能夠使用左值引用

c++11中的右值引用使用的符號是&&,如

int&& a = 1; //實質上就是將不具名(匿名)變量取了個別名

int b = 1;

int && c = b; //編譯錯誤! 不能將一個左值複製給一個右值引用

class A {

public:

int a;

};

A getTemp()

{

return A();

}

A && a = getTemp(); //getTemp()的返回值是右值(臨時變量)

getTemp()返回的右值本來在表達式語句結束後,其生命也就該終結了(因為是臨時變量),而通過右值引用,該右值又重獲新生,其生命期將與右值引用類型變量a的生命期一樣,只要a還活著,該右值臨時變量將會一直存活下去。實際上就是給那個臨時變量取了個名字。

注意:這裡a的類型是右值引用類型(int &&),但是如果從左值和右值的角度區分它,它實際上是個左值。因為可以對它取地址,而且它還有名字,是一個已經命名的右值。

所以,左值引用只能綁定左值,右值引用只能綁定右值,如果綁定的不對,編譯就會失敗。但是,常量左值引用卻是個奇葩,它可以算是一個“萬能”的引用類型,它可以綁定非常量左值、常量左值、右值,而且在綁定右值的時候,常量左值引用還可以像右值引用一樣將右值的生命期延長,缺點是,只能讀不能改。

const int & a = 1; //常量左值引用綁定 右值, 不會報錯

class A {

public:

int a;

};

A getTemp()

{

return A();

}

const A & a = getTemp(); //不會報錯 而 A& a 會報錯

事實上,很多情況下我們用來常量左值引用的這個功能卻沒有意識到,如下面的例子:

#include

using namespace std;

class Copyable {

public:

Copyable(){}

Copyable(const Copyable &o) {

cout << "Copied" << endl;

}

};

Copyable ReturnRvalue() {

return Copyable(); //返回一個臨時對象

}

void AcceptVal(Copyable a) {

}

void AcceptRef(const Copyable& a) {

}

int main() {

cout << "pass by value: " << endl;

AcceptVal(ReturnRvalue()); // 應該調用兩次拷貝構造函數

cout << "pass by reference: " << endl;

AcceptRef(ReturnRvalue()); //應該只調用一次拷貝構造函數

}

當我敲完上面的例子並運行後,發現結果和我想象的完全不一樣!期望中AcceptVal(ReturnRvalue())需要調用兩次拷貝構造函數,一次在ReturnRvalue()函數中,構造好了Copyable對象,返回的時候會調用拷貝構造函數生成一個臨時對象,在調用AcceptVal()時,又會將這個對象拷貝給函數的局部變量a,一共調用了兩次拷貝構造函數。而AcceptRef()的不同在於形參是常量左值引用,它能夠接收一個右值,而且不需要拷貝。

而實際的結果是,不管哪種方式,一次拷貝構造函數都沒有調用!

這是由於編譯器默認開啟了返回值優化(RVO/NRVO, RVO, Return Value Optimization 返回值優化,或者NRVO, Named Return Value Optimization)。編譯器很聰明,發現在ReturnRvalue內部生成了一個對象,返回之後還需要生成一個臨時對象調用拷貝構造函數,很麻煩,所以直接優化成了1個對象對象,避免拷貝,而這個臨時變量又被賦值給了函數的形參,還是沒必要,所以最後這三個變量都用一個變量替代了,不需要調用拷貝構造函數。

雖然各大廠家的編譯器都已經都有了這個優化,但是這並不是c++標準規定的,而且不是所有的返回值都能夠被優化,而這篇文章的主要講的右值引用,移動語義可以解決編譯器無法解決的問題。

為了更好的觀察結果,可以在編譯的時候加上-fno-elide-constructors選項(關閉返回值優化)。

// g++ test.cpp -o test -fno-elide-constructors

pass by value:

Copied

Copied //可以看到確實調用了兩次拷貝構造函數

pass by reference:

Copied

上面這個例子本意是想說明常量左值引用能夠綁定一個右值,可以減少一次拷貝(使用非常量的左值引用會編譯失敗),但是順便講到了編譯器的返回值優化。。編譯器還是幹了很多事情的,很有用,但不能過於依賴,因為你也不確定它什麼時候優化了什麼時候沒優化。

總結一下,其中T是一個具體類型:

左值引用, 使用 T&, 只能綁定左值

右值引用, 使用 T&&, 只能綁定右值

常量左值, 使用 const T&, 既可以綁定左值又可以綁定右值

已命名的右值引用,編譯器會認為是個左值

編譯器有返回值優化,但不要過於依賴

移動構造和移動賦值

回顧一下如何用c++實現一個字符串類MyString,MyString內部管理一個C語言的char *數組,這個時候一般都需要實現拷貝構造函數和拷貝賦值函數,因為默認的拷貝是淺拷貝,而指針這種資源不能共享,不然一個析構了,另一個也就完蛋了。

具體代碼如下:

#include

#include

#include

using namespace std;

class MyString

{

public:

static size_t CCtor; //統計調用拷貝構造函數的次數

// static size_t CCtor; //統計調用拷貝構造函數的次數

public:

// 構造函數

MyString(const char* cstr=0){

if (cstr) {

m_data = new char[strlen(cstr)+1];

strcpy(m_data, cstr);

}

else {

m_data = new char[1];

*m_data = '\0';

}

}

// 拷貝構造函數

MyString(const MyString& str) {

CCtor ++;

m_data = new char[ strlen(str.m_data) + 1 ];

strcpy(m_data, str.m_data);

}

// 拷貝賦值函數 =號重載

MyString& operator=(const MyString& str){

if (this == &str) // 避免自我賦值!!

return *this;

delete[] m_data;

m_data = new char[ strlen(str.m_data) + 1 ];

strcpy(m_data, str.m_data);

return *this;

}

~MyString() {

delete[] m_data;

}

char* get_c_str() const { return m_data; }

private:

char* m_data;

};

size_t MyString::CCtor = 0;

int main()

{

vector vecStr;

vecStr.reserve(1000); //先分配好1000個空間,不這麼做,調用的次數可能遠大於1000

for(int i=0;i<1000;i++){

vecStr.push_back(MyString("hello"));

}

cout << MyString::CCtor << endl;

}

代碼看起來挺不錯,卻發現執行了1000次拷貝構造函數,如果MyString("hello")構造出來的字符串本來就很長,構造一遍就很耗時了,最後卻還要拷貝一遍,而MyString("hello")只是臨時對象,拷貝完就沒什麼用了,這就造成了沒有意義的資源申請和釋放操作,如果能夠直接使用臨時對象已經申請的資源,既能節省資源,又能節省資源申請和釋放的時間。而C++11新增加的移動語義就能夠做到這一點。

要實現移動語義就必須增加兩個函數:移動構造函數和移動賦值構造函數。

#include

#include

#include

using namespace std;

class MyString

{

public:

static size_t CCtor; //統計調用拷貝構造函數的次數

static size_t MCtor; //統計調用移動構造函數的次數

static size_t CAsgn; //統計調用拷貝賦值函數的次數

static size_t MAsgn; //統計調用移動賦值函數的次數

public:

// 構造函數

MyString(const char* cstr=0){

if (cstr) {

m_data = new char[strlen(cstr)+1];

strcpy(m_data, cstr);

}

else {

m_data = new char[1];

*m_data = '\0';

}

}

// 拷貝構造函數

MyString(const MyString& str) {

CCtor ++;

m_data = new char[ strlen(str.m_data) + 1 ];

strcpy(m_data, str.m_data);

}

// 移動構造函數

MyString(MyString&& str) noexcept

:m_data(str.m_data) {

MCtor ++;

str.m_data = nullptr; //不再指向之前的資源了

}

// 拷貝賦值函數 =號重載

MyString& operator=(const MyString& str){

CAsgn ++;

if (this == &str) // 避免自我賦值!!

return *this;

delete[] m_data;

m_data = new char[ strlen(str.m_data) + 1 ];

strcpy(m_data, str.m_data);

return *this;

}

// 移動賦值函數 =號重載

MyString& operator=(MyString&& str) noexcept{

MAsgn ++;

if (this == &str) // 避免自我賦值!!

return *this;

delete[] m_data;

m_data = str.m_data;

str.m_data = nullptr; //不再指向之前的資源了

return *this;

}

~MyString() {

delete[] m_data;

}

char* get_c_str() const { return m_data; }

private:

char* m_data;

};

size_t MyString::CCtor = 0;

size_t MyString::MCtor = 0;

size_t MyString::CAsgn = 0;

size_t MyString::MAsgn = 0;

int main()

{

vector vecStr;

vecStr.reserve(1000); //先分配好1000個空間

for(int i=0;i<1000;i++){

vecStr.push_back(MyString("hello"));

}

cout << "CCtor = " << MyString::CCtor << endl;

cout << "MCtor = " << MyString::MCtor << endl;

cout << "CAsgn = " << MyString::CAsgn << endl;

cout << "MAsgn = " << MyString::MAsgn << endl;

}

/* 結果

CCtor = 0

MCtor = 1000

CAsgn = 0

MAsgn = 0

*/

可以看到,移動構造函數與拷貝構造函數的區別是,拷貝構造的參數是const MyString& str,是常量左值引用,而移動構造的參數是MyString&& str,是右值引用,而MyString("hello")是個臨時對象,是個右值,優先進入移動構造函數而不是拷貝構造函數。而移動構造函數與拷貝構造不同,它並不是重新分配一塊新的空間,將要拷貝的對象複製過來,而是"偷"了過來,將自己的指針指向別人的資源,然後將別人的指針修改為nullptr,這一步很重要,如果不將別人的指針修改為空,那麼臨時對象析構的時候就會釋放掉這個資源,"偷"也白偷了。下面這張圖可以解釋copy和move的區別。

「c++11」我理解的右值引用、移動語義和完美轉發

copy-move

不用奇怪為什麼可以搶別人的資源,臨時對象的資源不好好利用也是浪費,因為生命週期本來就是很短,在你執行完這個表達式之後,它就毀滅了,充分利用資源,才能很高效。

對於一個左值,肯定是調用拷貝構造函數了,但是有些左值是局部變量,生命週期也很短,能不能也移動而不是拷貝呢?C++11為了解決這個問題,提供了std::move()方法來將左值轉換為右值,從而方便應用移動語義。我覺得它其實就是告訴編譯器,雖然我是一個左值,但是不要對我用拷貝構造函數,而是用移動構造函數吧。。。

int main()

{

vector vecStr;

vecStr.reserve(1000); //先分配好1000個空間

for(int i=0;i<1000;i++){

MyString tmp("hello");

vecStr.push_back(tmp); //調用的是拷貝構造函數

}

cout << "CCtor = " << MyString::CCtor << endl;

cout << "MCtor = " << MyString::MCtor << endl;

cout << "CAsgn = " << MyString::CAsgn << endl;

cout << "MAsgn = " << MyString::MAsgn << endl;

cout << endl;

MyString::CCtor = 0;

MyString::MCtor = 0;

MyString::CAsgn = 0;

MyString::MAsgn = 0;

vector vecStr2;

vecStr2.reserve(1000); //先分配好1000個空間

for(int i=0;i<1000;i++){

MyString tmp("hello");

vecStr2.push_back(std::move(tmp)); //調用的是移動構造函數

}

cout << "CCtor = " << MyString::CCtor << endl;

cout << "MCtor = " << MyString::MCtor << endl;

cout << "CAsgn = " << MyString::CAsgn << endl;

cout << "MAsgn = " << MyString::MAsgn << endl;

}

/* 運行結果

CCtor = 1000

MCtor = 0

CAsgn = 0

MAsgn = 0

CCtor = 0

MCtor = 1000

CAsgn = 0

MAsgn = 0

*/

下面再舉幾個例子:

MyString str1("hello"); //調用構造函數

MyString str2("world"); //調用構造函數

MyString str3(str1); //調用拷貝構造函數

MyString str4(std::move(str1)); // 調用移動構造函數、

// cout << str1.get_c_str() << endl; // 此時str1的內部指針已經失效了!不要使用

//注意:雖然str1中的m_dat已經稱為了空,但是str1這個對象還活著,知道出了它的作用域才會析構!而不是move完了立刻析構

MyString str5;

str5 = str2; //調用拷貝賦值函數

MyString str6;

str6 = std::move(str2); // str2的內容也失效了,不要再使用

需要注意一下幾點:

str6 = std::move(str2),雖然將str2的資源給了str6,但是str2並沒有立刻析構,只有在str2離開了自己的作用域的時候才會析構,所以,如果繼續使用str2的m_data變量,可能會發生意想不到的錯誤。

如果我們沒有提供移動構造函數,只提供了拷貝構造函數,std::move()會失效但是不會發生錯誤,因為編譯器找不到移動構造函數就去尋找拷貝構造函數,也這是拷貝構造函數的參數是const T&常量左值引用的原因!

c++11中的所有容器都實現了move語義,move只是轉移了資源的控制權,本質上是將左值強制轉化為右值使用,以用於移動拷貝或賦值,避免對含有資源的對象發生無謂的拷貝。move對於擁有如內存、文件句柄等資源的成員的對象有效,如果是一些基本類型,如int和char[10]數組等,如果使用move,仍會發生拷貝(因為沒有對應的移動構造函數),所以說move對含有資源的對象說更有意義。

universal references(通用引用)

當右值引用和模板結合的時候,就複雜了。T&&並不一定表示右值引用,它可能是個左值引用又可能是個右值引用。例如:

template

void f( T&& param){

}

f(10); //10是右值

int x = 10; //

f(x); //x是左值

如果上面的函數模板表示的是右值引用的話,肯定是不能傳遞左值的,但是事實卻是可以。這裡的&&是一個未定義的引用類型,稱為universal references,它必須被初始化,它是左值引用還是右值引用卻決於它的初始化,如果它被一個左值初始化,它就是一個左值引用;如果被一個右值初始化,它就是一個右值引用。

注意:只有當發生自動類型推斷時(如函數模板的類型自動推導,或auto關鍵字),&&才是一個universal references。

例如:

template

void f( T&& param); //這裡T的類型需要推導,所以&&是一個 universal references

template

class Test {

Test(Test&& rhs); //Test是一個特定的類型,不需要類型推導,所以&&表示右值引用

};

void f(Test&& param); //右值引用

//複雜一點

template

void f(std::vector&& param); //在調用這個函數之前,這個vector中的推斷類型

//已經確定了,所以調用f函數的時候沒有類型推斷了,所以是 右值引用

template

void f(const T&& param); //右值引用

// universal references僅僅發生在 T&& 下面,任何一點附加條件都會使之失效

所以最終還是要看T被推導成什麼類型,如果T被推導成了string,那麼T&&就是string&&,是個右值引用,如果T被推導為string&,就會發生類似string& &&的情況,對於這種情況,c++11增加了引用摺疊的規則,總結如下:

所有的右值引用疊加到右值引用上仍然使一個右值引用。

所有的其他引用類型之間的疊加都將變成左值引用。

如上面的T& &&其實就被摺疊成了個string &,是一個左值引用。

#include

#include

#include

using namespace std;

template

void f(T&& param){

if (std::is_same::value)

std::cout << "string" << std::endl;

else if (std::is_same::value)

std::cout << "string&" << std::endl;

else if (std::is_same::value)

std::cout << "string&&" << std::endl;

else if (std::is_same::value)

std::cout << "int" << std::endl;

else if (std::is_same::value)

std::cout << "int&" << std::endl;

else if (std::is_same::value)

std::cout << "int&&" << std::endl;

else

std::cout << "unkown" << std::endl;

}

int main()

{

int x = 1;

f(1); // 參數是右值 T推導成了int, 所以是int&& param, 右值引用

f(x); // 參數是左值 T推導成了int&, 所以是int&&& param, 摺疊成 int&,左值引用

int && a = 2;

f(a); //雖然a是右值引用,但它還是一個左值, T推導成了int&

string str = "hello";

f(str); //參數是左值 T推導成了string&

f(string("hello")); //參數是右值, T推導成了string

f(std::move(str));//參數是右值, T推導成了string

}

所以,歸納一下, 傳遞左值進去,就是左值引用,傳遞右值進去,就是右值引用。如它的名字,這種類型確實很"通用",下面要講的完美轉發,就利用了這個特性。

完美轉發

所謂轉發,就是通過一個函數將參數繼續轉交給另一個函數進行處理,原參數可能是右值,可能是左值,如果還能繼續保持參數的原有特徵,那麼它就是完美的。

void process(int& i){

cout << "process(int&):" << i << endl;

}

void process(int&& i){

cout << "process(int&&):" << i << endl;

}

void myforward(int&& i){

cout << "myforward(int&&):" << i << endl;

process(i);

}

int main()

{

int a = 0;

process(a); //a被視為左值 process(int&):0

process(1); //1被視為右值 process(int&&):1

process(move(a)); //強制將a由左值改為右值 process(int&&):0

myforward(2); //右值經過forward函數轉交給process函數,卻稱為了一個左值,

//原因是該右值有了名字 所以是 process(int&):2

myforward(move(a)); // 同上,在轉發的時候右值變成了左值 process(int&):0

// forward(a) // 錯誤用法,右值引用不接受左值

}

上面的例子就是不完美轉發,而c++中提供了一個std::forward()模板函數解決這個問題。將上面的myforward()函數簡單改寫一下:

void myforward(int&& i){

cout << "myforward(int&&):" << i << endl;

process(std::forward(i));

}

myforward(2); // process(int&&):2

上面修改過後還是不完美轉發,myforward()函數能夠將右值轉發過去,但是並不能夠轉發左值,解決辦法就是藉助universal references通用引用類型和std::forward()模板函數共同實現完美轉發。例子如下:

#include

#include

#include

using namespace std;

void RunCode(int &&m) {

cout << "rvalue ref" << endl;

}

void RunCode(int &m) {

cout << "lvalue ref" << endl;

}

void RunCode(const int &&m) {

cout << "const rvalue ref" << endl;

}

void RunCode(const int &m) {

cout << "const lvalue ref" << endl;

}

// 這裡利用了universal references,如果寫T&,就不支持傳入右值,而寫T&&,既能支持左值,又能支持右值

template

void perfectForward(T && t) {

RunCode(forward (t));

}

template

void notPerfectForward(T && t) {

RunCode(t);

}

int main()

{

int a = 0;

int b = 0;

const int c = 0;

const int d = 0;

notPerfectForward(a); // lvalue ref

notPerfectForward(move(b)); // lvalue ref

notPerfectForward(c); // const lvalue ref

notPerfectForward(move(d)); // const lvalue ref

cout << endl;

perfectForward(a); // lvalue ref

perfectForward(move(b)); // rvalue ref

perfectForward(c); // const lvalue ref

perfectForward(move(d)); // const rvalue ref

}

上面的代碼測試結果表明,在universal references和std::forward的合作下,能夠完美的轉發這4種類型。

emplace_back減少內存拷貝和移動

我們之前使用vector一般都喜歡用push_back(),由上文可知容易發生無謂的拷貝,解決辦法是為自己的類增加移動拷貝和賦值函數,但其實還有更簡單的辦法!就是使用emplace_back()替換push_back(),如下面的例子:

#include

#include

#include

using namespace std;

class A {

public:

A(int i){

// cout << "A()" << endl;

str = to_string(i);

}

~A(){}

A(const A& other): str(other.str){

cout << "A&" << endl;

}

public:

string str;

};

int main()

{

vector

vec.reserve(10);

for(int i=0;i<10;i++){

vec.push_back(A(i)); //調用了10次拷貝構造函數

// vec.emplace_back(i); //一次拷貝構造函數都沒有調用過

}

for(int i=0;i<10;i++)

cout << vec[i].str << endl;

}

可以看到效果是明顯的,雖然沒有測試時間,但是確實可以減少拷貝。emplace_back()可以直接通過構造函數的參數構造對象,但前提是要有對應的構造函數。

對於map和set,可以使用emplace()。基本上emplace_back()對應push_bakc(), emplce()對應insert()。

移動語義對swap()函數的影響也很大,之前實現swap可能需要三次內存拷貝,而有了移動語義後,就可以實現高性能的交換函數了。

template

void swap(T& a, T& b)

{

T tmp(std::move(a));

a = std::move(b);

b = std::move(tmp);

}

如果T是可移動的,那麼整個操作會很高效,如果不可移動,那麼就和普通的交換函數是一樣的,不會發生什麼錯誤,很安全。

總結

由兩種值類型,左值和右值。

有三種引用類型,左值引用、右值引用和通用引用。左值引用只能綁定左值,右值引用只能綁定右值,通用引用由初始化時綁定的值的類型確定。

左值和右值是獨立於他們的類型的,右值引用可能是左值可能是右值,如果這個右值引用已經被命名了,他就是左值。

引用摺疊規則:所有的右值引用疊加到右值引用上仍然是一個右值引用,其他引用摺疊都為左值引用。當T&&為模板參數時,輸入左值,它將變成左值引用,輸入右值則變成具名的右值應用。

移動語義可以減少無謂的內存拷貝,要想實現移動語義,需要實現移動構造函數和移動賦值函數。

std::move()將一個左值轉換成一個右值,強制使用移動拷貝和賦值函數,這個函數本身並沒有對這個左值什麼特殊操作。

std::forward()和universal references通用引用共同實現完美轉發。

用empalce_back()替換push_back()增加性能。

今日的內容就到這裡啦,需要學習基礎的小夥伴可以私信我哦,回覆“資料”就可以獲取領取方式。希望大家多多評論轉發。感謝大家!


分享到:


相關文章: