PHP 編程中最常見的錯誤,你犯過幾個?

問題出在哪呢?問題就在於上面的代碼混淆了返回值和返回引用。在PHP中,除非你顯示的指定返回引用,否則對於數組PHP是值返回,也就是數組的拷貝。因此上面代碼對返回數組賦值,實際是對拷貝數組進行賦值,非原數組賦值。

// getValues() returns a COPY of the $values array, so this adds a 'test' element

// to a COPY of the $values array, but not to the $values array itself.

$config->getValues()['test']='test';

// getValues() again returns ANOTHER COPY of the $values array, and THIS copy doesn't

// contain a 'test' element (which is why we get the "undefined index" message).

echo$config->getValues()['test'];

下面是一種可能的解決辦法,輸出拷貝的數組,而不是原數組:

$vals=$config->getValues();

$vals['test']='test';

echo$vals['test'];

如果你就是想要改變原數組,也就是要反回數組引用,那應該如何處理呢?辦法就是顯示指定返回引用即可:

classConfig

{

private$values=[];

// return a REFERENCE to the actual $values array

publicfunction&getValues(){

return$this->values;

}

}

$config=newConfig();

$config->getValues()['test']='test';

echo$config->getValues()['test'];

經過改造後,上面代碼將會像你期望那樣會輸出test。

我們再來看一個例子會讓你更迷糊的例子:

classConfig

{

private$values;

// using ArrayObject rather than array

publicfunction __construct(){

$this->values=newArrayObject();

}

publicfunction getValues(){

return$this->values;

}

}

$config=newConfig();

$config->getValues()['test']='test';

echo$config->getValues()['test'];

如果你想的是會和上面一樣輸出“ Undefined index”錯誤,那你就錯了。代碼會正常輸出“test”。原因在於PHP對於對象默認就是按引用返回的,而不是按值返回。

綜上所述,我們在使用函數返回值時,要弄清楚是值返回還是引用返回。PHP中對於對象,默認是引用返回,數組和內置基本類型默認均按值返回。這個要與其它語言區別開來(很多語言對於數組是引用傳遞)。

像其它語言,比如Java或C#,利用getter或setter來訪問或設置類屬性是一種更好的方案,當然PHP默認不支持,需要自己實現:

classConfig

{

private$values=[];

publicfunction setValue($key,$value){

$this->values[$key]=$value;

}

publicfunction getValue($key){

return$this->values[$key];

}

}

$config=newConfig();

$config->setValue('testKey','testValue');

echo$config->getValue('testKey');// echos 'testValue'

上面的代碼給調用者可以訪問或設置數組中的任意值而不用給與數組public訪問權限。感覺怎麼樣:)

錯誤4:在循環中執行sql查詢

在PHP編程中發現類似下面的代碼並不少見:

$models=[];

foreach($inputValuesas$inputValue){

$models[]=$valueRepository->findByValue($inputValue);

}

當然上面的代碼是沒有什麼錯誤的。問題在於我們在迭代過程中$valueRepository->findByValue()可能每次都執行了sql查詢:

$result=$connection->query("SELECT `x`,`y` FROM `values` WHERE `value`=".$inputValue);

如果迭代了10000次,那麼你就分別執行了10000次sql查詢。如果這樣的腳本在多線程程序中被調用,那很可能你的系統就掛了。。。

在編寫代碼過程中,你應該要清楚什麼時候應該執行sql查詢,儘可能一次sql查詢取出所有數據。

有一種業務場景,你很可能會犯上述錯誤。假設一個表單提交了一系列值(假設為IDs),然後為了取出所有ID對應的數據,代碼將遍歷IDs,分別對每個ID執行sql查詢,代碼如下所示:

$data=[];

foreach($idsas$id){

$result=$connection->query("SELECT `x`, `y` FROM `values` WHERE `id` = ".$id);

$data[]=$result->fetch_row();

}

但同樣的目的可以在一個sql中更加高效的完成,代碼如下:

$data=[];

if(count($ids)){

$result=$connection->query("SELECT `x`, `y` FROM `values` WHERE `id` IN (".implode(',',$ids));

while($row=$result->fetch_row()){

$data[]=$row;

}

}

錯誤5:內存使用低效和錯覺

一次sql查詢獲取多條記錄比每次查詢獲取一條記錄效率肯定要高,但如果你使用的是php中的MySQL擴展,那麼一次獲取多條記錄就很可能會導致內存溢出。

我們可以寫代碼來實驗下(測試環境: 512MB RAM、MySQL、php-cli):

// connect to mysql

$connection=newmysqli('localhost','username','password','database');

// create table of 400 columns

$query='CREATE TABLE `test`(`id` INT NOT NULL PRIMARY KEY AUTO_INCREMENT';

for($col=0;$col<400;$col++){

$query.=", `col$col` CHAR(10) NOT NULL";

}

$query.=');';

$connection->query($query);

// write 2 million rows

for($row=0;$row<2000000;$row++){

$query="INSERT INTO `test` VALUES ($row";

for($col=0;$col<400;$col++){

$query.=', '.mt_rand(1000000000,9999999999);

}

$query.=')';

$connection->query($query);

}

現在來看看資源消耗:

// connect to mysql

$connection=newmysqli('localhost','username','password','database');

echo"Before: ".memory_get_peak_usage()."\n";

$res=$connection->query('SELECT `x`,`y` FROM `test` LIMIT 1');

echo"Limit 1: ".memory_get_peak_usage()."\n";

$res=$connection->query('SELECT `x`,`y` FROM `test` LIMIT 10000');

echo"Limit 10000: ".memory_get_peak_usage()."\n";

輸出結果如下:

Before:224704

Limit1:224704

Limit10000:224704

根據內存使用量來看,貌似一切正常。為了更加確定,試著一次獲取100000條記錄,結果程序得到如下輸出:

PHPWarning:mysqli::query():(HY000/2013):

Lostconnection toMySQLserver during queryin/root/test.php on line11

這是怎麼回事呢?

問 題出在php的mysql模塊的工作方式,mysql模塊實際上就是libmysqlclient的一個代理。在查詢獲取多條記錄的同時,這些記錄會直接 保存在內存中。由於這塊內存不屬於php的內存模塊所管理,所以我們調用memory_get_peak_usage()函數所獲得的值並非真實使用內存 值,於是便出現了上面的問題。

我們可以使用mysqlnd來代替mysql,mysqlnd編譯為php自身擴展,其內存使用由php內存管理模塊所控制。如果我們用mysqlnd來實現上面的代碼,則會更加真實的反應內存使用情況:

Before:232048

Limit1:324952

Limit10000:32572912

更加糟糕的是,根據php的官方文檔,mysql擴展存儲查詢數據使用的內存是mysqlnd的兩倍,因此原來的代碼使用的內存是上面顯示的兩倍左右。

為了避免此類問題,可以考慮分幾次完成查詢,減小單次查詢數據量:

$totalNumberToFetch=10000;

$portionSize=100;

for($i=0;$i<=ceil($totalNumberToFetch/$portionSize);$i++){

$limitFrom=$portionSize*$i;

$res=$connection->query(

"SELECT `x`,`y` FROM `test` LIMIT $limitFrom, $portionSize");

}

聯繫上面提到的錯誤4可以看出,在實際的編碼過程中,要做到一種平衡,才能既滿足功能要求,又能保證性能。


分享到:


相關文章: