PHP 沒有真正的數組

PHP 沒有真正的數組

@程序員,一文搞懂 PHP 數組的真正用法。

PHP 没有真正的数组

作者 | Jeremy Ruten

出品 | CSDN(ID:CSDNnews)

PHP的數組非常多變。你可以把它當作映射使用,也可以當作集合使用,甚至可以當作數據對象使用……如果你很勇敢,甚至可以把它當作數組使用!

似乎將PHP數組當作傳統的數組(即一個擁有從0開始的整數索引列表)是一件很危險的事情,其中到處都是陷阱,還很容易製造出bug。這一切的原因都是因為PHP的數組並不是真正的數組。

我們來看看這究竟是怎麼回事。下面是一個PHP的小問題:下列程序的輸出是什麼?

<code>$letters = ['d', 'c', 'a', 'b', 'e'];
$sorted = $letters;
natsort($sorted);
print $sorted[0];
/<code>

答案是:它會輸出d!

這段代碼的本意是輸出按字母排序後的第一個字符串,應該是a。但$sorted[0]的意思並不是“數組中的第一個元素”。它的意思是“查找鍵0然後返回該鍵的元素”。

在PHP中,數組實際上是映射(即關聯數組),它有鍵和值。當你使用下面的代碼創建數組時,

<code>$ary = ['a', 'b', 'c'];/<code>

實際的操作其實是:

<code>$ary = [0 => 'a', 1 => 'b', 2 => 'c'];/<code>

PHP會給每個元素指定一個整數鍵,從0開始依次排列,因此在許多方面這個數組的行為跟傳統的數組很相似。

下面,我們嘗試一下鍵的順序:

<code>$ary = [1 => 'b', 2 => 'c', 0 => 'a'];
print $ary[0]; // 'a'
print $ary[1]; // 'b'
print $ary[2]; // 'c'
// Prints: b c a
foreach ($ary as $letter) {
print $letter;
}
// Prints: 1:b 2:c 0:a
foreach ($ary as $key => $letter) {
print "$key:$letter";
}/<code>

如果通過鍵來訪問數組,那麼其行為跟傳統數組很相似。但在迭代數組時,它就不會關心鍵的順序,而是按照數組元素定義的順序:b,c,a。

所以,所有PHP數組都有鍵和值,但這些鍵值對還有特定的順序。換句話說:“PHP數組實際上是有序的映射。”

回到第一個示例:natsort改變了鍵值對的順序,但沒有改變實際的鍵:

<code>$letters = ['d', 'c', 'a', 'b', 'e'];
$sorted = $letters;
natsort($sorted);
print_r($letters); // [0 => 'd', 1 => 'c', 2 => 'a', 3 => 'b', 4 => 'e']
print_r($sorted); // [2 => 'a', 3 => 'b', 1 => 'c', 0 => 'd', 4 => 'e']
print $sorted[0]; // 'd'/<code>

如果$sorted[0]不會訪問數組中的第一個元素,那麼怎樣才能訪問第一個元素呢?或者說,怎樣才能訪問前三個元素呢?方法有以下幾種。

PHP 没有真正的数组

array_values

你可以通過array_values給數組“重新編號”。它會返回一個數組,其值與傳入的數組相同,但鍵從零開始重新排列:

<code>$sorted = [2 => 'a', 3 => 'b', 1 => 'c', 0 => 'd', 4 => 'e'];
$sorted = array_values($sorted);
print $sorted[0]; // 'a'
print $sorted[1]; // 'b'
print $sorted[2]; // 'c'/<code>
PHP 没有真正的数组

array_slice

通常,利用索引訪問PHP數組時,我們實際上查找的是一個鍵。但array_slice是一個例外——傳入的索引實際上是數組內部的位置,而不是鍵。

<code>$sorted = [2 => 'a', 3 => 'b', 1 => 'c', 0 => 'd', 4 => 'e'];
$first_three = array_slice($sorted, 0, 3);

print $first_three[0]; // 'a'
print $first_three[1]; // 'b'
print $first_three[2]; // 'c'/<code>

這種做法的一個陷阱就是它依然會保留字符串鍵,這一點與array_values不同。

PHP 没有真正的数组

reset、next及其他

PHP中的每個數組都有一個內部指針,可以用來迭代數組。reset將內部指針重置到數組的開頭。next將指針前進到下一個鍵值對。還有prev、key、current和end。這些低階API很難看,但能讓你理解PHP數組真正的工作原理:

<code> 
$sorted = [2 => 'a', 3 => 'b', 1 => 'c', 0 => 'd', 4 => 'e'];
// start at the beginning
print reset($sorted); // 'a'
print key($sorted); // 2
print current($sorted); // 'a'
// advance forward
print next($sorted); // 'b'
print key($sorted); // 3
print current($sorted); // 'b'
// advance forward
print next($sorted); // 'c'
print key($sorted); // 1
print current($sorted); // 'c'
// jump to the end
print end($sorted); // 'e'
print key($sorted); // 4
print current($sorted); // 'e'
// there is no next element, so this returns
print next($sorted);/<code>

你幾乎永遠不需要使用這些函數,但有時候可以使用reset來方便地獲取數組的第一個值,或者用end獲取最後一個值。

PHP 没有真正的数组

Laravel的collect

Laravel有一個非常好用的collections類,該類已被提取到一個獨立的函數庫中。我們的工作中就在使用這個函數庫。

它提供了first和last方法來獲取數組的第一個和最後一個元素,以及take方法獲取前N個元素。

<code>$sorted = [2 => 'a', 3 => 'b', 1 => 'c', 0 => 'd', 4 => 'e'];
print collect($sorted)->first; // 'a'
print collect($sorted)->last; // 'e'
print_r(collect($sorted)->take(3)->all); // [2 => 'a', 3 => 'b', 1 => 'c']/<code>

注意take會保留數組中的鍵。許多PHP數組函數都接受一個可選的參數$preserve_keys。而這個collections函數庫在封裝PHP數組函數時,幾乎永遠都會給這個參數傳遞true,所以可以認為使用該函數庫時,鍵一直都被保留。

PHP 没有真正的数组

使用PHP數組的幾個建議

下面是我在使用PHP數組時總結的一些心得:

時刻小心$ary[0]

每當你看到數組索引為0時,就應該知道這段代碼很可能在將PHP數組當作傳統數組處理。通常這種假設是不安全的,特別是當數組是從其他地方傳遞過來的情況下。0也許並不是數組中的第一個鍵,甚至可能根本不存在(例如在執行了array_filter()之後)。

除非是你自己創建的數組,否則應該使用reset($ary)或者庫函數,比如collect($ary)->first方法。

考慮對數組重新編號

$ary[0]問題也可以通過另一種方式解決:每當給其他函數傳遞數組時,確保它的鍵像傳統數組一樣。通常這意味著在執行array_filter或者任何可能刪除鍵或改變鍵的順序的函數之後需要調用array_values。

你可以說,利用array_values反覆“修正”數組違反了數組本身的性質。或許,我們不應該讓PHP數組表現得像傳統數組,而是應該接受PHP數組的性質,寫代碼時不要對數組的鍵做出假設。然而新手很可能會認為PHP數組像傳統數組一樣。

上面兩點遵循了健壯性原則:“發送時要保守,接收時要自由。”

比較數組時,鍵很重要,但順序不重要

像assertEquals(['a', 'b'], array_filter(['a', , 'b']))之類的比較會失敗,因為[0 => 'a', 1 => 'b']並不等於[0 => 'a', 2=> 'b']!它們的鍵必須一樣才行。

相反,assertEquals($ary, collect($ary)->sort->all)永遠為真,因為對於==來說,鍵值對的順序並不重要。例如,[0 => 'a', 1 => 'b'] == [1 => 'b', 0 => 'a']為真。

將數組當作映射使用

假設你有一個$users_by_id數組,其中$users_by_id[32]會查找id為32的User。那麼,如果使用array_map(function ($user) { return $user->getName; })來映射該數組,則會得到一個name的數組,其鍵為user id,因為array_map並不會改變數組的鍵。在這種情況下保留鍵非常有用,所以當需要映射時,你應該避免使用可能導致數組重新編號的函數。

將數組當作有序映射使用

可以對$users_by_id數組進行排序,然後利用它:(1)根據id查找用戶;(2)按照特定順序遍歷所有用戶。利用這個技巧,就不需要像某些其他語言那樣,僅僅為了跟蹤順序而維護一個單獨的id數組。

指示數組的類型

PHP數組造成的許多混亂都是因為它試圖將一種數據結構用於兩種目的。儘管PHP的類型系統不會區別傳統數組和映射,但我們應該區分。由於缺少合適的類型系統,我們應當使用變量命名規則來指示類型。例如,傳統數組通常用複數形式,如$users,而映射通常以“by x”結尾,如$users_by_id。

PHP 没有真正的数组

總結

思維模型非常重要。我曾經把PHP數組只當作鍵值對的集合,但後來我意識到,數組實際上是鍵值對的有序列表,這時我才真正理解了PHP數組。

關於PHP文檔中的數組和數組函數的怪異行為還有許多需要學習的地方,我發現有了正確的思維模型才能理解這些怪異的行為!

原文:https://medium.com/7shifts-engineering-blog/php-arrays-arent-really-arrays-57b627a1e46a

本文為 CSDN 翻譯,轉載請註明來源出處。

【END】


分享到:


相關文章: