人工面試題目及答案的乾貨分享

現在人工智能就業前景怎麼樣?學完人工智能相關課程好找工作嗎?目前國內人工智能領域正在高速發展,各大企業都在積極佈局人工智能技術應用。想要從事人工智能相關工作,不但要了解國內整體的發展方向。而進入企業唯有基礎才是最好的敲門磚。

人工面試題目及答案的乾貨分享

1、深度學習框架TensorFlow中有哪四種常用交叉熵?

答: tf.nn.weighted_cross_entropy_with_logits

tf.nn.sigmoid_cross_entropy_with_logits

tf.nn.softmax_cross_entropy_with_logits

tf.nn.sparse_softmax_cross_entropy_with_logits

2、什麼叫過擬合,避免過擬合都有哪些措施?

答:過擬合:就是在機器學習中,我麼測試模型的時候,提高了在訓練數據集的表現力時候,

但是在訓練集上的表現力反而下降了。

解決方案:

1.正則化 ;

2.在訓練模型過程中,調節參數。學習率不要太大;

3.對數據進行交叉驗證;

4.選擇適合訓練集合測試集數據的百分比,選取合適的停止訓練標準,使對機器的訓練在合適;

5.在神經網絡模型中,我們可以減小權重;

3、什麼是核函數?

核函數是將線性不可分的特徵隱射到高位特徵空間,從而讓支持向量機在這個高維空間線性可分,也就是使用核函數可以向高維空間映射並解決非線性的分類問題。包括線性核函數,多項式核函數,高斯核函數等,其中高斯核函數最為常用。

4、深度學習框架TensorFlow中常見的核函數都有哪些?

SVM高斯核函數,應為如果想要分割非線性數據集,改變線性分類器隱射到數據集,就要改變SVM損失函數中的核函數

線性核函數

多項式核函數

5、樸素貝葉斯方法的優勢是什麼?

樸素貝葉斯有穩定的分類效率

對於小規模的數據表現很好,能處理多分類問題,可以再數據超出內存時,去增量訓練

對缺失數據不太敏感,算法比較簡單,常用於文本分類。

6、什麼是監督學習的標準方法?

所有的迴歸算法和分類算法都屬於監督學習並且明確的給給出初始值在訓練集中有特徵和標籤,並且通過訓練獲得一個模型,在面對只有特徵而沒有標籤的數據時,能進行預測。

7、在機器學習中,模型的選擇是指什麼?

根據一組不同複雜度的模型表現,從某個模型中挑選最好的模型。選擇一個最好模型後,在新的數據上來評價其預測誤差等評價和指標。

8、圖形數據庫Neo4J的優劣勢?

優勢:1.更快的數據庫操作,前提是數據量足夠大。

2. 數據更加直觀,相應的SQL語句更加好寫。

3.更靈活,不管有什麼新的數據需要儲存,都是一律的節點,只需要考慮節點屬性和邊屬性。

4.數據庫的操作不會隨著數據庫的增大有明顯的降低。

劣勢:1.極慢的插入速度。

2.超大的節點。當一個節點的邊非常多,

有關這個節點的操作速度就會大大下降

9、LR和SVM的聯繫與區別是什麼?

都是分類算法

如果不考慮核函數,LR和SVM都是線性分類算法,也就是說他們的分類決策面都是線性的。

LR和SVM都是監督學習算法

LR和SVM的損失函數不同

SVM只考慮局部的邊界線附近的點 ,LR考慮全局,遠離的點對邊界線的確定也起作用。

10、什麼是聚類,聚類的應用場景?

聚類是指根據一定的準則,把一份事物按照這個準則歸納成互不重合的幾份,機器學習中,聚類指按照一個標準,這個標準通常是相似性,把樣本分成幾份,是得相似程度高的聚在一起,相似程度低的互相分開。

聚類的應用場景,求職信息完善(有大約10萬份優質簡歷,其中部分簡歷包含完整的字段,部分簡歷在學歷,公司規模,薪水,等字段有些置空頂。希望對數據進行學習,編碼與測試,挖掘出職位路徑的走向與規律,形成算法模型,在對數據中置空的信息進行預測。)

最後,小編想說一句話:我是一名python開發工程師,整理了一套最新的python系統學習教程,包括從基礎的python腳本到web開發、爬蟲、數據分析、數據可視化、機器學習,面試寶典。想要這些資料的可以關注小編,私信小編“01”領取資料!


分享到:


相關文章: