機器學習中的數學原理——極大似然估計_技术 _ 頭條網

在做數據挖掘建模型的時候，比如在邏輯迴歸中，我們常常使用極大似然估計、梯度下降法來求參數，那麼到底極大似然估計是什麼？在邏輯迴歸中是怎麼推導得來的呢？

什麼是極大似然估計：

極大似然估計，在大學數學系專業《概率論與數理統計》中出現的，是概率論在統計學的應用，它是參數估計的方法之一。極大似然估計是建立在這樣的思想上：隨機樣本滿足某種概率分佈，但是其中具體的參數不清楚，假設這個參數能使這個樣本出現的概率最大，所以就把這個參數作為估計的真實值。

在一個罐中隨機拿去小球，假如在一百次記錄中，有七十次是白球，那麼我們直覺會說罐中白球所佔的比例最有可能是70%。

其實這直覺的背後，我們就利用了極大似然估計

假設罐中白球的比例是p，那麼紅球的比例就是1−p。又因為每抽一個球后，又將其放回搖勻，所以每次抽出來的球服從獨立同分布

在一百次抽樣中，七十次是白球的概率是

其實還應該乘以從100中隨機抽取70白球的組合C(100,70)

即獨立發生的概率相乘，那麼要使他最大，則P值應該為多少呢，求導即可得P=0.7

邏輯迴歸中的極大似然估計

1，似然函數

我們知道，邏輯迴歸的成本函數不能像一般的迴歸模型那樣，直接是擬合值與真實值的誤差的平方。

我們假設邏輯迴歸預測函數是：y=1時，

h(x)就是邏輯迴歸模型的函數式，默認是y=1

，則y=0時，

我們可以這樣寫每個樣本隨機出現的概率函數：

剛好滿足，當y=1時

y=0時：

則樣本集概率：

每個樣本獨立同分布

這也是我們所說的似然函數

2，對數似然函數

我們對似然函數求極大值，取導數的時候太複雜了

我們對此兩邊取對數，變成連加的方式，這樣求最大值就容易許多，可以得到對數似然函數：

取導把連乘變成加和的形式，更容易求極值

對樣本觀測值

，選擇參數θ使得

求使得該樣本概率最大的θ值

則

稱為參數 θ的極大似然估計值，

注：我們可以取對數似然函數的負值作為邏輯迴歸的代價函數，再用梯度下降法求取模型參數

哎，數學公式太難寫了，手打的太累，只好去網上借些圖了，傷不起啊！

什麼是極大似然估計：

邏輯迴歸中的極大似然估計

相關文章:

項目沒數據？那是沒收藏這個80KStar項目！

性能不打折,內存佔用減少90%,Facebook提模型壓縮方法Quant-Noise

人工智能實戰項目：使用OpenCV和Python構建自己的車輛檢測模型

01 10分鐘全面搞定Anaconda的安裝和使用（windows環境）

Gitee 上最不明覺厲的項目：用代碼創造出一個人工生命

全面系統的大數據工程師必備知識與工具

百戰程序員出品這套420集的全套Python教程，進階大佬不是夢

為什麼要讓孩子學python，python風靡全球。AI？大數據？都看他！

零基礎小白怎麼學Python？Python基本概念最全圖送你

看完此文若還不能讓你完美的入門Python，我將永遠退出編程界

小白怎麼學Python？Python基本概念最全圖帶你輕鬆入門（附教程）

零基礎小白怎麼學Python？Python基本概念最全圖帶你輕鬆入門

03.05 零基礎小白怎麼學Python？Python基本概念最全圖帶你輕鬆入門

03.05 零基礎小白這麼學Python！Python的基本概念最全圖帶你輕鬆入門

零基礎小白 怎麼學Python？Python基本概念最全圖帶你輕鬆入門

02.29 零基礎小白 怎麼學Python？Python基本概念最全圖帶你輕鬆入門

02.28 零基礎小白應該怎麼學Python？Python基本概念最全圖帶你輕鬆入門

快速入行AI有訣竅 Python基礎全套視頻合集不容錯過

02.26 通過深度學習來創作自己的音樂（附代碼）

我被“拖庫”了！黑客刪庫後留下這段話

01.09 我被“拖庫”了！黑客刪庫後留下這段話

11.26 哈工大碩士生用Python 實現了 11 種經典數據降維算法，源代碼庫已開放

11.23 常用的Python幾種主動結束程序方式，學會了就是賺到（建議收藏）

Python的這8個發展方向你知道嗎？附Python全集資料

ThunderGBM：快成一道閃電的梯度提升決策樹

02.03 作為搞軟件的你，與其抖音，不如學習！

08.13 服務器性能優化的8種常用方法

簡明數據科學 第二部分：統計學習的關鍵概念

Python數據預處理：使用Dask和Numba並行化加速

第二章 IoC容器和Bean配置

運算裡不得不說的python模塊—math

Devops度量--DevOps 現狀快速檢查表

SOP是什麼（解讀）

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

DNS偵查工具

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

（必收藏系列）Linux面試題——命令集

五分鐘學會如何在 IPFS 上部署網站

「正點原子NANO STM32F103開發板資料連載」第29章 內存管理實驗

小白怎麼學Web前端開發 如何成為技術達人

如何開發一個web靜態服務器

學Java編程還有前景嗎 如何才能拿到高薪

Python網絡爬蟲之配置篇（一）

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

Python的運行效率太低？幾行代碼快速提升！

python的優點是什麼？最新Python400集視頻（附教程）

MySQL中OOM故障應如何下手-愛可生

像專家一樣使用 panic

30種不同的編程語言怎麼寫“Hello, World”

percona QAN 介紹

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

網絡工程師職業生涯中，哪兩點是最重要的？

交換機中相關術語代表什麼意思，有必要弄清楚

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

【Linux簡單實用小命令001】CentOS 7、8的防火牆端口開放

吃透這些IPFS硬核知識點，日後搶頭礦隨時“彎道超車”

Hive分桶表

Spring中資源的加載原來是這麼一回事啊！

自己動手搭建郵件系統：怎樣讓Exchange Server 發出第一封郵件？

【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫

NLP算法入門系列：隱含馬爾可夫鏈(HMM)模型的簡單介紹

第一章 Spring Framework概述

opencv人工智能深度學習這樣實現人臉的年齡檢測

嵌入式linux網絡編程之——5年程序員給你深度講解socket套接字

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

零基礎小白怎麼學Python？Python基本概念最全圖帶你輕鬆入門

02.29 零基礎小白怎麼學Python？Python基本概念最全圖帶你輕鬆入門

簡明數據科學第二部分：統計學習的關鍵概念

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

小白怎麼學Web前端開發如何成為技術達人

學Java編程還有前景嗎如何才能拿到高薪