微信上其實還有很多你不知道的事,Python微信平臺開發編寫實錄

本文主要講述如何利用Python開發微信公眾平臺。

說明:如果你是Python小白,爬蟲小白,覺得本節課程的代碼晦澀難懂。沒關係,不需要懂,按照步驟一步步操作就可以了。這一節我們主要是搭框架,幾乎沒有真正的爬蟲代碼。這些代碼和操作,你可能一生也就只用這一次。下一節,我們再講述怎麼在這個框架上擴展我們的爬蟲程序。

需要的操作:

  • 微信公眾賬號的申請。
  • 微信接口的獲取,SAE的設置等。
  • 簡單的Python爬蟲代碼編寫

需掌握的知識點:

  • 瞭解微信公眾號與雲計算平臺之間的連接關係。明確其運行機制。
  • 瞭解web.py的概念,wsgi的機制。
  • 瞭解簡單的python爬蟲知識,json解析,API調用,urllib庫函數。

自動回覆實現原理

首先了解一下,到底是什麼樣的機制能實現微信的自動回覆功能呢?(不是微信系統的自動回覆)原理就是微信平臺將用戶輸入的文字發送到雲平臺上,然後雲平臺上運行的程序捕捉到這一文字信息,就return一個結果,然後雲平臺再將該結果返回至微信平臺。最後微信平臺將返回的結果展現給用戶。用一張圖表示一下:

微信上其實還有很多你不知道的事,Python微信平臺開發編寫實錄

微信上其實還有很多你不知道的事,Python微信平臺開發編寫實錄

這一節我儘量講的細緻一些,如果仍有不清楚的,可以私信我。

首先需要兩大平臺支持:

  • 微信公眾平臺;這個申請比較簡單。只要有郵箱就可以免費申請個人版的訂閱號。不再贅述。
  • 雲計算平臺;我這裡使用的SAE(新浪的去年本來就不收費,坑爹,今年開始收費了,單純代碼託管最低一天1毛),也可以用騰訊雲。

具體步驟:

只要有郵箱就可以免費申請個人版的訂閱號。不再贅述。

SAE的申請及設置

  • 註冊登錄SAE之後,選用SAE
微信上其實還有很多你不知道的事,Python微信平臺開發編寫實錄

微信上其實還有很多你不知道的事,Python微信平臺開發編寫實錄

  • 創建新項目,SAE暫時只支持Python2.7,Python3暫時用不了。
微信上其實還有很多你不知道的事,Python微信平臺開發編寫實錄

微信上其實還有很多你不知道的事,Python微信平臺開發編寫實錄

微信上其實還有很多你不知道的事,Python微信平臺開發編寫實錄

微信上其實還有很多你不知道的事,Python微信平臺開發編寫實錄

  • 如果項目比較小,建議填寫SVN,因為可以在線編輯。如果項目比較大,就Git吧。這裡選用SVN。
微信上其實還有很多你不知道的事,Python微信平臺開發編寫實錄

微信上其實還有很多你不知道的事,Python微信平臺開發編寫實錄

  • 創建第一個版本
微信上其實還有很多你不知道的事,Python微信平臺開發編寫實錄

微信上其實還有很多你不知道的事,Python微信平臺開發編寫實錄

  • 可以開始編輯啦~
微信上其實還有很多你不知道的事,Python微信平臺開發編寫實錄

微信上其實還有很多你不知道的事,Python微信平臺開發編寫實錄

  • 編寫config.yaml和index.wsgi文件。

WSGI是PythonWeb服務器網關接口(Python Web Server Gateway Interface)。我們使用的是web.py框架。同類型比較強大的框架有Django,Flask等。為什麼選用web.py呢,是因為它是輕量級的,而且有著良好的xml解析功能。插句題外話,web.py的開發者AaronH. Swartz是個十足的天才,可惜英年早逝。有個關於他的一部紀錄片,推薦看一下:互聯網之子。

好了,言歸正傳,我們首先編寫config.yaml

name: pifuhandashu
version: 1
libraries:
- name: webpy
version: "0.36"
- name: lxml
version: "2.3.4"
...
微信上其實還有很多你不知道的事,Python微信平臺開發編寫實錄

這裡我們引入了web.py框架以及lxml模塊,接著我們編寫index.wsgi文件。

# coding: utf-8
import os
import sae
import web
from weixinInterface import WeixinInterface
urls = ('/weixin','WeixinInterface')
app_root = os.path.dirname(__file__)
templates_root = os.path.join(app_root, 'templates')
render = web.template.render(templates_root)
app = web.application(urls, globals()).wsgifunc()
application = sae.create_wsgi_app(app)
微信上其實還有很多你不知道的事,Python微信平臺開發編寫實錄

這裡就是簡單的python利用web.py網頁開發的知識了。設置了根目錄,模板目錄,/weixin的路由,開啟應用。

為了使頁面顯得更整潔,我們再新建了一個py文件weixinInterface.py(weixinInterface.py和index.wsgi在同一級目錄,見後面的截圖)。

  • 編輯weixinInterface.py,大小寫一定要看清啊,不然很容易出錯。注意自己填寫一個專屬的token,這個等會微信公眾號設置裡面有用到。
# -*- coding: utf-8 -*-
import hashlib
import web
import lxml
import time
import os
import urllib2,json
from lxml import etree
class WeixinInterface:
def __init__(self):
self.app_root = os.path.dirname(__file__)
self.templates_root = os.path.join(self.app_root, 'templates')
self.render = web.template.render(self.templates_root)
def GET(self):
#獲取輸入參數
data = web.input()
signature = data.signature
timestamp = data.timestamp
nonce = data.nonce
echostr = data.echostr
#自己的token
token = "XXXXXXXXXXX" #注意:填寫之後在微信公眾平臺裡輸入的token!!!
#字典序排序
list = [token, timestamp, nonce]
list.sort()
sha1 = hashlib.sha1()
map(sha1.update,list)
hashcode = sha1.hexdigest()
#sha1加密算法
#如果是來自微信的請求,則回覆echostr
if hashcode == signature:

return echostr
微信上其實還有很多你不知道的事,Python微信平臺開發編寫實錄

代碼大致講解一下,def __init__(self)是告訴我們模板文件的加載位置。 def GET(self)是應微信公眾平臺的要求,進行的token驗證。這裡的驗證採用的是哈希算法。具體可參考微信官方的接口接入說明:微信公眾平臺接入指南。裡面有個php示例。本文采用的是python實現。

微信上其實還有很多你不知道的事,Python微信平臺開發編寫實錄

微信上其實還有很多你不知道的事,Python微信平臺開發編寫實錄

  • 基本設置
微信上其實還有很多你不知道的事,Python微信平臺開發編寫實錄


微信上其實還有很多你不知道的事,Python微信平臺開發編寫實錄


微信上其實還有很多你不知道的事,Python微信平臺開發編寫實錄

微信上其實還有很多你不知道的事,Python微信平臺開發編寫實錄

  • 修改配置
微信上其實還有很多你不知道的事,Python微信平臺開發編寫實錄

微信上其實還有很多你不知道的事,Python微信平臺開發編寫實錄

URL一定要認真填寫,仔細核對。

比如查看url應用信息:

微信上其實還有很多你不知道的事,Python微信平臺開發編寫實錄

微信上其實還有很多你不知道的事,Python微信平臺開發編寫實錄

微信上其實還有很多你不知道的事,Python微信平臺開發編寫實錄

token填寫剛才新浪SAE裡面填寫的token,一定要一致。EncodingAESKey可以隨機生成。填完之後點擊提交。如果提示“提交成功”。恭喜你,最關鍵的一步已經完成了。這個階段可能要折騰蠻長時間。完成之後,一定要啟用開發者模式!!!!切記!!!

上一步完成之後,我們就可以做一些有趣的事情:微信機器人。不過在此之前,還要完成一小步:模板的創建。由於微信開發是採用的xml的形式。為了先實現文本形式自動回覆(後面可以實現回覆音頻,圖文信息等形式),首先新建模板文件夾templates,然後在templates文件夾下創建reply_text.xml文件(文件放置位置見後面的截圖)。根據微信消息被動回覆所示,填入以下代碼:

$def with (toUser,fromUser,createTime,content)

<tousername>
<fromusername>
<createtime>$createTime/<createtime>
<msgtype>
<content>$content/<content>

微信上其實還有很多你不知道的事,Python微信平臺開發編寫實錄

然後,在weixinInterface.py裡的def GET(self)後面編寫POST函數。該函數用來獲取用戶的ID,發送的消息類型,發送的時間等。判斷用戶發送的消息類型,如果是純文本類型,if mstype == 'text',那麼可以進行下一步操作。

def POST(self):
str_xml = web.data() #獲得post來的數據
xml = etree.fromstring(str_xml)#進行XML解析
mstype = xml.find("MsgType").text#消息類型
fromUser = xml.find("FromUserName").text
toUser = xml.find("ToUserName").text
微信上其實還有很多你不知道的事,Python微信平臺開發編寫實錄

微信上其實還有很多你不知道的事,Python微信平臺開發編寫實錄

微信上其實還有很多你不知道的事,Python微信平臺開發編寫實錄

為了實現微信機器人,我們需要實現自動回覆的內容。這裡有兩種方式。

  • 爬取網上的機器人回覆的內容,比如找不到小黃雞的接口,我就自己爬蟲爬取它的回覆結果。
  • 調用自動能夠回覆的機器人API。

這裡我選用第二種方法,採用的是圖靈機器人的API。這種方法方便快捷,一般不會被牆。但是自由度不高,可拓展性差。

註冊圖靈機器人賬號,注意是採用圖靈的網頁api,而不是授權。獲取圖靈機器人回覆的key。幾行代碼就可以搞定微信機器人自動回覆啦~

源碼展示

index.wsgi源碼

# coding: utf-8
import os
import sae
import web
from weixinInterface import WeixinInterface
urls = (
'/weixin','WeixinInterface',
)

app_root = os.path.dirname(__file__)
templates_root = os.path.join(app_root, 'templates')
render = web.template.render(templates_root)
app = web.application(urls, globals()).wsgifunc()
application = sae.create_wsgi_app(app)
微信上其實還有很多你不知道的事,Python微信平臺開發編寫實錄

config.yaml源碼

name: myzhihu
version: 1
libraries:
- name: webpy
version: "0.36"
- name: lxml
version: "2.3.4"
...
微信上其實還有很多你不知道的事,Python微信平臺開發編寫實錄

templates下的reply_text.xml源碼

$def with (toUser,fromUser,createTime,content)

<tousername>
<fromusername>
<createtime>$createTime/<createtime>
<msgtype>
<content>$content/<content>

微信上其實還有很多你不知道的事,Python微信平臺開發編寫實錄

weixinInterface.py源碼

# -*- coding: utf-8 -*-
import hashlib
import web
import lxml
import time
import os
import json
import urllib
from lxml import etree
class WeixinInterface:
def __init__(self):
self.app_root = os.path.dirname(__file__)
self.templates_root = os.path.join(self.app_root, 'templates')
self.render = web.template.render(self.templates_root)
def GET(self):
#獲取輸入參數
data = web.input()
signature=data.signature
timestamp=data.timestamp
nonce=data.nonce
echostr=data.echostr
#自己的token
token="################" #這裡填寫在微信公眾平臺裡輸入的token
#字典序排序
list=[token,timestamp,nonce]
list.sort()
sha1=hashlib.sha1()
map(sha1.update,list)
hashcode=sha1.hexdigest()
#sha1加密算法
#如果是來自微信的請求,則回覆echostr
if hashcode == signature:
return echostr

def POST(self):
str_xml = web.data() #獲得post來的數據
xml = etree.fromstring(str_xml)#進行XML解析
mstype = xml.find("MsgType").text
fromUser = xml.find("FromUserName").text
toUser = xml.find("ToUserName").text

if mstype == 'text':
content = xml.find("Content").text#獲得用戶所輸入的內容
key = '#####################' ###圖靈機器人的key
api = 'http://www.tuling123.com/openapi/api?key=' + key + '&info='
info = content.encode('UTF-8')
url = api + info
page = urllib.urlopen(url)
html = page.read()
dic_json = json.loads(html)
reply_content = dic_json['text']
return self.render.reply_text(fromUser,toUser,int(time.time()),reply_content)
微信上其實還有很多你不知道的事,Python微信平臺開發編寫實錄

微信上其實還有很多你不知道的事,Python微信平臺開發編寫實錄

微信上其實還有很多你不知道的事,Python微信平臺開發編寫實錄

尾記

本次教程實現了利用Python開發微信公眾平臺,能夠自動回覆用戶輸入的文字。包括了微信公眾平臺的設置,SAE的設置,相關代碼的編寫等。

最後我是一名高級python開發工程師,這裡有我自己整理了一套最新的python系統學習教程,包括從基礎的python腳本到web開發、爬蟲、數據分析、數據可視化、機器學習等。想要這些資料的

可以關注並在後臺私信:“01”即可領取。


分享到:


相關文章: