XSS語義分析的階段性總結（二）技术頭條網

XSS語義分析的階段性總結（二）

前言

上次分享了javascript語義分析，並且簡單介紹了新型xss掃描器的一些想法，如何在不進行大量fuzz的情況下又能準確的檢測出xss漏洞，這其中我們又可以儘量的避免觸發waf的xss防護功能！

首先先接著上文介紹一下html語義分析的方法。

掃描思路

HTML語義分析

如果把html語義分析看為對html結構的解析與識別，在python中我們可以使用HTMLParser，對，又是python幫我解決了難題。在XSStrike裡面同樣使用了自定義的HTMLParser進行漏洞的輔助識別。

我們可以通過繼承HTMLParser並重載其方法來實現我們需要的功能

下面是簡單的 HTML 解析器的一個基本示例，使用 HTMLParser 類，當遇到開始標記、結束標記以及數據的時候將內容打印出來

<code>
class MyHTMLParser(HTMLParser):
    def handle_starttag(self, tag, attrs):
        print("Encountered a start tag:", tag)

    def handle_endtag(self, tag):
        print("Encountered an end tag :", tag)

    def handle_data(self, data):
        print("Encountered some data  :", data)

parser = MyHTMLParser()
parser.feed('<title>Test/<title>'
            'Parse me!
')/<code>

我們需要定義一個我們自己的HTML解析器來處理我們的標籤，標識出來script標籤，html註釋，html標籤，屬性，css等等

部分代碼如下

尋找反射點的思路和js的類似，通過遍歷標籤來來解析html結構，tagname代表標籤名，attibutes代表屬性，content代表數據內容，#comment代表註釋，每個標籤被封裝為字典形式的列表元素

使用以下的demo

<code>
    
    
    
    
    
    <textarea>flag{111222}/<textarea>kkk
    
ffff<aaaaa>bb
    
        
    
    /<aaaaa>/<code>

分享到:

閱讀更多 合天網安實驗室 的文章

關鍵字: 掃描儀 JSON CSS

XSS語義分析的階段性總結（二）

前言

掃描思路

HTML語義分析

Parse me!

相關文章:

知識圖譜分佈式表達與應用

第二章 IoC容器和Bean配置

運算裡不得不說的python模塊—math

Devops度量--DevOps 現狀快速檢查表

SOP是什麼（解讀）

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

DNS偵查工具

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

（必收藏系列）Linux面試題——命令集

五分鐘學會如何在 IPFS 上部署網站

「正點原子NANO STM32F103開發板資料連載」第29章 內存管理實驗

小白怎麼學Web前端開發 如何成為技術達人

如何開發一個web靜態服務器

學Java編程還有前景嗎 如何才能拿到高薪

Python網絡爬蟲之配置篇（一）

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

Python的運行效率太低？幾行代碼快速提升！

python的優點是什麼？最新Python400集視頻（附教程）

MySQL中OOM故障應如何下手-愛可生

像專家一樣使用 panic

30種不同的編程語言怎麼寫“Hello, World”

percona QAN 介紹

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

網絡工程師職業生涯中，哪兩點是最重要的？

交換機中相關術語代表什麼意思，有必要弄清楚

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

【Linux簡單實用小命令001】CentOS 7、8的防火牆端口開放

吃透這些IPFS硬核知識點，日後搶頭礦隨時“彎道超車”

Hive分桶表

Spring中資源的加載原來是這麼一回事啊！

自己動手搭建郵件系統：怎樣讓Exchange Server 發出第一封郵件？

【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫

NLP算法入門系列：隱含馬爾可夫鏈(HMM)模型的簡單介紹

第一章 Spring Framework概述

opencv人工智能深度學習這樣實現人臉的年齡檢測

嵌入式linux網絡編程之——5年程序員給你深度講解socket套接字

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

Redis內存分析工具--rdr安裝與使用

資深架構師教你源碼講解zookeeper實現分佈式鎖以及集群搭建步驟

一行代碼提升遷移性能

利用相似幾何信息，做可泛化3D形狀分割模型

這麼好用的開源計算器SpeedCrunch，沒有不嘗試一下的道理

分佈式緩存，真香

特徵工程的力量

java架構：天天寫面向接口編程，你考慮過性能嗎？大神都是這麼寫

SpringBoot如何優雅的使用RocketMQ

css代碼規範工具stylelint

現在的孩子初中，高中，大學都在學校住，大家感覺每月分別給多少生活費是合理的？

星際爭霸2怎麼玩？升到91級後還有什麼用？

男生真的喜歡一個女生會是什麼樣子呢？

王者榮耀：魯班加強引起諸多玩家不滿，此消彼長的射手強度令用戶堪憂，你如何評價？

疫情中受損最嚴重的商品是什麼？

有一個小我幾歲的男孩說喜歡我，我該怎麼辦？

一個學弟對你像男朋友一樣，卻總是叫姐，請問這是什麼心理？

問一下，1600左右或者以下的手機哪種好？

“你不在時我和你對話，你在時我和自己對話”，如何理解這句話？

愛因斯坦

氣溫回升，要種玉米了，地裡的蠐螬、土蠶啃食玉米苗，咋防治？

C語言的一些宏後面會加零，define n+0，為什麼要加零呢？有什麼意義？

工作中遇到不公平的事，是改變不了的事，應如何調節自己的心情？

“有錢才是真的有面子，臉皮厚能賺錢”你同意這句話嗎？為什麼？

高糖孕婦生下的孩子健康嗎？

羊肚菌是煲湯還是炒菜好？

為什麼歷史上唯一的女皇帝會出現在唐朝？

從技術分析角度來看，此前WTI原油在19美元附近的低點，會是近期的低點嗎？

在鄭州怎麼把自己的一房一廳做成短租公寓？

為什麼高中英語書後面有聽力，且不少老師都不講？

為什麼好像大多數人都無法接受電子音樂？

在孕期您有持續保持護膚與化妝的習慣嗎？

穿越火線手遊為什麼玩了很久，還是感覺自己技術很菜，110級？

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

小白怎麼學Web前端開發如何成為技術達人

學Java編程還有前景嗎如何才能拿到高薪