路透社文章的文本數據分析與可視化

2021-03-24 20:29:43 佚名

當我要求你解釋文本數據時，你會怎麼做？你將採取什麼步驟來構建文本可視化？

本文將幫助你獲得構建可視化和解釋文本數據所需的信息。

從文本數據中獲得的見解將有助於我們發現文章之間的聯繫。它將檢測趨勢和模式。對文本數據的分析將排除噪音，發現以前未知的信息。

這種分析過程也稱為探索性文本分析(ETA)。運用K-means、Tf-IDF、詞頻等方法對這些文本數據進行分析。此外，ETA在數據清理過程中也很有用。

我們還使用Matplotlib、seaborn和Plotly庫將結果可視化到圖形、詞雲和繪圖中。

在分析文本數據之前，請完成這些預處理任務。

從數據源檢索數據

有很多非結構化文本數據可供分析。你可以從以下來源獲取數據。

來自Kaggle的Twitter文本數據集。
Reddit和twitter數據集使用API。
使用Beautifulsoup從網站上獲取文章、。

我將使用路透社的SGML格式的文章。為了便於分析，我將使用beauthoulsoup庫從數據文件中獲取日期、標題和文章正文。

使用下面的代碼從所有數據文件中獲取數據，並將輸出存儲在單個CSV文件中。

<code>from
 bs4 import BeautifulSoup
import
 pandas as pd
import csv

article_dict = {}
i = 0
list_of_data_num = []

for
 j in
 range(0
,22):
    if
 j 10:
        list_of_data_num.append("00" + str(j))
    else:
        list_of_data_num.append("0" + str(j))

 
for
 num in list_of_data_num:
    try:
        soup = BeautifulSoup(open("data/reut2-"
 + num + ".sgm"
), features='lxml')
    except 
:
        continue
    print(num)
    data_reuters = soup.find_all('reuters')
    for
 data in data_reuters:
        article_dict[i] = {}
        for
 date in
 data.find_all('date'):
            try:
                article_dict[i]["date"
] = str(date.contents[0]).strip()
            except:
                article_dict[i]["date"
] = None
             
        for
 title in
 data.find_all('title'):
            article_dict[i]["title"
] = str(title.contents[0]).strip()
             
        for
 text in
 data.find_all('text'):
            try:
                article_dict[i]["text"
] = str(text.contents[4]).strip()
            except 
:
                article_dict[i]["text"
] = None
        i += 1


dataframe_article = pd.DataFrame(article_dict).T
dataframe_article.to_csv('articles_data.csv'
, header=True
, index=False, quoting=csv.QUOTE_ALL)
print(dataframe_article)
/<code>

還可以使用Regex和OS庫組合或循環所有數據文件。
每篇文章的正文以開頭，因此使用find_all('reuters')。
你也可以使用pickle模塊來保存數據，而不是CSV。

清洗數據

在本節中，我們將從文本數據中移除諸如空值、標點符號、數字等噪聲。首先，我們刪除文本列中包含空值的行。然後我們處理另一列的空值。

<code>import pandas as pd import re

articles_data = pd.read_csv(‘articles_data.csv’) print(articles_data.apply(lambda x: sum(x.isnull()))) articles_nonNull = articles_data.dropna(subset=[‘text’]) articles_nonNull.reset_index(inplace=True)

def clean_text(text):

‘’’Make text lowercase, remove
 text in
 square brackets,remove
 \n,remove
 punctuation and 
 remove words containing numbers.’’’

    text = str(text).lower()
    text = re.sub(‘+’, ‘’, text)
    text = re.sub
(‘[%s]’ % re.escape(string.punctuation), ‘’, text)
    text = re.sub(‘\n’, ‘’, text)
    text = re.sub(‘\w*\d\w*’, ‘’, text)
    return text

articles_nonNull[‘text_clean’]=articles_nonNull[‘text’]\
                                  .apply(lambda x:clean_text(x))
/<code>

當我們刪除文本列中的空值時，其他列中的空值也會消失。
我們使用re方法去除文本數據中的噪聲。

數據清理過程中採取的步驟可能會根據文本數據增加或減少。因此，請仔細研究你的文本數據並相應地構建clean_text()方法。

隨著預處理任務的完成，我們將繼續分析文本數據。

讓我們從分析開始。

1.路透社文章篇幅

我們知道所有文章的篇幅不一樣。因此，我們將考慮長度等於或超過一段的文章。根據研究，一個句子的平均長度是15-20個單詞。一個段落應該有四個句子。

<code>articles_nonNull[‘word_length’] = articles_nonNull[‘text’].apply(lambda x: len(str(x).split())) print(articles_nonNull.describe())

articles_word_limit = articles_nonNull[articles_nonNull[‘word_length’] > 60]

plt.figure(figsize=(12
,6)) 
p1=sns.kdeplot(articles_word_limit[‘word_length’], shade=True, color=”r”).set_title(‘Kernel Distribution of Number Of words’)
/<code>

我刪除了那些篇幅不足60字的文章。
字長分佈是右偏的。
大多數文章有150字左右。
包含事實或股票信息的路透社文章用詞較少。

2.路透社文章中的常用詞

在這一部分中，我們統計了文章中出現的字數，並對結果進行了分析。我們基於N-gram方法對詞數進行了分析。N-gram是基於N值的單詞的出現。

我們將從文本數據中刪除停用詞。因為停用詞是噪音，在分析中沒有太大用處。

1最常見的單字單詞(N=1)

讓我們在條形圖中繪製unigram單詞，併為unigram單詞繪製詞雲。

<code>from gensim.parsing.preprocessing 
import remove_stopwords                       
import genism                                                  
from
 wordcloud import 
 WordCloud                                   
import
 numpy as np                                           
import random                                              

 
 
gensim_stopwords = gensim.parsing.preprocessing.STOPWORDS               
stopwords_list = list(set(gensim_stopwords))                               
stopwords_update = ["mln"
, "vs"
,"cts"
,"said"
,"billion"
,"pct"
,"dlrs"
,"dlr"]                      
stopwords = stopwords_list + stopwords_update
articles_word_limit['temp_list'
] = articles_word_limit['text_clean'
].apply(lambda x:str(x).split())

 
def
 remove_stopword
(x)
:
    return
 [word for
 word in
 x if
 word not
 in stopwords]
articles_word_limit['temp_list_stopw' 
] = articles_word_limit['temp_list'
].apply(lambda x:remove_stopword(x))

 
def
 generate_ngrams
(text, n_gram=
1
)
:
    ngrams = zip(*[text[i:] for
 i in range(n_gram)])
    return
 [' '
.join(ngram) for
 ngram in ngrams]


article_unigrams = defaultdict(int)
for
 tweet in
 articles_word_limit['temp_list_stopw']:
    for
 word in generate_ngrams(tweet):
        article_unigrams[word] += 1

article_unigrams_df = pd.DataFrame(sorted(article_unigrams.items(), key=lambda
 x: x[1
])[::-1])
N=50

 
fig, axes = plt.subplots(figsize=(18
, 50 
))
plt.tight_layout()
sns.barplot(y=article_unigrams_df[0
].values[:N], x=article_unigrams_df[1
].values[:N], color='red')
axes.spines['right'
].set_visible(False)
axes.set_xlabel('')
axes.set_ylabel('')
axes.tick_params(axis='x'
, labelsize=13)
axes.tick_params(axis='y'
, labelsize=13)
axes.set_title(f'Top 
{N}
 most common unigrams in Reuters Articles'
, fontsize=15)
plt.show()


 
def
 col_func
(word, font_size, position, orientation, font_path, random_state)
:
    colors = ['#b58900'
, '#cb4b16'
, '#dc322f'
, '#d33682'
, '#6c71c4',
              '#268bd2'
, '#2aa198' 
, '#859900']
    return random.choice(colors)
fd = {
    'fontsize'
: '32',
    'fontweight'
 : 'normal',
    'verticalalignment'
: 'baseline',
    'horizontalalignment'
: 'center',
}
wc = WordCloud(width=2000
, height=1000
, collocations=False,
               background_color="white",
               color_func=col_func,
               max_words=200,
               random_state=np.random.randint(1
, 8)) .generate_from_frequencies(article_unigrams)
fig, ax = plt.subplots(figsize=(20
,10))
ax.imshow(wc, interpolation='bilinear')
ax.axis("off")
ax.set_title(‘Unigram Words of Reuters Articles’, pad=24, fontdict=fd)
plt.show()
/<code>

Share, trade, stock是一些最常見的詞彙，它們是基於股票市場和金融行業的文章。

因此，我們可以說，大多數路透社文章屬於金融和股票類。

2.最常見的Bigram詞(N=2)

讓我們為Bigram單詞繪製條形圖和詞雲。

<code>article_bigrams
 =  
defaultdict(int)
for
 tweet in articles_word_limit[‘temp_list_stopw’]:
    for
 word in generate_ngrams(tweet, n_gram=2):
          += 1

df_article_bigrams
=pd.DataFrame(sorted(article_bigrams.items(),
                                key
=lambda x: x[1])[::-1])

N
=50
 
  axes = plt.subplots(figsize=(18, 50), dpi=100)
plt.tight_layout()
 =df_article_bigrams[0].values[:N],
            x
=df_article_bigrams[1].values[:N], 
            color
=’red’)
axes.spines[‘right’].set_visible(False)
axes.set_xlabel(‘’)
axes.set_ylabel(‘’)
 =’x’, labelsize=13)
 =’y’, labelsize=13)
  {N} most common Bigrams in Reuters Articles’,
                
fontsize
=15)
plt.show()
 
wc
 = WordCloud(width=2000, height=1000, collocations=False,
               background_color
=”white”,
               color_func
=col_func,
               max_words
=200,
               random_state
=np.random.randint(1,8))\
               .generate_from_frequencies(article_bigrams)

  ax = plt.subplots(figsize=(20,10))
  interpolation=’bilinear’)
ax.axis(“off”)
  Words of Reuters Articles’, pad=24,
             fontdict
=fd)
plt.show()
/<code>

Bigram比unigram提供更多的文本信息和上下文。比如，share loss顯示：大多數人在股票上虧損。

3.最常用的Trigram詞

讓我們為trigma單詞繪製條形圖和詞雲。

<code>article_trigrams
 = defaultdict(int)
for
 tweet in articles_word_limit[‘temp_list_stopw’]: 

    for
 word in generate_ngrams(tweet, n_gram=3):
          += 1
df_article_trigrams
 = pd.DataFrame(sorted(article_trigrams.items(),
                                   key
=lambda x: x[1])[::-1])

N
=50
 
  axes = plt.subplots(figsize=(18, 50), dpi=100)
plt.tight_layout()
 =df_article_trigrams[0].values[:N],
            x
=df_article_trigrams[1].values[:N], 
            color
=’red’)
axes.spines[‘right’].set_visible(False)
axes.set_xlabel(‘’)
axes.set_ylabel(‘’)
 =’x’, labelsize=13)
 =’y’, labelsize=13)
  {N} most common Trigrams in Reuters articles’,
               fontsize
=15)
plt.show() 

 
wc
 = WordCloud(width=2000, height=1000, collocations=False,
background_color
=”white”,
color_func
=col_func,
max_words
=200,
random_state
=np.random.randint(1,8)).generate_from_frequencies(article_trigrams)
  ax = plt.subplots(figsize=(20,10))
  interpolation=’bilinear’)
ax.axis(“off”)
  Words of Reuters Articles’, pad=24,
             fontdict
=fd)
plt.show()
/<code>

大多數的三元組都與雙元組相似，但無法提供更多信息。所以我們在這裡結束這一部分。

3.文本數據的命名實體識別(NER)標記

NER是從文本數據中提取特定信息的過程。在NER的幫助下，我們從文本中提取位置、人名、日期、數量和組織實體。在這裡瞭解NER的更多信息。我們使用Spacy python庫來完成這項工作。

<code>import spacy    
from matplotlib import cm
from matplotlib.pyplot import plt

nlp = spacy.load('en_core_web_sm')
ner_collection = {"Location"
:[],"Person"
:[],"Date"
:[],"Quantity"
:[],"Organisation":[]}
location = []
person = []
date = []
quantity = []
organisation = []
def
 ner_text(text):
    doc = nlp(text)
    ner_collection = {"Location"
:[],"Person"
:[],"Date"
:[],"Quantity"
:[],"Organisation":[]}
    for
 ent in doc.ents:
        if
 str
(ent.label_) == "GPE":
            ner_collection['Location'].append(ent.text)
            location.append(ent.text)
        elif str
(ent.label_) == "DATE":
            ner_collection['Date'].append(ent.text)
            person.append(ent.text)
        elif str 
(ent.label_) == "PERSON":
            ner_collection['Person'].append(ent.text)
            date.append(ent.text)
        elif str
(ent.label_) == "ORG":
            ner_collection['Organisation'].append(ent.text)
            quantity.append(ent.text)
        elif str
(ent.label_) == "QUANTITY":
            ner_collection['Quantity'].append(ent.text)
            organisation.append(ent.text)
        else:
            continue
    return ner_collection
   articles_word_limit['ner_data'
] = articles_word_limit['text'].map(lambda x: ner_text(x))

location_name = []
location_count = []
for
 i in
 location_counts.most_common()[:10]:
    location_name.append(i[0].upper())
    location_count.append(i[1])


fig, ax = plt.subplots(figsize=(15
, 8
), dpi=100)
ax.barh(location_name, location_count, alpha=0.7,
          
        color=cm.Blues([i / 0.00525
 for
 i in
 [ 0.00208 
, 0.00235
, 0.00281
, 0.00317
, 0.00362,
                                              0.00371
, 0.00525
, 0.00679
, 0.00761
, 0.00833]])
        )
plt.rcParams.update({'font.size'
: 10})
rects = ax.patches
for
 i, label in enumerate(location_count):
    ax.text(label+100
 , i, str
(label), size
=10
, ha='center'
, va='center')
ax.text(0
, 1.02
, 'Count of Location name Extracted from Reuters Articles', 
        transform=ax.transAxes, size
=12
, weight=600 
, color='#777777')
ax.xaxis.set_ticks_position('bottom')
ax.tick_params(axis='y'
, colors='black'
, labelsize=12)
ax.set_axisbelow(True)
ax.text(0
, 1.08
, 'TOP 10 Location Mention in Reuters Articles',
        transform=ax.transAxes, size
=22
, weight=600
, ha='left')
ax.text(0
, -0.1
, 'Source: http://kdd.ics.uci.edu/databases/reuters21578/reuters21578.html',
        transform=ax.transAxes, size
=12
, weight=600
, color='#777777')
ax.spines['right'
].set_visible(False)
ax.spines['top'
].set_visible(False)
ax.spines['left' 
].set_visible(False)
ax.spines['bottom'
].set_visible(False)
plt.tick_params(axis='y'
,which='both'
, left
=False
, top=False
, labelbottom=False)
ax.set_xticks([])
plt.show()
/<code>

從這個圖表中，你可以說大多數文章都包含來自美國、日本、加拿大、倫敦和中國的新聞。
對美國的高度評價代表了路透在美業務的重點。
person變量表示1987年誰是名人。這些信息有助於我們瞭解這些人。
organization變量包含世界上提到最多的組織。

4.文本數據中的唯一詞

我們將在使用TF-IDF的文章中找到唯一的詞彙。詞頻(TF)是每篇文章的字數。反向文檔頻率(IDF)同時考慮所有提到的文章並衡量詞的重要性，。

TF-IDF得分較高的詞在一篇文章中的數量較高，而在其他文章中很少出現或不存在。

讓我們計算TF-IDF分數並找出唯一的單詞。

<code>from
 sklearn.feature_extraction.text import TfidfVectorizer

tfidf_vectorizer
 = TfidfVectorizer(use_idf=True)
tfidf_vectorizer_vectors
=tfidf_vectorizer.fit_transform(articles_word_limit[‘text_clean’]) 

tfidf
 = tfidf_vectorizer_vectors.todense()
  == 0] = np.nan
 
means
 = np.nanmean(tfidf, axis=0)
 
Means_words
 = dict(zip(tfidf_vectorizer.get_feature_names(),
                       means.tolist()[0]))
unique_words
=sorted(means_words.items(),
                    key
=lambda x: x[1],
                    reverse
=True)
print(unique_words)
/<code>

5.用K-均值聚類文章

K-Means是一種無監督的機器學習算法。它有助於我們在一組中收集同一類型的文章。我們可以通過初始化k值來確定組或簇的數目。瞭解更多關於K-Means以及如何在這裡選擇K值。作為參考，我選擇k=4。

<code>from
 sklearn.feature_extraction.text import TfidfVectorizer
from
 sklearn.cluster import KMeans
from
 sklearn.metrics import adjusted_rand_score

vectorizer
 = TfidfVectorizer(stop_words=’english’,use_idf=True)
X
 = vectorizer.fit_transform(articles_word_limit[‘text_clean’])
k
 = 4
model
 = KMeans(n_clusters=k, init=’k-means++’,
               max_iter
=100, n_init=1)
model.fit(X)
order_centroids 
 = model.cluster_centers_.argsort()[:, ::-1]
terms
 = vectorizer.get_feature_names()
clusters
 = model.labels_.tolist()
  = clusters
for
 i in range(k):
      %d words:” % i, end=’’)

for
 title in articles_word_limit.ix[i
                     :
      %s,’ % title, end=’’)
/<code>

它有助於我們將文章按不同的組進行分類，如體育、貨幣、金融等。K-Means的準確性普遍較低。

結論

NER和K-Means是我最喜歡的分析方法。其他人可能喜歡N-gram和Unique words方法。在本文中，我介紹了最著名和聞所未聞的文本可視化和分析方法。本文中的所有這些方法都是獨一無二的，可以幫助你進行可視化和分析。

我希望這篇文章能幫助你發現文本數據中的未知數。

分享到:

關鍵字: data 文本 ax

你真的會用COUNTIF函數嗎？判斷重複值、統計次數出錯怎麼辦？

撰寫新聞軟文有哪些技巧

懂得閱讀的孩子學習都不會太差，如何教孩子真正閱讀

視界·手記丨為什麼是90後薩莉·魯尼接棒了歌德、塞林格和村上春樹

偷完技術偷操作，電影圈效仿遊戲圈出《倩女幽魂：重製版》

衝刺2020年高考語文滿分祕籍之論述類文本閱讀篇

CPU為何擠牙膏升級？AMD蘇姿豐：未來幾年會改變

BERT適應業務遇難題？這是小米NLP的實戰探索

《史記》古寫本學術價值譾說

槽位識別與糾錯在智能語音機器人中的實踐

Word中這9個功能，堪稱“掃地僧”，掌握了你就是大神

2020 最新AE超級特效面板堪稱神器！

基於知識圖譜的語義理解技術及應用

win10系統谷歌chrome瀏覽器地址欄變黑解決辦法

做新媒體運營可以學哪些專業？

初學者CAD製圖入門必備技巧

用了就回不去的功能準確又智能的翻譯讓人心生歡喜

PS文本快速填充的祕訣！媽媽再也不用擔心我上班累癱

為什麼我的Excel 求和算不出來？

2020年借條這樣寫才對，趕快把範本收藏，留著以後用

Access的數據類型,與Excel雖類似,數據庫+sql更適合大量數據管理

音樂喜劇與脫口秀的關係，就是視頻與新媒體內容的關係

要善用“提示語”

英雄連2 正版中文漢化補丁v3.9

iOS 人機界面指南精簡版筆記之界面元素：Views（下）

天祝縣全面推行證明事項告知承諾制

魯迅為什麼對阿長念念不忘

四六級考試在即，這有一份高分祕籍，還不學習一下

讀書不只關乎求知，也關乎心情

PS字體包免費送:藝術+時尚+炫酷+復古等5000多款字體，由你來選擇

有卷讀書：以身作則的家長有多重要？

FigrCollage for Mac(照片拼貼工具)

什麼是機器閱讀理解？跟自然語言處理有什麼關係？

4月國內大數據競賽彙總-獎池5000萬

office辦公轉換技巧，一定要會用

誰說COUNTIF函數很簡單？這些坑你一定踩過！

10個Word常用技能，簡單實用，辦公必備

html+css基礎入門教程篇之偽元素

Java 14 帶來了 5 項新特性，能支持 H5 文本開發了

Excel自定義格式代碼的組成規則-條件1；條件2；其他；文本

Excel自定義格式代碼-文本類代碼符號及其作用

春暖花開，陪你走一個地老天荒丨讀漂牛詩集有感

學會這些seo優化技巧,網站優化so easy

提取word圖片，高效去文本重複行，用了就會愛上它

學習Excel表格，要懂得1小時等於1秒，越會偷懶效率反而會越高

飯圈黑話翻譯機：「老年人」專用，防止暴露年齡神器

正則表達式（一）

91工控淺談ABB機器人記事本儲存功能

最最良心的數據分析推薦，我選擇放棄了Excel！

#科技青年# #科技V計劃# #Python代碼# 文本轉json總是不成功，有幾個坑要小心json是一個很優美的層次化數據存儲方式，是大量嵌套數據的理想存儲方式。很多網頁的數據就是以json格式來編寫和傳輸的，獲取到json數據後可以很方便地層層分析數據。獲取到了json格式結構如下圖。

潛逃壓力過大暴瘦40多斤，一涉黑A級通緝犯在河北投案自首

記者從河北省公安廳獲悉，日前公安部通緝的13名A級通緝犯中的2號通緝犯魯某某近日向河北邯鄲警方投案自首，這是公安部A級通緝令後又一通緝犯主動投案。

當我們在談 SaaS 的時候，在談什麼？

當我們在談SaaS 的時候，在談什麼？什麼是 SaaSSaaS 優缺點SaaS 銷售模式SaaS 產品指標SaaS 業務指標SaaS 收入計算一、什麼是 SaaS這個模式讓軟件變得和水電氣很相似，只需要每月繳納固定的費用即可享受服務。

合同詐騙的類型有哪些？企業無力償還借款是否構成合同詐騙罪？

現階段，隨著國家供給側結構性改革的不斷深入，人們在市場中的互易行為日益頻繁，合同在經濟活動發揮的作用也日漸凸顯。

5月西安招聘會時間安排來了！找工作的別錯過

乘車路線:西安市內乘坐12路、14路、14路區間、26路、215路、215路區間、216路、224路、229路、239路、31路、36路、321路、323路、521路、600路、603路、616路、701路、704路、709路、教育專線、K605路、K616路、遊6路、遊8路61

剛剛工作的畢業生，一個月只有2000多，是不是太少了？

剛剛:剛剛工作的畢業生，一個月只有2000多，是不是太少了？根據你城市消費水平來看啊，還有你從事的工作，假如你在二三線城市做一份事業單位或者是編制類的工作，薪資水平是隨著你工作年限逐年增長的，而且在年終也有很多福利補貼待遇等等，算下來收入也是可觀的，再舉一個例:-畢業生 2000

全球鬧「美元荒」帶動穩定幣需求暴增！以太坊交易量創近兩年新高

基於以太坊區塊鏈的主要穩定幣包括：Tether、TrueUSD、GeminiDollar、Paxos Standard、Binance USD、USD Coin、Huobi USD和MakerDAO等。

“幫助當地居民解決用水難題”-今日頭條-手機光明網

晨曦初露，9歲的米格爾和弟弟妹妹們抱著水罐，穿過一片田野，到達安哥拉首都羅安達郊區的指定取水點。葛洲壩安哥拉有限公司市場部負責人劉世軒介紹說，公司每天派出送水車兩次，一次3車，將潔淨水從羅安達水廠直接運往指定取水點。

灌籃高手無水印壁紙，每一張都是回憶

那些年，我們追過的灌籃高手，你更喜歡誰呢？流川楓櫻木花道赤木剛憲宮城良田三井壽你喜歡哪個球員呢？歡迎評論區留言。

通遼藍天救援隊成功解救遼河公園水上被困群眾

2020年5月1日，通遼藍天救援隊假期例行在遼河公園水域進行安全巡邏任務，下午15時10分，巡邏隊員發現遼河水面有被困群眾向巡邏船隻求救，接到求救信號後，巡邏隊員緊急前往事故現場展開研判、救援準備工作。

5月6日·武漢要聞及抗擊肺炎快報

今天零時起高速公路恢復收費了，這些車輛還能免費5月6日零時起全國高速公路恢復收費在武漢北收費站ETC和人工車道全部可通行零時左右通過收費站的車輛並不多以大貨車為主有工作人員在一旁引導貨車進入高速收費站前要通過入口稱重檢測車道進入沒有超重超限便可順利通過現場沒有出現排隊的現象全省聯

肖副省長等省市領導到孝感市楚澴中學調研九年級復學暨疫情防控常態化工作

2020年4月29日下午，肖副省長等省市領導來到孝感市楚澴中學調研九年級復學暨疫情防控常態化工作，肖副省長等省市領導在學校領導陪同下，重點對校門口出入、保健室、教室、學生心理輔導室、洗手池等進行了非常細緻的檢查，對孝感市楚澴中學的復學和疫情防控工作給予充分的肯定。

相聲界的顏值擔當張雲雷稱號大揭祕

這個播放量就連師傅身為相聲演員的張雲雷卻有著堪比娛樂圈小鮮肉的顏值，一個相聲演員長成這樣，張雲雷不火誰能火。

美國百年薅羊毛攻略

當德國向法軍陣地傾洩400多萬發炮彈，揚言要讓凡爾登成為「碾碎法軍的絞肉機」時，遠在大西洋的美國人。

《全職高手》：一口氣刷了10集，對楊洋路轉粉了

近日，由楊洋、江疏影主演的劇版《全職高手》在騰訊視頻正式開播了，該劇改編自蝴蝶藍同名小說，先前還被改編成動畫版。

共同承擔責任！Rookie談BP問題：輸了是我們打得太臭

前言：IG這隻老牌戰隊在我們LPL賽區以來都擁有著非常高的人氣，特別是在2018年之後，他們幫助我們LPL賽區奪得了第一個寶貴的S賽世界冠軍，而IG戰隊的打法一直以來也是非常有觀賞性的。

LOL"中韓對抗賽"遭選手反對？Zoom直言不想打，Doinb的回答太真實

Doinb表示："可以的話我不想參加，首先這場比賽沒有任何意義，獲得勝利既不會有獎金也不會有榮譽，但萬一輸掉比賽FPX就會成為大家吐槽的焦點"。

李亞鵬攜李嫣出席慈善晚會，李嫣手上鑽戒搶鏡，1個動作獲誇讚！

大家都知道天后王菲和前夫李亞鵬他們育有一個女兒，名叫李嫣。於是李嫣因為偷偷的開了直播從而也導致了她被大家所發現，但李嫣的樂觀和開朗卻也讓李亞鵬放下心來，決定放飛女兒，讓她自由的去探索她想要的世界。

53歲郭富城再度升級當爸，方媛懷二胎，Chant要做姐姐了

天王郭富城近日參加活動，首度承認妻子方媛懷有二胎的消息。從去年2017年兩人結婚，低調的愛情讓媒體都捕捉不到邊際，天王嫂31歲兩人相差了20歲的愛戀，始終不少人不看好啊。

那些拼命的演員：王寶強喝了一大桶牛奶，孫儷吃10斤瓜子

演員在我們眼中一直都是光鮮亮麗、收入頗高的職業，並且現在有很多靠流量躋身一線，卻毫無演技以及實力的演員。

賈乃亮用上了“一米陽光”這個詞，他依然渴望擁有美麗的愛情！

曾經賈乃亮是“陽光”的代名詞，大家看到他都覺得很暖，只不過後來就不是了。今天早上，他發了一條微博“人生的美好就是每天醒來都能看到上帝賜予我的那一米陽光”，這句話當中，賈乃亮用到了“一米陽光”這個詞。

搞笑GIF開心一刻：我的老家農村，有妹子願意嫁給我嗎？

當一名理髮師也不容易這是一隻有航天夢想的老鼠寶寶！什麼？這麼貴！把我賣了得了。小朋友，你贏了，我甘拜下風！

為什麼只有edg賺錢？

電競行業作為一個新興產業，這幾年發展勢頭越來越好，IG戰隊，FPX戰隊先後奪得了s8-s9世界賽的冠軍，據俱樂部知情人士透露，除了國內的幾家豪門俱樂部之外，其他俱樂部基本都是虧錢在做的，當然EDG也是:-edg 賺錢:為什麼只有edg賺錢？

程瀟身材多好？雙腿劈叉才明白，這才是“腿精”

程瀟可謂是才女，她是中韓宇宙少女的成員之一，今年她只有20歲。不要看程瀟年紀比較小，但是她身材還是挺好的，身材也是典型S型曲線，魅力不小。

張柏芝承認三胎產子，否認小夥的老爸是孫東海，看來她選擇保密

張柏芝是許多80後90後心目中的女神，除了顏值高有演技外，她和謝霆鋒的婚姻和戀情也曾是吃瓜群眾津津樂道的事。

T1戰隊搶注Faker商標，“囊括多個領域產品，商業潛力媲美喬丹”

前言：目前各大賽區的春季賽都已經結束了，T1戰隊在重組之後再度拿下了lck賽區的冠軍，這讓很多的玩家非常意外，這也從側面反映出來了，核心選手和主教練的個人能力，同時faker的實力再度被玩家們認可，最近一段時間他也是一直在直播，很多的人都在詢問，今年李哥的目標是什麼？

雲頂之弈“最不平衡的版本”誕生，全員搶一費卡，運氣成吃雞關鍵

上線之後迅速引發了大量玩家的好評，就在最近，官方也是迎來了10.9版本，可是在目前的版本中再度出現了太多的畸形玩法了，應該是有史以來最不平衡的版本，因為一費卡的爆率大大提升，導致遊戲成為了三星的天下，全員搶一費卡，運氣成為吃雞的關鍵。

LPL春季賽"6宗最"：Uzi最遺憾，阿水最驚喜，V5最離譜

在本期節目中會評選出一位最美麗LPL女解說，其中瞳夕、Rita、餘霜等都在名單之中，最有趣的是管澤元居然也出現在了“女解說”名單中，全因餘霜一張P過的照片，論梗的話，管澤元第一，若是輪顏值，估計這也排不上名次。

雷佳音被問：跟佟麗婭拍那麼多親熱戲是啥感受？他的回答笑翻眾人

不過要是像唐嫣和羅晉那樣用公費談戀愛的故事不多，大多數還是和不是心愛的人拍得多，但要是遇上岳雲鵬和佟麗婭拍親熱戲的話，那個畫面或許大家想象不出來吧。

JDG成最“慘”冠軍戰隊？拿到LPL冠軍人氣依舊低迷，TES成贏家！

LPL賽區的春季賽結束也有一段時間了，作為冠軍戰隊JDG，並沒有因為拿到冠軍而出現“人氣”的高漲，依舊平平淡淡，熟悉LPL賽區的玩家都知道，在LPL賽區中，一直以來都是由RNG、IG、EDG三家從“遠古”時期就開始統治LPL賽區，期間也有OMG和LGD、WE幾個戰隊打破了這個規律

#戰疫必勝#“症和狀”都有了，我與新冠擦肩而過

學習結束，回到家後，在武大短暫學習的那段時光時常讓我懷念，並曾立下誓言，抽個暑假一定要帶著老婆孩子一起去“逛”武大。機會就這麼悄然而至！2019年第28屆世界腦力錦標賽全球總決賽的舉辦地就是武漢，比賽的日期是12月6日到8日，三天的時間。其實，我也沒有想到第一次參加這樣比賽的女兒

T1提議中韓友誼賽，但LPL隊伍都不想參加？理由其實很簡單

這不今天就有網友在論壇中聊起了這個話題，有網友表示“LPL隊伍其實都不想參加中韓友誼賽，LPL隊伍才剛結束春季賽，18天之後就要打夏季賽了，像IG可能會有人員變動FPX TES 應該也會利用這段時間來檢討分析，也許只有JDG 比較願意參加，doinb只是第一表態的選手，可能還有很

網友投稿：光山縣潑陂河鎮至白雀園鎮的X015縣道德兩座壞橋經過5個月的等待終於開修啦#光山 #信陽

網友投稿：光山縣潑陂河鎮至白雀園鎮的X015縣道德兩座壞橋經過5個月的等待終於開修啦#光山 #信陽，於2020年04月28日上線，由信陽本地聯盟上傳。西瓜視頻為您提供高清視頻，畫面清晰、播放流暢，看豐富、高質量視頻就上西瓜視頻。

2020最佳韓劇追起來~《愛的迫降》僅排名第二，TOP 1絕對實至名歸

TOP20 - 「優雅的家」這部由林秀香、李章宇、裴宗玉等人所主演的《優雅的家》，當時一播出就引起不少話題，雖然劇情有點浮誇，但卻莫名好看，而當時該劇還刷新了MBN電視臺的記錄呢~《優雅的家》主要講述一位擁有完美外貌和身材的MC集團獨生女毛碩熙，為了查明15年母親去世的真相，因此

搞笑GIF開心一刻：我正在睡覺，誰敢打擾我

我這暴脾氣，等你剝完我能吃五個你帶著你家貓去做演員吧！這貓太有前途了！這是我見過最牛的啦啦隊！自從有了弟弟，老大就和家務結緣了狼狗：要不是主人在，我非吃了你兩個小子！

備考消防的幾大錯覺，你有這個情況嗎？

講真，很多時候我們會把事情想當然，並因為這些錯覺而採取錯誤的舉動，一消備考是一場毅力和心智的戰鬥，大家難免會產生一些錯覺，從而影響自己的備考效率，甚至導致備考失敗。

“頂流”李敏鎬啞火，渣男出軌劇出圈，韓劇觀眾也長大了？

豆瓣開分8.3，漸漸跌到7.7分，熱門短評寫道：“同樣是金編，差距怎麼這麼大”、“看了四集節奏真的是一團糟，比起隔壁《夫妻的世界》真的差一大截”。

網上羅馬仕充電寶20000毫安的，參數怎麼很多樣？哪個是真的？

20000:網上羅馬仕充電寶20000毫安的，參數怎麼很多樣？哪個是真的？天貓旗艦店，或者淘寶旗艦店，或者京東旗艦店肯定包真，質量好，再說可以官方驗證啊，不能圖那十塊五塊的便宜，畢竟一個充電寶要用好久呢，一兩年沒問題的。:-羅馬仕馬仕毫安

應急科普丨“五一” 期間氣溫回升謹防森林火災隱患

隨著“五一”期間氣溫大幅回升全國大部分地區已經進入初夏在享受小長假春日美景的同時森林火險等級也隨之明顯提升新疆森林消防提示您春季氣溫回升快野外草木乾燥你的一個失當用火行為就有可能引發森林大火勿念蔥林繁似海一星燃盡只塵埃

搞笑GIF開心一刻：拍照啦，趕緊看鏡頭

弟弟：姐姐你能利索點嗎家裡有個熊孩子，說實話心很累同學感覺你好可伶，一個人跳舞多尷尬啊！看我病好了怎麼收拾你們！真的是以迅雷不及掩耳之勢啊。姑涼，你……掉毛啊！小姐姐你是想找男朋友嗎用這樣的方式，結局很意外此處注意安全！

工程發承包、工程造價條款，或迎來大調整

第二章建設規劃與設計第一節建設規劃第八條建設規劃的體系第九條建設規劃的編制與審批第十條建設規劃的內容第十一條建設規劃的實施與評估第二節城市設計第十二條城市設計的基本要求第十三條城市設計的編制和審批第十四條城市設計的實施和管理第三節建築設計第十五條建築設計的基

新增四省！關於2019年一級建造師考試證書、複核發佈公告

快來看看吧~青海關於恢復專業技術人員職業資格證書的發放、補辦工作的通知各位考生：隨著疫情防控進入常態化，青海省新冠疫情得到有效控制，專業技術人員職業資格證書的印製、發放工作正在逐步恢復，為方便廣大考生辦理證書業務，4月28日起青海省人力資源和社會保障服務中心一樓大廳65、66號辦

學霸也會復讀？朱廣權這個圈粉無數的國民段子手是如何煉成的！

“煙籠寒水月籠沙，不止東湖與櫻花，門前風景雨來佳，蓮藕魚糕玉露茶，鳳爪藕帶熱乾麵，米酒香菇小龍蝦，守住金蓮不自誇，趕緊下單買回家，買它買它就買它，熱乾麵和小龍蝦。”

幸福的人，總會忘記舊愛

幸福從來不可能是有個人幫你搞定所有的一切，而你只需要坐享其成。她喜歡喝銀耳蓮子羹而且必須是上好的銀耳，用小火慢慢燉到砧稠那一日，他去看她，她冷冷地從屋裡走出來，丟給他一本書.對他說:"廚房裡小鍋燉著東西，你幫我去看看。”他真真地守了一個多小時，端到她面前。

真人芭比：一直說自己“沒整容”最後晒出舊照，打臉的卻是自己

俗話說的好“愛美之心人人都有”而讓自己快速變美的方法無疑就是“整容”如今的社會整容看起來似乎很平常。

驚了！這件事沒有做，一消證書等於白考！

不要慌，同學們，遇到問題不要怕，拿到證書不去註冊，相當於證書無效，今天就為大家一一解答註冊證書的相關問題。

8年後，有哪些人會留在農村生活？以下4類人群或將留下，有你嗎

從九十年代末開始，在我國農村地區就興起了一股“進城潮”，記得那個時候，農村的經濟發展相對滯後，村民生活條件艱苦，鄉親們為了擺脫貧困，只能告別親人，遠離家鄉去外面打拼賺錢。

唯一回絕張藝謀力捧的女生，被報送上清華，25歲有上百億身家

25歲有上百億身家文/娛樂深扒爆姐圖/網絡張藝謀是一位非常有實力的導演，同時非常出名，而且他拍攝的作品中有不少獲獎無數的經典影片，同時也捧紅過不少藝人。

疫情下的悲劇：買不起手機上網課，那個女孩決定吞藥自殺

有人為了生計不顧自身安危，有人躲在家中安然度日，還有人僅僅因為一個手機，就要放棄自己的生命...這個女孩，今年上初三，因為疫情的原因，全國各地都展開了網課線上教育，女孩的學校也不例外。

李棟旭劉仁娜新劇開拍，互對臺詞歡樂多，終於要開始撒狗糧了嗎？

這部劇是2016年年底播出的，熱度一直持續到了2017年，相關的周邊和景點都相當熱門，像是池恩卓跟鬼怪大叔相遇的海邊、劇中出現的鬼怪玩偶、還有鬼怪大叔的拔劍特效等等。

高考延期：七月的高考，最熱的天，做最難的題！

後來，由於7月份氣候較差，極端天氣頻發，尤其是南方地區，要麼極端高溫，要麼就是颱風，對於高考來說非常不友好，不僅考生的考試質量會下降，而且閱卷老師、高考工作者也不方便，因此，從2003年開始，高考日期都固定在了每年的6月7日、8日。