Arxiv網絡科學論文摘要23篇(2020-04-22)

  • 關於疫情增長的實時預測的不確定性:中國和意大利的COVID-19案例研究;
  • 西班牙和荷蘭的趨勢比較:冠狀病毒傳播的動態區室模型;
  • 失去了象牙塔:大學生對COVID-19大流行的反應與普通民眾不同;
  • 發燒和流動性數據表明美國社會疏遠降低了傳染病的發生率;
  • COVID 19,一種針對印度特定疾病的飽和,生長和衰退的現實模型;
  • 莫斯科和俄羅斯地區COVID-19傳播的數學模型;
  • 危機中的隱私:冠狀病毒大流行期間自我披露的研究;
  • 研究高傳染性疾病傳播的微觀方法;
  • 評估基於位置的社交媒體的相對意見:以2016年美國總統大選為例;
  • 那個消息會火?!推文傳播的探索性分析和情感分析;
  • 社會媒體上的回聲室:比較分析;
  • 用於改進聚類的基於流的算法:統一的框架,軟件和性能;
  • 多層網絡的新社區定義及其高效計算的新方法;
  • 用位點滲濾解決方案來防止Phytophthora遊動孢子在人工林中繁殖;
  • 通過潛在的用戶GPS數據和興趣點融合發現城市功能區;
  • 隔離通過檢測不可靠的評分評論來欺騙Yelp的用戶;
  • 在Facebook上自動識別政治廣告:通過用戶定位來了解操作;
  • 強一致性,圖拉普拉斯算子和隨機塊模型;
  • 定義和識別網絡的最佳嵌入維度;
  • 通過圖表徵探索EOSIO;
  • 概率圖模型推論的嚴格解釋;
  • 體育和政治混合嗎?大聯盟體育和總統候選人球迷基礎的交叉分析;
  • anyMOD-基於圖的框架的能源系統建模,具有高水平的可再生能源和行業整合;
  • 關於疫情增長的實時預測的不確定性:中國和意大利的COVID-19案例研究

    原文標題: On the uncertainty of real-time predictions of epidemic growths: a COVID-19 case study for China and Italy

    地址:
    http://arxiv.org/abs/2004.10060

    作者: Tommaso Alberti, Davide Faranda

    摘要: 儘管COVID-19在全球範圍內迅速傳播,但提供實時流行病預測的需求使動態和統計模型無法滿足其現有數據的需求。在這裡,我們著重於通過將漸近分佈擬合到實際數據來執行的COVID-19感染的統計預測。通過對中國各省和意大利地區的總COVID-19感染的流行趨勢進行案例研究,我們發現預測的特徵是在流行的早期階段存在很大的不確定性。在達到流行病高峰之後,這些不確定性將大大降低。區域一級預測的不確定性差異可以用來突出病毒傳播的延遲。我們的結果警告說,對流行病計數的長期推斷必須格外小心,因為由於基本動力學的內在非線性性質,它們不僅至關重要地取決於數據的質量,而且還取決於流行病的階段。這些結果表明,實時流行病學預測應包括較大的不確定性範圍,並敦促需要彙編高質量的感染計數數據集,包括無症狀患者。

    西班牙和荷蘭的趨勢比較:冠狀病毒傳播的動態區室模型

    原文標題: The comparison of trends in Spain and the Nederland: a Dynamical compartment model of the transmission of Coronavirus

    地址:
    http://arxiv.org/abs/2004.09874

    作者: Victoria Lopez, Milena Čukić

    摘要: 最近冠狀病毒的傳播使許多國家施加限制,以控制其對公民的危險影響。我們開發了基於隔室SIR系統的理論動力學模型,並從流網絡和馬爾科夫鏈框架中進行了額外調整,以根據公開數據說明發展和趨勢。基於此模型,R中的代碼由來自西班牙和荷蘭的授權政府網站上蓋章的可公開獲得的數據編寫並提供,以比較趨勢。我們的結果表明,兩國的感染“高峰”已經在我們身後,但也表明存在傳播反彈的危險。顯然,所採取的措施正在取得成果,但由於大多數人口仍然沒有豁免權,我們應該對近期的做法和事態發展pre之以鼻。

    失去了象牙塔:大學生對COVID-19大流行的反應與普通民眾不同

    原文標題: The Ivory Tower Lost: How College Students Respond Differently than the General Public to the COVID-19 Pandemic

    地址:
    http://arxiv.org/abs/2004.09968

    作者: Viet Duong, Phu Pham, Tongyu Yang, Yu Wang, Jiebo Luo

    摘要: 最近,新型冠狀病毒疾病-2019(COVID-19)的大流行給各國政府帶來了最終挑戰。在美國,COVID-19感染病例確診率最高的國家,總統實施了全國性的社會疏遠協議。自1918年流感大流行以來,這是一百年來的第一次,美國居民被迫留在家中並避免與公眾接觸。結果,大多數公共場所和服務已經停止運營。華盛頓大學3月7日停課後,美國超過一千所大學取消了面對面的課堂和校園活動,影響了數百萬學生。本文旨在通過挖掘人們在社交媒體上的觀點,來發現這種互動性社會前所未有的顛覆性對社會公眾和高等教育人群的社會影響。我們發現大量嵌入到COVID-19推文中的幾個主題代表了與大流行相關的最核心問題,這是大學生和公眾都非常關注的問題。此外,就他們對COVID-19問題表達的觀點而言,我們發現這兩組Twitter用戶之間存在顯著差異。據我們所知,這是第一個基於社交媒體的研究,其研究重點是大學生群體的人口統計數據以及在重大危機期間對流行的社會問題的反應。

    發燒和流動性數據表明美國社會疏遠降低了傳染病的發生率

    原文標題: Fever and mobility data indicate social distancing has reduced incidence of communicable disease in the United States

    地址:
    http://arxiv.org/abs/2004.09911

    作者: Parker Liautaud, Peter Huybers, Mauricio Santillana

    摘要: 2020年3月,美國許多州政府鼓勵或強制要求限制社交互動,以減緩COVID-19的傳播速度,該疾病是由新型冠狀病毒SARS-CoV-2引起的,已傳播至近180個國家。由於對COVID-19的監視受到限制,因此評估這些社會疏遠策略的有效性具有挑戰性,對於高風險或住院病例,通常根據時間和區域變化的標準來優先進行測試。在這裡,我們顯示,通過智能溫度計捕獲的在至少100例確診的COVID-19病例中,美國各縣之間的流動性降低導致發燒率的降低,平均滯後時間為6.5天(3—10天內為90%)天),與COVID-19的潛伏期一致。此外,除了紐約市及其附近地區外,流動性下降較大的縣隨後發燒量也有較大的下降( p <0.01>

    COVID 19,一種針對印度特定疾病的飽和,生長和衰退的現實模型

    原文標題: COVID 19, a realistic model for saturation, growth and decay of the India specific disease

    地址:
    http://arxiv.org/abs/2004.09912

    作者: V. K. Jindal

    摘要: 這項工作提出了一種簡單而現實的方法來處理印度的COVID-19患者的可用數據並預測情況。提議的模型基於諸如鎖定的開始(政府在第25天宣佈 tau 0以及由平均壽命恢復時間 tau 1決定的恢復模式(通常說為(大約14天)。已使用2020年3月2日至2020年4月16日的COVID-19感染者的數據來擬合感染,康復和死亡計數的演變。指數增長緩慢,R0接近1 發現圖6表示感染計數,幾乎表示線性上升,其餘的數據增長,飽和和衰減通過結合鎖定時間控制的R0來全面建模,具有正常誤差函數,例如行為在某個時間範圍內衰減為零。 tau 2。恢復平均壽命 tau 1決定了峰值和衰減,未來幾天的預測結果有趣而樂觀,根據實驗數據引入的時間常數包括恢復率和恢復時間。確定時間跨度鎖定後R0的活動是爭論的話題,併為引入觸發因素以使其更適合模型提供了可能性。該模型可以擴展到具有其自己的R0和恢復時間參數的其他社區。

    莫斯科和俄羅斯地區COVID-19傳播的數學模型

    原文標題: Mathematical Modeling of the Spread of COVID-19 in Moscow and Russian Regions

    地址:
    http://arxiv.org/abs/2004.10118

    作者: E.M. Koltsova, E.S. Kurkina, A.M. Vasetsky

    摘要: 為了模擬COVID-19冠狀病毒在俄羅斯地區和莫斯科的傳播,使用了描述病例數增加的離散邏輯方程。為了檢驗數學模型的正確性,將模擬結果與冠狀病毒在中國,歐洲和亞洲一些國家以及美國的傳播進行了比較。在區間(01.03-08.04)中確定了俄羅斯,莫斯科和其他大區域的物流方程參數。提出了對不同國家和地區COVID-19感染人口增長率的比較分析。考慮了在莫斯科和俄羅斯地區傳播COVID-19冠狀病毒的各種情況。對於每種情況,都獲得了每日新病例的曲線和病例總數增加的圖表,並研究了感染每天傳播的動態。確定高峰時間,流行時期,高峰期的感染人數及其增長。

    危機中的隱私:冠狀病毒大流行期間自我披露的研究

    原文標題: Privacy in Crisis: A study of self-disclosure during the Coronavirus pandemic

    地址:
    http://arxiv.org/abs/2004.09717

    作者: Taylor Blose, Prasanna Umar, Anna Squicciarini, Sarah Rajtmajer

    摘要: 我們研究了在2020年3月1日至4月3日期間的一個由用戶主導的關於冠狀病毒大流行的英語對話的Tweets大型數據集中觀察到的自我披露發生率。使用一種無監督方法來檢測自願披露個人信息,我們提供了早期證據,表明圍繞冠狀病毒大流行的情況因素可能會影響個人的隱私演算。文本分析揭示了在Twitter上自我公開的對話中話題向支持和尋求支持的轉變。我們對哈維颶風的推文進行了可比的分析,以提供觀察到的影響的背景並提供進一步研究的機會。

    研究高傳染性疾病傳播的微觀方法

    原文標題: A microscopic approach to study the onset of a highly infectious disease spreading

    地址:
    http://arxiv.org/abs/2004.09554

    作者: Krithika Rathinakumar, Annalisa Quaini

    摘要: 我們將行人動力學模型與接觸追蹤方法相結合,以模擬在密閉環境中高傳染性空氣傳播疾病的初始傳播。我們關注的是中等規模的人口(最多1000人),感染人數很少(1或2),其餘的人分為免疫和易感人群。我們採用空間連續模型,該模型通過作用於行人的力來表示行人動力學,即基於微觀力的模型。一旦離散化,該模型將產生一個高階二階常微分方程組。在將聯繫追蹤添加到行人動力學模型之前,我們校準模型參數,根據經驗數據驗證模型,並表明可以捕獲行人的自組織。我們考慮通過在患病者周圍引入疾病域的一種明確的聯繫人跟蹤方法。一個健康但易感的人在疾病域中停留了一定時間可能會被感染(具有規定的概率)併成為所謂的第二接觸。作為模擬疾病傳播開始的具體環境,我們考慮兩個美國機場的候機樓:休斯敦的霍比機場和亞特蘭大國際機場。我們考慮了不同的情況,並量化了隨著給定終端的人口密度提高,免疫人員比例下降,主要聯繫人數量增加以及高密度區域(例如登機巴士),次級聯繫人平均數量的增加) 存在。

    評估基於位置的社交媒體的相對意見:以2016年美國總統大選為例

    原文標題: Measuring relative opinion from location-based social media: A case study of the 2016 U.S. presidential election

    地址:
    http://arxiv.org/abs/2002.00854

    作者: Zhaoya Gong, Tengteng Cai, Jean-Claude Thill, Scott Hale, Mark Graham

    摘要: 社交媒體已成為民意收集中民意測驗的一種新興替代方法,儘管它作為無源數據源仍面臨許多挑戰,例如無結構性,可量化性和代表性。帶有地理標籤的社交媒體數據為揭露表達其意見的用戶的地理位置提供了新的機會。本文旨在回答兩個問題:1)是否可以從社交媒體獲得可量化的民意測評; 2)與民意測驗相比,民意測驗是否可以提供更好或補充的測評。這項研究提出了一種新穎的方法來衡量Twitter用戶對公共問題的相對意見,以適應更復雜的意見結構並利用與公共問題有關的地理優勢。為了確保這項新措施在技術上可行,開發了一個建模框架,其中包括通過採用最新方法並設計一種新的深度學習方法(稱為意見導向的詞嵌入)來構建訓練數據集。通過對2016年美國總統大選的推文進行案例研究,我們展示了相對意見方法的預測優勢,並展示了它如何有助於視覺分析和支持意見預測。儘管事實證明相對民意測驗比民意測驗更可靠,但我們的研究還表明,前者可以有利地補充民意測驗。

    那個消息會火?!推文傳播的探索性分析和情感分析

    原文標題: That Message Went Viral?! Exploratory Analytics and Sentiment Analysis into the Propagation of Tweets

    地址:
    http://arxiv.org/abs/2004.09718

    作者: Jim Samuel, Myles Garvey, Rajiv Kashyap

    摘要: 信息交換和消息傳播已從傳統媒體轉移到社交媒體平臺。 Twitter等平臺上的消息已成為公司交流的默認模式,取代了冗長的公告和更新。企業和組織已經越來越多地使用Twitter與利益相關者建立聯繫。因此,重要的是瞭解通過Twitter成功進行信息交換和消息傳播的關鍵驅動力。我們對超過100萬條Tweets的數據集進行了探索性分析,其中包括40,000多條潛在Tweets,並進一步過濾到18,000條Tweets。我們確定了最受歡迎的消息,並分析了多個內源維度上的推文,包括內容,情感,動機和豐富度,以及諸如基本事件,社會學習和行動主義等外源維度。我們發現了一些有趣的模式並發現了新的見解,以幫助研究人員和從業人員更好地瞭解流行的病毒推文的行為。我們還進行了情緒分析,並提出了一個早期模型來解釋推文的表現。

    社會媒體上的回聲室:比較分析

    原文標題: Echo Chambers on Social Media: A comparative analysis

    地址:
    http://arxiv.org/abs/2004.09603

    作者: Matteo Cinelli, Gianmarco De Francisci Morales, Alessandro Galeazzi, Walter Quattrociocchi, Michele Starnini

    摘要: 最近的研究表明,在線用戶傾向於選擇遵循其信仰體系的信息,忽略不符合其要求的信息,並圍繞共享敘述加入小組(即回聲室)。儘管仍然缺少用於識別它們的定量方法,但是回聲腔的現象在科學和政治層面都受到了廣泛的爭論。為了闡明這一問題,我們介紹了回聲室的操作定義,並對1M用戶在四個社交媒體平臺(Facebook,Twitter,Reddit和Gab)上產生的超過1B條內容進行了大規模比較分析。我們推斷出用戶對有爭議的話題(從疫苗到流產)的傾向,並通過分析不同的功能(例如共享鏈接域,關注頁面,關注者關係和評論帖子)來構建其交互網絡。我們的方法從兩個主要方面對回聲腔的存在進行了量化:交互網絡中的同構性和信息傳播偏向於有想法的同伴的偏向。我們發現社交媒體之間存在獨特的差異。確實,儘管Facebook和Twitter在所有觀察到的數據集中都提供了清晰的回聲室,但Reddit和Gab卻沒有。最後,通過比較Reddit和Facebook,我們測試了社交媒體平臺在新聞消費中的作用。再次,我們發現支持以下假設的假設:實現新聞提要算法的平臺(如Facebook)可能會引起回聲腔的出現。

    用於改進聚類的基於流的算法:統一的框架,軟件和性能

    原文標題: Flow-based Algorithms for Improving Clusters: A Unifying Framework, Software, and Performance

    地址:
    http://arxiv.org/abs/2004.09608

    作者: K. Fountoulakis, M. Liu, D. F. Gleich, M. W. Michael

    摘要: 向量空間中的點或圖中的節點的聚類是統計數據分析中普遍存在的原語,通常用於探索性數據分析。在實踐中,精煉''或改善’’通過某種其他方法獲得的給定簇通常是令人感興趣的。在本次調查中,我們專注於針對此集群改進問題的原理算法。許多這樣的集群改進算法是基於流的方法,通過這種方法,我們的意思是在操作上它們要求在(通常是隱式)修改後的數據圖上解決一系列最大流問題。這些聚類改進算法在理論上和實踐上都很強大,但是在諸如社區檢測,局部圖聚類,半監督學習等問題上並未得到廣泛採用。可能的原因是:這些算法;缺乏高效且易於使用的軟件;缺乏對現實世界數據進行詳細的數值實驗來證明其有用性。我們的目標是解決這些問題。為此,我們將指導讀者進行了解如何實現和應用這些強大算法的整個過程。我們提出了一個統一的分數編程優化框架,該框架使我們能夠以簡單的方式提煉所有這些算法的關鍵組成部分。這也使相關方法之間存在明顯的異同。通過分數編程框架查看這些集群改進算法,為將來的算法開發提供了方向。最後,我們在LocalGraphClustering python軟件包中開發了這些算法的有效實現,並且我們進行了廣泛的數值實驗,以證明這些方法在社會網絡和基於圖像的數據圖上的性能。

    多層網絡的新社區定義及其高效計算的新方法

    原文標題: A New Community Definition For MultiLayer Networks And A Novel Approach For Its Efficient Computation

    地址:
    http://arxiv.org/abs/2004.09625

    作者: Abhishek Santra, Kanthi Sannappa Komar, Sanjukta Bhowmick, Sharma Chakravarthy

    摘要: 隨著使用多層網絡(MLN)進行建模和分析的日益普及,提出涵蓋MLN所代表的多個功能的社區定義並開發用於在MLN上高效計算社區的算法變得越來越重要。當前,用於MLN的社區是基於使用不同技術(獨立於類型,基於投影等)將網絡聚合為單個圖並在這些圖上應用單圖社區檢測算法(例如Louvain和Infomap)。此過程導致不同類型的信息丟失(語義和結構)。據我們所知,本文首次提出了異構MLN(或HeMLN)社區的定義,該定義保留了語義和結構。此外,我們的基本定義可以擴展為根據需要適當匹配分析目標。在本文中,我們提出了HeMLN的結構和語義保留社區定義,該結構與單個圖的傳統定義兼容並且是傳統圖的擴展。我們還提出了使用新提出的去耦方法進行有效計算的框架。首先,我們為HeMLN的連接的k層定義一個k社區。然後,我們提出了使用二部圖配對概念進行計算的一系列算法。此外,為了進行更廣泛的分析,我們介紹了幾種配對算法和權重度量,用於使用參與的社區特徵組成二進制HeMLN社區。本質上,這導致了社區計算的擴展系列。我們提供了廣泛的實驗結果,以展示使用流行的IMDb和DBLP數據集的擬議計算的效率和分析靈活性。

    用位點滲濾解決方案來防止Phytophthora遊動孢子在人工林中繁殖

    原文標題: Site-bond percolation solution to preventing the propagation of Phytophthora zoospores on plantations

    地址:
    http://arxiv.org/abs/2004.09644

    作者: J. E. Ramírez, C. Pajares, M. I. Martínez, R. Rodríguez Fernández, E. Molina-Gayosso, J. Lozada-Lechuga, A. Fernández Téllez

    摘要: 我們提出一種基於位點結合滲濾的策略,以最大程度地減少 Phytophthora遊動孢子在人工林上的繁殖,其中包括在相鄰植物之間引入物理屏障。區分了兩個聚類過程:i)一種在土壤中檢測到病原體的細胞; ii)通過目視檢查人工林發現的病態植物。前者通過標準的位鍵滲濾得到了很好的描述。在後者中,當沒有引入障礙時,滲透閾值由Tsallis分佈擬合。對於這兩種情況,我們都提供了最小勢壘密度的公式,以防止生成跨越群集。儘管這項工作集中於特定的病原體,但此處介紹的模型也可以用於防止其他病原體通過其他方式從一種植物傳播到附近的植物。最後,還顯示了該策略在三種類型的商業上重要的墨西哥辣椒植物中的應用。

    通過潛在的用戶GPS數據和興趣點融合發現城市功能區

    原文標題: Discovering Urban Functional Zones By Latent Fusion of Users GPS Data and Points of Interests

    地址:


    http://arxiv.org/abs/2004.09720

    作者: Wen Tang, Alireza Chakeri, Hamid Krim

    摘要: 隨著社會經濟學的飛速發展,發現功能區的任務對於更好地理解社會活動與空間位置之間的相互作用變得至關重要。在本文中,我們提出了一個通過分析城市結構和社會行為來發現功能區的框架。通過融合興趣點(POI)和人類活動的語義含義來學習區域的潛在表示,該方法模擬了空間位置和人類活動之間的內部影響。然後,基於空間的無監督聚類方法,即條件隨機場(CRF),使用其空間信息和判別表示將其應用於聚合區域。同樣,我們估計區域的功能並通過歸一化POI分佈之間的差異(適當地對各種功能進行排名)對它們進行註釋。當探索無偏的和真實的功能區時,該框架能夠正確地解決稀疏POI數據中的有偏類別。為了驗證我們的框架,通過使用非常大的真實世界用戶來自羅利市的GPS和POI數據對案例研究進行了評估。結果表明,所提出的框架比基準可以更好地識別功能區,因此可以在實際條件下以更精細的粒度增強對城市結構的理解。

    隔離通過檢測不可靠的評分評論來欺騙Yelp的用戶

    原文標題: Quarantine Deceiving Yelp’s Users by Detecting Unreliable Rating Reviews

    地址:


    http://arxiv.org/abs/2004.09721

    作者: Viet Trinh, Vikrant More, Samira Zare, Sheideh Homayon

    摘要: 在決策過程中,在線評論不僅對消費者而且對公司而言,已經成為一種寶貴而重要的資源。在沒有可信系統的情況下,高度受歡迎且值得信賴的Internet用戶將被視為可信圈子的成員。在本文中,我們描述了我們對隔離欺騙性Yelp用戶的關注,這些用戶在橋接評論網絡(BRN)中同時採用了評論峰值檢測(RSD)算法和垃圾郵件檢測技術,並提取了關鍵特徵。我們發現,Yelp帳戶中80%以上的帳戶不可靠,而80%以上信譽良好的企業也遭到了垃圾郵件的攻擊。

    在Facebook上自動識別政治廣告:通過用戶定位來了解操作

    原文標題: Automatically Identifying Political Ads on Facebook: Towards Understanding of Manipulation via User Targeting

    地址:
    http://arxiv.org/abs/2004.09745

    作者: Or Levi, Sardar Hamidian, Pedram Hosseini

    摘要: 俄羅斯干預2016年美國大選的報道引起了公眾關注,這涉及外國行為者增加社會不和並出於政治目的利用個人用戶數據的能力。它引起了關於可用於創建心理資料的數據的方式和程度的問題,以確定哪種廣告最能有效地說服特定地點的某個人參加某項政治事件。在這項工作中,我們研究了美國非營利新聞編輯室ProPublica在2018年美國中期選舉之前的一段時間內使用志願者網絡收集的政治廣告數據集。我們首先描述數據的主要特徵,並通過一系列交互式插圖來探索用戶屬性,包括年齡,區域,活動等。此外,通過用戶定位低估政治操縱的重要第一步是識別與政治相關的廣告,但是由於社交媒體廣告的規模,手動檢查廣告是不可行的。因此,我們解決了在政治廣告和非政治廣告之間自動分類的挑戰,與ProPublica使用的當前基於文本的分類器相比,展示了顯著的進步,並研究了用戶定位屬性是否對這項任務有利。我們的評估揭示了一些問題,例如如何將用戶屬性用於政治廣告定位以及哪些用戶更容易被政治廣告定位。總體而言,我們對數據探索,政治廣告分類和針對定位屬性的初步分析的貢獻旨在支持ProPublica數據集的未來工作,尤其是在通過用戶定位瞭解政治操縱方面。

    強一致性,圖拉普拉斯算子和隨機塊模型

    原文標題: Strong Consistency, Graph Laplacians, and the Stochastic Block Model

    地址:
    http://arxiv.org/abs/2004.09780

    作者: Shaofeng Deng, Shuyang Ling, Thomas Strohmer

    摘要: 譜聚類已經成為數據聚類和社區檢測中最流行的算法之一。我們通過圖拉普拉斯算子研究經典兩步譜聚類的性能,以學習隨機塊模型。我們的目的是回答以下問題:何時通過圖拉普拉斯算子進行譜聚類能夠實現強一致性,即底層隱藏社區的準確恢復?我們的工作提供了與隨機塊模型採樣的鄰接矩陣相關聯的未規範化和規範化拉普拉斯算子的Fielder特徵向量的逐項分析( ell _ infty 範數攝動邊界)。我們證明譜聚類能夠在與信息論極限相匹配的條件下實現種植群落結構的精確恢復。

    定義和識別網絡的最佳嵌入維度

    原文標題: Defining and identifying the optimal embedding dimension of networks

    地址:
    http://arxiv.org/abs/2004.09928

    作者: Weiwei Gu, Aditya Tandon, Yong-Yeol Ahn, Filippo Radicchi

    摘要: 網絡嵌入是一種通用的機器學習技術,可以對向量空間中具有可調維的網絡結構進行編碼。選擇合適的嵌入尺寸-小到可以有效使用而大到可以有效使用-很有挑戰性,但是對於生成適用於多種任務的嵌入來說是必要的。與大多數現有技術依賴於下游任務中的性能最大化不同,在此我們提出一種用於確定最佳維度的原則方法,以便對網絡的所有結構信息進行簡約編碼。該方法已在各種嵌入算法和大量實際網絡中得到驗證。實際網絡中最佳維度的估計值表明,通常可以在低維度空間中進行有效編碼。

    通過圖表徵探索EOSIO

    原文標題: Exploring EOSIO via Graph Characterization

    地址:
    http://arxiv.org/abs/2004.10017

    作者: Yijing Zhao, Jieli Liu, Qing Han, Weilin Zheng, Jiajing Wu

    摘要: EOSIO專為商業分散式應用程序(DApps)設計,是基於委託權益證明(DPoS)的區塊鏈系統。它以其出色的功能(例如免費使用,高吞吐量和生態友好)克服了比特幣和以太坊等傳統區塊鏈系統的不足,從而成為主流的區塊鏈系統之一。儘管EOSIO中存在數十億筆交易,但EOSIO的生態系統仍相對未開發。為了填補這一空白,我們通過調查EOSIO的四個主要活動,即帳戶創建,帳戶投票,匯款和合同授權,對EOSIO進行了系統的圖分析。我們通過圖度量分析獲得了一些新穎的觀察結果,我們的結果揭示了一些異常現象,例如投票團伙和假交易。

    概率圖模型推論的嚴格解釋

    原文標題: Rigorous Explanation of Inference on Probabilistic Graphical Models

    地址:
    http://arxiv.org/abs/2004.10066

    作者: Yifei Liu, Chao Chen, Xi Zhang, Sihong Xie

    摘要: 概率圖模型(例如Markov隨機字段(MRF))利用隨機變量之間的依存關係對豐富的聯合概率分佈族進行建模。複雜的推理算法,例如信念傳播(BP),可以有效地計算邊後驗。儘管如此,對於重要的人類決策,仍然難以解釋推理結果。沒有現有的方法將推理結果嚴格歸因於圖模型的影響因素。 Shapley值提供了一個公理的框架,但是天真地計算或近似於通用圖模型上的值是具有挑戰性的,並且研究較少。我們提出GraphShapley,以一種有原則的方式整合Shapley值的可分解性,MRF的結構以及BP推理的迭代性質,以進行快速的Shapley值計算,即1)系統地列舉了解釋變量對Shapley值的重要貢獻而沒有重複; 2)逐步計算出的貢獻,而無需從頭開始。從理論上講,我們對GraphShapley的獨立性,均等貢獻和可加性進行了表徵。在九張圖上,我們證明GraphShapley提供了明智而實用的解釋。

    體育和政治混合嗎?大聯盟體育和總統候選人球迷基礎的交叉分析

    原文標題: Do Sports and Politics Mix? Cross-Analysis of Fan Bases of Major League Sports and Presidential Candidates

    地址:
    http://arxiv.org/abs/2004.10142

    作者: Shuaidong Pan, Faner Lin, Jiebo Luo

    摘要: 考慮到體育和政治以非常複雜的方式相互作用的事實,該跨學科領域在數據科學研究中仍未觸及。考慮到NBA和NFL等主要體育聯盟擁有龐大的球迷基礎,因此對於我們來說,瞭解體育迷與他們的政治偏好之間的隱秘關係以及這些偏好如何影響他們在支持不同候選人方面的舉動對我們來說至關重要。在總統大選期間。利用Twitter豐富的用戶數據,我們提出了一個新的指標,國會忠誠度評分,可以更準確地對候選人的偏好進行建模。使用擬議的指標,可以在體育級別,州級別和團隊級別對具有強烈政治聯繫的粉絲進行細粒度的分析。儘管某些發現符合以前的研究和報告,但我們還為所有發現提供了更新的見解和定量證據。

    anyMOD-基於圖的框架的能源系統建模,具有高水平的可再生能源和行業整合

    原文標題: anyMOD — A graph-based framework for energy system modelling with high levels of renewables and sector integration

    地址:
    http://arxiv.org/abs/2004.10184

    作者: Leonard Göke

    摘要: 實現氣候目標要求以可再生能源作為主要能源來替代化石燃料。這意味著將直接或通過合成燃料間接使用的風能和太陽能所產生的電力擴展到電力領域之外。對向這種能源系統的轉換進行建模具有挑戰性,因為它需要考慮風和太陽能的波動以及系統可以針對這些波動進行調整的多種方式。本文介紹了anyMOD框架及其基於圖的方法來應對這些挑戰。通過在有根的樹中組織集,可以實現兩個功能,以促進對高比例的可再生能源和行業整合進行建模。首先,時間和空間細節的水平可以通過能量載體來改變。結果,可以減小模型尺寸而不會降低應用於波動的可再生能源的細節水平。此外,可以考慮系統在氣體網絡中的固有靈活性。其次,可以對能量載體的替代進行建模,以取決於相應的環境-轉換,存儲,運輸或需求。這實現了部門整合如何能夠提供靈活性的廣泛表示。

    聲明:Arxiv文章摘要版權歸論文原作者所有,由本人進行翻譯整理,未經同意請勿隨意轉載。本系列在公眾號“網絡科學研究速遞”和個人博客進行同步更新。

    Arxiv網絡科學論文摘要23篇(2020-04-22)


    分享到:


    相關文章: