Arxiv網絡科學論文摘要33篇(2020-04-28)

  • COVID-19大流行期間共享自行車使用的時空分析:以北京為例;
  • 決策與疾病:大流行病中合作的演變;
  • 如何恢復正常:通過使用移動設備的接近感應快速而全面地跟蹤COVID-19的接觸;
  • 如何重啟?基於主體的模擬模型,用於定義公共建築中COVID-19“第二階段”的策略;
  • 加總COVID-19增長率的系統偏差;
  • 具有城際網絡耦合效應的COVID-19分數階SEIHDR模型;
  • 論COVID-19案例分佈的冪律湧現;
  • 使用基於主體的社會模擬分析冠狀病毒大流行對健康、社會和經濟的綜合影響;
  • 預測COVID-19的SUIR模型全局動力學;
  • 互動熱點的動力學-I;
  • 互動熱點的動力學-II;
  • COVID-19的感染率估算和初始感染個體的預測;
  • 分數SIS流行病模型及其解;
  • 第一個COVID-19的Instagram數據集;
  • 主體級大流行模擬(ALPS),用於分析鎖定措施的效果;
  • 為什麼要封城:SARS-CoV-2在印度傳播的網絡方法;
  • 使用Google趨勢評估冠狀病毒鎖定對不快樂、孤獨和無聊的影響;
  • HIV傳播的SICA模型;
  • 帶累積過採樣的快速湯普森採樣算法:預算影響最大化的應用;
  • 使用塊模型的社會困境決策的最優預測和模型選擇;
  • DAN-SNR:用於考慮社交關係的下一個興趣點推薦的深度注意力網絡;
  • 大規模有向網絡的隨機譜共聚;
  • 一種基於命名實體的食譜建模方法;
  • 互聯網人類基礎設施:從哈瓦那StreetNet學到的;
  • 引用級聯與主題相關性的演變;
  • 世界美食的分層聚類;
  • 烹飪食譜中的營養成分估算;
  • 計算法律文件相似性的方法:比較研究;
  • 級聯LSTM:使用深度神經網絡預測信息級聯;
  • 關於Instagram上的多模式受歡迎程度預測的侷限性-新的穩健、有效和可解釋的基準;
  • Twitter上主題標籤的尺度律和動態;
  • 時間網絡中的記憶形狀;
  • 多重馬爾可夫鏈;
  • COVID-19大流行期間共享自行車使用的時空分析:以北京為例

    原文標題: Spatiotemporal Analysis of Share Bike Usage during the COVID-19 Pandemic: a Case Study of Beijing

    地址:
    http://arxiv.org/abs/2004.12340

    作者: Xinwei Chai, Xian Guo, Jihua Xiao, Jie Jiang

    摘要: 在COVID-19流行期間,不僅中國而且整個世界都面臨著嚴重的公共衛生和經濟危機,這種疾病已成為大流行病。由於估算中國的總體損失和預防措施的有效性是一項複雜的任務,因此,我們試圖揭示人們在時間和空間上的行為變化,以推斷其對日常生活和整體經濟的影響。共享自行車的使用可以反映出時空行為模式,因為絕大多數中國城市居民使用共享自行車來連接公共交通工具和旅行的兩端。記錄北京的單車共享系統(BSS)記錄,不僅描述共享單車用戶的時間行為模式:在日常工作,節假日和大流行期間,而且還描述空間行為模式:在購物中心,地鐵,正常社區和受感染社區周圍等等。本文說明了大流行期間共享單車使用的演變,並發現了對生產和社會活動產生重大影響的關鍵時間和地點。通過在時間上進行共址分析,推斷出公共衛生干預措施與改進的COVID-19爆發控制的關聯。這些發現可能提供有關如何應對其他流行病的重要信息。

    決策與疾病:大流行病中合作的演變

    原文標題: Decisions and disease: the evolution of cooperation in a pandemic

    地址:
    http://arxiv.org/abs/2004.12446

    作者: Julie Rowlett, Carl-Joar Karlsson

    摘要: 面對大流行,個人可以決定是否採取行動來減輕疾病的傳播(合作),還是不(缺陷),導致類似於囚徒困境的“疾病困境”。合作需要個人改變其日常行為以造福他人。人群中的合作率與疾病的傳播率直接相關。不幸的是,演化的博弈動力學預測所有個體都會演化為“缺陷”。在這裡,我們將疾病難題與用於不賦予免疫力的疾病的區室模型相結合。我們證明,如果個人接收信息的時間尺度與疾病傳播的時間尺度相比足夠快,那麼就會出現合作,並且可以控制疾病。當遇到新的傳染病時,我們的結果可能對最好的行動方案有影響。

    如何恢復正常:通過使用移動設備的接近感應快速而全面地跟蹤COVID-19的接觸

    原文標題: How to Return to Normalcy: Fast and Comprehensive Contact Tracing of COVID-19 through Proximity Sensing Using Mobile Devices

    地址:
    http://arxiv.org/abs/2004.12576

    作者: Ye Xia, Gwendolyn Lee

    摘要: 我們概述了基於使用移動設備的接近感測的接觸跟蹤策略。我們討論理想系統的外觀和功能。我們表明,如果採用足夠廣泛的接觸追蹤策略,則可以使COVID-19受到完全控制,可以消除與社會的距離,並使社會恢復正常。我們還將回顧當前的近距離傳感技術所面臨的一些挑戰,包括電話使用的藍牙低功耗技術,並考慮臨時和長期解決方案。我們的主要貢獻在於,我們通過推理來解釋為什麼這樣的聯繫跟蹤策略很可能會實現所陳述的恢復完全正常狀態的目標。使用概率模型,我們表明通用採用不是實現既定目標的必要條件,因此存在一些例外的餘地。但是收養率必須很高,例如高於 95%,具體取決於疾病參數。隨著在疾病監測中提高警惕以及早發現輕症病例,這一數字可能會降低到約90%。結果要求由州或聯邦級別的公共機構領導部署工作,以便達到所需的採用率,並且跟蹤範圍足夠廣泛以與疾病控制相關。

    如何重啟?基於主體的模擬模型,用於定義公共建築中COVID-19“第二階段”的策略

    原文標題: How to restart? An agent-based simulation model towards the definition of strategies for COVID-19 “second phase” in public buildings

    地址:
    http://arxiv.org/abs/2004.12927

    作者: Marco D’Orazio, Gabriele Bernardini, Enrico Quagliarini

    摘要: 應通過操作措施來支持在COVID-19緊急情況的“第二階段”中重新開始公共建築活動,以避免再次傳播病毒。由於長時間與感染者接觸,容納相同用戶持續存在的建築物以及在空間/時間上人滿為患的建築物(例如大型辦公室,大學)是關鍵場景。除了個人執行的風險緩解策略(面罩)外,利益相關者還應推廣其他策略,即乘員的負荷限制(邁向“社會隔離”)和訪問控制。仿真器可以支持措施有效性評估。這項工作提供了一個基於主體的模型來估計病毒在封閉的構建環境中的傳播。該模型採用概率方法,根據國際衛生組織提出的基於接近度和基於暴露時間的規則,共同模擬乘員的活動和病毒傳播。可以根據建築物佔用,緩解策略和病毒相關方面來定義方案。該模型在實驗數據(“鑽石公主”號巡洋艦)上進行了校準,然後應用於相關的案例研究(大學校園的一部分)。結果證明了模型的功能。關於案例研究,採用口罩似乎是通過保持可接受的感染人數來減少每種初始條件下病毒傳播的最重要策略。建築物容量的限制可能會通過將佔用者使用的FFPk口罩轉換為手術口罩來支持這種措施(從而改善了使用者的舒適度)。提出了將可接受的面罩過濾器-乘員的密度組合相結合的初步模型。可以對模型進行修改,以考慮其他公共建築(例如旅遊設施,文化建築)中的其他重複性場景。

    加總COVID-19增長率的系統偏差

    原文標題: Systematic Biases in Aggregated COVID-19 Growth Rates

    地址:
    http://arxiv.org/abs/2004.12994

    作者: Keith Burghardt, Kristina Lerman

    摘要: COVID-19大流行已成為現代最大的公共衛生挑戰之一。政策制定者依靠衡量疾病傳播的速度來制定緩解策略的決策。我們分析了有關確認的COVID-19感染和死亡的美國縣級數據,以表明其影響是不同的。一小部分縣佔所有感染和死亡的大多數。這些熱點與疾病較早到達並增長較快的人口稠密地區有關。當彙總縣級數據以創建州級和國家級統計數據時,這些熱點系統地偏向增長率。結果,感染和死亡似乎在較大規模上比在組成較大區域的典型縣內更快地增長。公共政策,經濟分析和流行病模型必須考慮到空間聚集帶來的潛在扭曲。

    具有城際網絡耦合效應的COVID-19分數階SEIHDR模型

    原文標題: A fractional-order SEIHDR model for COVID-19 with inter-city networked coupling effects

    地址:
    http://arxiv.org/abs/2004.12308

    作者: Zhenzhen Lu, Yongguang Yu, YangQuan Chen, Guojian Ren, Conghui Xu, Shuhui Wang, Zhe Yin

    摘要: 本文提出了一個數學模型來分析COVID-19的動態行為。基於城際網絡耦合效應,討論了分數階SEIHDR系統,該系統具有2020年1月23日至3月18日的COVID-19真實數據。同時,該模型首先考慮了住院患者和三種類型的患者(暴露,感染和住院)的死亡率。本文還考慮了個體在孵化過程中的傳染性。通過應用最小二乘法和預測校正器方案,利用從1月23日到 18-m 的實際數據,刺激了所提出系統在沒有城際網絡和城際網絡的情況下的數值解。 2020年3月,其中 m 等於預測天數。與整數階系統( alpha = 0 )相比,無網絡分數階模型經過驗證,可以更好地擬合北京,上海,武漢,皇崗等城市的數據。與沒有網絡的情況相比,該結果表明,由於封鎖和隔離措施的存在,城際網絡系統可能不是中國病毒傳播的重要案例,但是,它可能會對那些尚未建立網絡的城市產生影響。通過城市封閉。同時,提出的模型更適合2月24日至3月31日在意大利的數據,並且該分數階模型也預測了確診人數的高峰。此外,在提出的系統中考慮了在初始條件下有界解的存在性和唯一性。之後,對基本繁殖數 R_0 進行分析,並發現它具有一個閾值:當 R_0 le 1 時,無病平衡點在局部漸近穩定,這為COVID-19是否變為未來大流行。

    論COVID-19案例分佈的冪律湧現

    原文標題: On the Emergence of a Power Law in the Distribution of COVID-19 Cases

    地址:
    http://arxiv.org/abs/2004.12772

    作者: Brendan K. Beare, Alexis Akira Toda

    摘要: 2020年1月21日報道了美國首例確診的2019年冠狀病毒病病例(COVID-19)。到2020年3月底,美國已確診病例超過350000,分佈在2000多個縣中。我們發現該分佈的上尾部表現出冪定律,帕累託指數接近於一。我們調查涉及吉布拉特定律的COVID-19案例增長的簡單模型是否可以解釋該冪定律的出現。對該模型進行了校準,以匹配(i)確診病例的增長率,以及(ii)每個縣內存在COVID-19的不同時間長度。經過校準後,該模型將生成冪定律,其帕累託指數幾乎與3月底根據各縣的確診病例分佈直接估算的指數相等。

    使用基於主體的社會模擬分析冠狀病毒大流行對健康、社會和經濟的綜合影響

    原文標題: Analysing the combined health, social and economic impacts of the corovanvirus pandemic using agent-based social simulation

    地址:
    http://arxiv.org/abs/2004.12809

    作者: Frank Dignum, Virginia Dignum, Paul Davidsson, Amineh Ghorbani, Mijke van der Hurk, Maarten Jensen, Christian Kammler, Fabian Lorig, Luis Gustavo Ludescher, Alexander Melchior, René Mellema, Cezara Pastrav, Loïs Vanhee, Harko Verhagen

    摘要: 在COVID-19危機期間,政府和其他決策者不得不做出許多困難的決定。例如。我們要完全封鎖還是讓學校開門?多少人以及應該測試哪些人?儘管有很多很好的模型,例如流行病學家在一定條件下對病毒的傳播,這些模型並未直接轉化為政府可以採取的干預措施。這些模型都不能有助於理解干預措施的經濟和/或社會後果。但是,有效和可持續的解決方案需要考慮多種因素的組合。在本文中,我們提出了一種基於主體的社會模擬工具ASSOCC,該工具可幫助決策者瞭解政策干預措施的可能後果,並探索這些干預措施的綜合社會,健康和經濟後果。

    預測COVID-19的SUIR模型全局動力學

    原文標題: Global dynamics of a SUIR model with predicting COVID-19

    地址:
    http://arxiv.org/abs/2004.12433

    作者: Jingyuan Wang, Xin Lin, Yuxi Liu, Qilegeri, Hui Lin, Manqing Wu

    摘要: 自2019年12月以來,一種新型冠狀病毒(2019-nCoV)在中國已經流行,它可以引起呼吸系統疾病和嚴重的肺炎。依靠新病例的發病率來預測流行病暴發的流行病模型受到越來越多的關注。但是,該領域的許多先前工作大多專注於傳統SIR模型的應用,而忽略了2019-nCoV的傳播特徵,這是未診斷病例的傳染性。在此,我們提出基於經典SIR模型對象的SUIR模型,以監督傳染病的有效預測,預防和控制。 SUIR模型添加了流行病的獨特 U (未診斷)狀態,並將人群分為四個狀態:S(易感),U(未診斷),I(傳染性和非傳染性)和R(已恢復)。這種方法使我們能夠有效預測2019-nCoV的發生率,並且模型準確性的明顯優勢比傳統的SIR模型更可靠。

    互動熱點的動力學-I

    原文標題: Dynamics of Interacting Hotspots — I

    地址:
    http://arxiv.org/abs/2004.12799

    作者: Suman Dutta

    摘要: COVID-19在全球範圍內的傳播要求快速開發新的建模策略以估計其空前的傳播。在這裡,我們介紹了一個基於隨機疾病的基本SIR方程的模型,該模型通過在城市之間隨機交換受感染人口來研究模型狀態下震中相互作用網絡中的動力學。儘管每個隨機交換都成對保存種群,但這種疾病驅使全球系統朝著達到動態平衡的新途徑發展。通過控制交換分數的範圍,我們表明可以控制傳播熱點之間的分佈異質性和合作性。德國聯邦州受感染人口的集體時間演化數據證明了該模型的定性特徵。

    互動熱點的動力學-II

    原文標題: Dynamics of Interacting Hotspots - II

    地址:
    http://arxiv.org/abs/2004.12780

    作者: Suman Dutta

    摘要: 在沒有任何適當的臨床解決方案的情況下,人類文明只能採取複雜的干預措施來遏制COVID-19的傳播。但是,現有的估計干預措施的模型並未考慮到大流行中心的現實聯繫。我們推廣了我們先前討論的熱點互動模型,以測試在由多個震中組成的模型狀態下進行干預的各種可能性。我們還分析了熱點在空間上相關並且相互作用僅限於與最近鄰的人口交換的情況。我們表明,感染傳播中的異質性僅取決於收容措施及其強度。我們探討了許多此類情況並討論了可能性。

    COVID-19的感染率估算和初始感染個體的預測

    原文標題: Estimation of Infection Rate and Prediction of Initial Infected Individuals of COVID-19

    地址:
    http://arxiv.org/abs/2004.12665

    作者: Seo Yoon Chae, Kyoung-Eun Lee, Hyun Min Lee, Nam Jun, Quang Ahn Le, Biseko Juma Mafwele, Tae Ho Lee, Doo Hwan Kim, Jae Woo Lee

    摘要: 我們考慮到冠狀病毒在中國武漢市爆發後在某些選定國家大範圍傳播的COVID-19。我們使用流行病初期的易感性(S),可傳染性(I),隔離(Q)和確定的治癒率(Rk)的官方報告數據,估算了COVID-19的感染率和最初感染的個體。 )人口模型,即所謂的SIQRk模型。在報告的數據中,我們知道了隔離病例和恢復病例。我們無法從無症狀病例中得知康復病例。在SIQRk模型中,我們可以根據數據擬合估計模型參數和初始感染病例(確認為無症狀病例)。對於某些選定的國家,我們獲得的感染率在0.233至0.462的範圍內,基本繁殖數Ro在1.8至3.5的範圍內,初始感染人數在10至8409之間。通過使用擬合參數,我們可以估算出政府執行隔離政策時德國的最長感染時間。在確定第一批患者後約六個月,該病正處於平靜狀態。

    分數SIS流行病模型及其解

    原文標題: Fractional SIS epidemic models and their solutions

    地址:


    http://arxiv.org/abs/2004.12803

    作者: Caterina Balzotti, Mirko D’Ovidio, Paola Loreti

    摘要: 在人口規模恆定的情況下,這項工作涉及分數SIS流行病模型。我們提供了在適當假設下分數模型的顯式解的表示形式,並且通過考慮兩個數值方案來驗證結果。我們研究了分數階 alpha uparrow1 的極限情況的顯式表示形式和數值方案,該分數情形與眾所周知的普通SIS模型相對應,並且通過比較這兩個模型來分析分數導數的作用。

    第一個COVID-19的Instagram數據集

    原文標題: A First Instagram Dataset on COVID-19

    地址:
    http://arxiv.org/abs/2004.12226

    作者: Koosha Zarei, Reza Farahbakhsh, Noel Crespi, Gareth Tyson

    摘要: 新型冠狀病毒(COVID-19)大流行性暴發正在極大地塑造和重塑我們生活的許多方面,對我們的社交生活產生了巨大影響。在這個世界上大多數主要城市的封鎖政策時代,我們看到社交媒體上的人員和專業參與度急劇增加。社交媒體在新聞傳播以及與人們保持聯繫方面發揮著重要作用。同時,由於冠狀病毒信息流行已成為人們關注的主要問題,因此,這一來源既是福也是禍,而且已經是一個需要特別關注和進一步研究的話題。在本文中,我們提供了自2020年3月30日以來一直在收集的多語種冠狀病毒(COVID-19)Instagram數據集。我們正在將數據集提供給Github的研究社區。我們認為,這一貢獻將幫助社區更好地瞭解作為主要社交媒體之一的Instagram中這種現象背後的動態。該數據集還可以幫助研究與此爆發有關的錯誤信息的傳播。

    主體級大流行模擬(ALPS),用於分析鎖定措施的效果

    原文標題: Agent-Level Pandemic Simulation (ALPS) for Analyzing Effects of Lockdown Measures

    地址:
    http://arxiv.org/abs/2004.12250

    作者: Anuj Srivastava

    摘要: 本文開發了一種稱為ALPS的主體級模擬模型,用於模擬密閉社區中傳染病的傳播。傳播的機制是使用“電暈” COVID-19大流行報道的參數進行的人與人之間的接觸。 ALPS模擬的主要目標是分析預防措施(實施和取消鎖定規範)對感染率,死亡率和恢復率的影響。模型的假設和選擇代表了相互競爭的需求之間的平衡,即現實的需求與實時推理的效率。該模型通過實施和保持限制性措施來量化減少傷亡的收益。

    為什麼要封城:SARS-CoV-2在印度傳播的網絡方法

    原文標題: Why lockdown : On the spread of SARS-CoV-2 in India, a network approach

    地址:
    http://arxiv.org/abs/2004.11973

    作者: Pradumn Kumar Pandey, Bibhas Adhikari

    摘要: 我們分析了印度從2020年3月1日到2020年4月17日受COVID-19影響的地區或城市的時間序列數據。我們在時間序列網絡數據的框架內研究數據。使用緯度和經度座標指定的地區或城市的測地距離定義網絡。我們特別將分析範圍限制在印度東北部以外的所有地區。與近期對SARS-CoV-2感染人數預測的最新研究不同,在本說明中,重點在於瞭解印度各地病毒傳播的動態。我們通過考慮幾種措施對模型網絡進行譜和結構分析,特別是譜半徑,代數連通性,平均聚類係數,平均路徑長度和群落結構。此外,我們研究了鎖定前後的地區或城市數量給出的總體擴張屬性。這些研究表明,封鎖對SARS-CoV-2在長途地區或城市中的傳播具有重大影響。但是,只有在鎖定大約兩週後才能觀察到這種影響。我們推測,發生這種情況是由於在鎖定之前對COVID-19的測試數量不足,這無法阻止被病毒感染但未被發現的人的長距離移動。

    使用Google趨勢評估冠狀病毒鎖定對不快樂、孤獨和無聊的影響

    原文標題: Assessing the impact of the coronavirus lockdown on unhappiness, loneliness, and boredom using Google Trends

    地址:
    http://arxiv.org/abs/2004.12129

    作者: Abel Brodeur, Andrew E. Clark, Sarah Fleche, Nattavudh Powdthavee

    摘要: COVID-19大流行導致許多政府實施封鎖。雖然封鎖可能有助於遏制病毒的傳播,但有可能對人口的福祉造成實質性損害。這項研究基於Google趨勢數據,並測試了在歐美實施的鎖定是否導致與健康相關的主題搜索字詞發生了變化。使用不同的方法評估鎖定的因果關係,我們發現歐洲和美國的無聊搜索強度大大增加。我們還發現孤獨感,憂慮和悲傷的搜索量顯著增加,而壓力,自殺和離婚的搜索反而下降了。我們的結果表明,鎖定可能嚴重影響了人們的心理健康。

    HIV傳播的SICA模型

    原文標題: On SICA models for HIV transmission

    地址:
    http://arxiv.org/abs/2004.11903

    作者: Cristiana J. Silva, Delfim F. M. Torres

    摘要: 我們重新審視了SICA(易感性傳染性慢性艾滋病)數學模型,該模型用於在均勻混合的人群中以不同的人口規模傳播人類免疫缺陷病毒(HIV)的傳播動力學。我們考慮由常微分方程系統給出的SICA模型,以及由分數階和隨機微分算子給出的系統的一些概括。對於確定性,分數和隨機類型的SICA模型,證明了局部和全局穩定性結果。對佛得角和摩洛哥的兩個案例研究進行了調查。

    帶累積過採樣的快速湯普森採樣算法:預算影響最大化的應用

    原文標題: Fast Thompson Sampling Algorithm with Cumulative Oversampling: Application to Budgeted Influence Maximization

    地址:
    http://arxiv.org/abs/2004.11963

    作者: Shatian Wang, Shuoguang Yang, Zhen Xu, Van-Anh Truong

    摘要: 我們提出了湯普森採樣(TS)的累積過採樣(CO)技術,與現有的過採樣框架相比,可使用後驗分佈中明顯更少的樣本來構造樂觀參數估計。我們將CO應用於具有邊權重線性泛化的影響最大化(IM)半強盜的新預算變體。將CO與針對離線問題設計的預言相結合,我們的在線學習算法可同時解決預算分配,參數學習和獎勵最大化的難題。我們證明,我們的在線學習算法可實現與IM半強盜基於UCB的算法相當的規模後悔。這是基於IM的基於TS的IM半強盜算法的第一個遺憾,它不線性依賴於邊的最小觀察概率的倒數。在數值實驗中,我們的算法在很大程度上優於所有基於UCB的替代方案。

    使用塊模型的社會困境決策的最優預測和模型選擇

    原文標題: Optimal prediction of decisions and model selection in social dilemmas using block models

    地址:
    http://arxiv.org/abs/2004.12151

    作者: Sergio Cobo-Lopez, Antonia Godoy-Lorite, Jordi Duch, Marta Sales-Pardo, Roger Guimera

    摘要: 增進我們對人類行為的理解取決於理論揭示這些行為背後機制的能力。衡量理論和模型預測未觀察到的行為的能力可提供一種有原則的方法來評估其優點,從而幫助確定最合理的機制。在這裡,我們提出模型並開發嚴格的推理方法來預測二元社會困境中的戰略決策。特別是,我們使用了包含有關個人所面臨困境的信息的二部隨機塊模型。我們顯示,將這些模型與關於二元社會困境中戰略決策的經驗數據結合起來,儘管不是“理性的”,但單個戰略決策在很大程度上是可以預測的。通過對這些模型的分析,我們可以得出以下結論:(i)個人沒有根據其博弈論結構來感知博弈; (ii)個人使用多種簡單策略的組合做出決策,而我們的方法自然可以揭示這些策略。

    DAN-SNR:用於考慮社交關係的下一個興趣點推薦的深度注意力網絡

    原文標題: DAN-SNR: A Deep Attentive Network for Social-Aware Next Point-of-Interest Recommendation

    地址:
    http://arxiv.org/abs/2004.12161

    作者: Liwei Huang, Yutao Ma, Yanbo Liu, Keqing He

    摘要: 近年來(或以後)的興趣點(POI)建議已引起越來越多的關注。先前的大多數研究都試圖將時空信息和用戶簽到的順序模式納入推薦模型中,以預測目標用戶的下一步行動。但是,這些方法都沒有利用每個用戶朋友的社會影響力。在這項研究中,我們討論了下一個POI推薦的新主題,並提出了一個用於社交的下一個POI推薦的深層關注網絡,稱為DAN-SNR。特別是,DAN-SNR利用自我注意力機制代替循環神經網絡的體系結構,以統一的方式對順序影響和社會影響進行建模。此外,我們設計並實現了兩個並行渠道,分別捕獲短期用戶偏好和長期用戶偏好以及社會影響力。通過利用多頭注意力,DAN-SNR可以有效地對任意兩個歷史值機之間的遠程依賴性進行建模,並自適應地權衡它們對下一個目的地的貢獻。此外,我們使用從兩個流行的基於位置的社會網絡Gowalla和Brightkite收集的大規模現實世界數據集進行了全面評估。實驗結果表明,DAN-SNR在推薦性能方面優於7種競爭基準方法,並且在6種基於神經網絡和注意力的方法中效率很高。

    大規模有向網絡的隨機譜共聚

    原文標題: Randomized spectral co-clustering for large-scale directed networks

    地址:
    http://arxiv.org/abs/2004.12164

    作者: Xiao Guo, Yixuan Qiu, Hai Zhang, Xiangyu Chang

    摘要: 有向網絡通常用於表示單元之間的不對稱關係。共聚旨在同時對有向網絡的發送者和接收者進行聚類。特別地,可以將眾所周知的譜聚類算法修改為譜共聚到共聚有向網絡。但是,大型網絡對其提出了計算挑戰。在本文中,我們利用隨機素描技術來加速譜共聚算法,以便更有效地共聚大規模有向網絡。具體來說,我們推導了兩個系列的隨機譜共聚算法,一個是基於隨機投影的算法,另一個是基於隨機採樣的算法。從理論上講,我們在兩個生成模型 textendash emph 隨機協同塊模型和 emph 度校正隨機協同塊模型下分析所得算法。建立了近似誤差率和聚類錯誤率,與共聚文獻的最新結果相比,它們顯示出更好的界限。在數值上,我們進行仿真以支持我們的理論結果,並在具有多達數千萬個節點的真實網絡上測試算法的效率。

    一種基於命名實體的食譜建模方法

    原文標題: A Named Entity Based Approach to Model Recipes

    地址:
    http://arxiv.org/abs/2004.12184

    作者: Nirav Diwan, Devansh Batra, Ganesh Bagler

    摘要: 如果正確分析和表示食譜文本不同部分的規則和語義,則傳統的烹飪食譜遵循的結構可以很好地建模。我們提出了一種可以精確表示配方的結構,以及一種可以在這種統一結構中推斷配方最佳表示的管道。配方中的“成分”部分通常列出所需的成分以及相應的屬性,例如數量,溫度和加工狀態。可以通過定義這些屬性及其值來建模。組成食譜的物理實體可以大致分為炊具,食材及其組合,它們與烹飪技術有關。說明部分列出了一系列事件,在這些事件中,對這些器皿和配料應用了烹飪技術或過程。我們以元組的形式對這些關係進行建模。因此,結合使用這些方法,我們在數據集RecipeDB中對烹飪食譜建模,以顯示該方法的有效性。該挖掘的信息模型可以具有多種應用程序,包括在語言之間翻譯食譜,確定食譜之間的相似性,生成新食譜以及估算食譜的營養狀況。為了識別成分屬性,我們訓練了命名實體關係(NER)模型,並藉助K-Means聚類分析了推理。我們的模型在所有數據集中的F1得分均為0.95。在說明部分中,我們使用類似的NER標籤模型來標記烹飪技術(F1得分= 0.88)和器皿(F1得分= 0.90)。最後,我們確定配料,餐具和烹飪技術之間關係的時間順序,以對指導步驟進行建模。

    互聯網人類基礎設施:從哈瓦那StreetNet學到的

    原文標題: Internet-human infrastructures: Lessons from Havana’s StreetNet

    地址:
    http://arxiv.org/abs/2004.12207

    作者: Abigail Z. Jacobs, Michaelanne Dye

    摘要: 我們提出了一種混合方法來理解StreetNet(SNET)底層的人力基礎設施,SNET是一個分佈式的,社區運行的企業內部網,是古巴哈瓦那的主要“互聯網”。我們將人種學研究與社會網絡和組織的研究聯繫起來,以瞭解權力嵌入哈瓦那SNET結構的方式。通過定量和定性地解壓縮SNET的人員基礎結構,這項工作揭示了分佈式基礎結構必然如何嵌入該基礎結構中分佈的不平等的結構方面。傳統的網絡技術測量反映了形成最終網絡的社會,組織,空間和技術限制,而人種志可以幫助發現這些隱藏的支持關係的結構和作用。通過合併這些觀點,這項工作有助於我們理解網絡在增長和維護分佈式基礎結構中的作用,並揭示新的方法來理解更大,更復雜的Internet-人基礎結構-包括Internet和WWW。

    引用級聯與主題相關性的演變

    原文標題: Citation Cascade and the Evolution of Topic Relevance

    地址:


    http://arxiv.org/abs/2004.12275

    作者: Chao Min, Qingyu Chen, Erjia Yan, Yi Bu, Jianjun Sun

    摘要: 引文分析作為科學定量研究的一種工具,長期以來一直強調直接引文關係,而忽略了間接或高階引文。但是,一系列早期和最近的研究表明,跨代存在間接和連續引用影響。除了有關高序引用的文獻外,我們還介紹了引用級聯的概念:由某個出版物發起的一系列後續引用事件的構成。我們通過分析超過450,000篇文章和超過600萬種引用關係來研究這種引用結構。我們表明,引用影響不僅存在於先前研究記錄的三個世代中,而且還存在於更遠的世代中。儘管如此,我們的實驗結果仍然表明,兩到四代人通常足以追蹤作品的科學影響。我們還探討了特定的結構特性,例如深度,寬度,結構病毒性和大小,這些特性可解釋各個引用級聯之間的差異。最後,我們發現有證據表明,對於跨領域(或間接相關領域)的作品進行科學研究,比僅獲得內部領域的認可更重要,以取得高影響。我們的方法和發現可以作為科學評估和科學史建模的新工具。

    世界美食的分層聚類

    原文標題: Hierarchical Clustering of World Cuisines

    地址:


    http://arxiv.org/abs/2004.12283

    作者: Tript Sharma, Utkarsh Upadhyay, Jushaan Kalra, Sakshi Arora, Saad Ahmad, Bhavay Aggarwal, Ganesh Bagler

    摘要: 儘管使用了共同的食材和烹飪技術,但世界各地的文化已發展成具有獨特的模式。利用從食譜在線資源RecipeDB獲得的數據,我們提取了26種世界美食的模式,並進一步探討了它們之間的相互關係。通過頻繁的項目集挖掘和成分真實性的應用,我們描繪出了美食中的典型模式,並建立了世界美食的等級樹。這棵樹提供了有關美食演變及其地理和歷史關聯性的有趣見解。

    烹飪食譜中的營養成分估算

    原文標題: Nutritional Profile Estimation in Cooking Recipes

    地址:
    http://arxiv.org/abs/2004.12286

    作者: Jushaan Kalra, Devansh Batra, Nirav Diwan, Ganesh Bagler

    摘要: 食譜的準確營養狀況的可用性是食品數據庫具有多個應用程序的重要功能,其中包括營養輔助,推薦系統和飲食分析等應用。通常在在線數據庫中,從各種來源獲取食譜,以嘗試使食譜的數量和數據集的種類最大化。這導致營養細節不完整且通常不可靠。我們提出了一種可擴展的方法,可使用標準的可靠營養值數據庫從其成分部分估算配方的營養成分。先前的研究證明了在小型數據集上使用字符串匹配方法的效率。為了證明我們程序的有效性,我們使用美國農業部標準參考(USDA-SR)數據庫作為計算營養狀況的參考,將建議的方法應用於大型數據集RecipeDB,其中包含來自多個數據源的配方。我們通過計算食譜數據庫中的平均誤差(每份熱量36卡路里)來評估我們的方法,該誤差完全在可歸因於身體差異的誤差範圍內。

    計算法律文件相似性的方法:比較研究

    原文標題: Methods for Computing Legal Document Similarity: A Comparative Study

    地址:
    http://arxiv.org/abs/2004.12307

    作者: Paheli Bhattacharya, Kripabandhu Ghosh, Arindam Pal, Saptarshi Ghosh

    摘要: 在法律信息檢索領域,計算兩個法律文檔之間的相似性是一項重要且具有挑戰性的任務。查找相似的法律文件在下游任務中有許多應用,包括事前案例檢索,法律文章推薦等。先前的工作提出了兩種測量法律文件之間相似性的廣泛方法-分析先例引用網絡,以及基於文本內容相似性度量來測量相似性。但是,尚未在通用平臺上對這些現有方法進行全面比較。在本文中,我們對現有方法進行了首次系統分析。此外,我們探索了兩種有前途的新的相似度計算方法-一種是基於文本的,另一種是基於網絡嵌入的,至今尚未考慮。

    級聯LSTM:使用深度神經網絡預測信息級聯

    原文標題: Cascade-LSTM: Predicting Information Cascades using Deep Neural Networks

    地址:
    http://arxiv.org/abs/2004.12373

    作者: Sameera Horawalavithana, John Skvoretz, Adriana Iamnitchi

    摘要: 從傳播醫療保健消息到模因跟蹤,預測動態社會環境中的信息流與當代社會的許多領域都息息相關。儘管已經在各種社交平臺上成功解決了預測信息級聯的增長的問題,但預測信息級聯的時間和拓撲結構卻受到了有限的探索。但是,準確預測有多少用戶將發送特定用戶的消息,以及在什麼時間設計實用的干預技術至關重要。本文利用長時記憶(LSTM)神經網絡技術來預測信息級聯的兩個時空特性,即各個級別信息傳輸的大小和速度。我們將這些預測算法與級聯樹的概率生成結合到一個生成測試模型中,該模型能夠在兩個不同的平臺Reddit和Github中準確生成級聯樹。我們的方法導致在各種社交平臺中,信息傳輸器的分類準確性超過73%,早期傳輸器的分類準確性超過83%。

    關於Instagram上的多模式受歡迎程度預測的侷限性-新的穩健、有效和可解釋的基準

    原文標題: On the Limits to Multi-Modal Popularity Prediction on Instagram — A New Robust, Efficient and Explainable Baseline

    地址:
    http://arxiv.org/abs/2004.12482

    作者: Christoffer Riis, Damian Konrad Kowalczyk, Lars Kai Hansen

    摘要: 社交媒體受歡迎程度的可預測性是一個具有極大科學意義和重大實際意義的主題。我們為Instagram上的流行度預測提供了一個新的強基準,它既健壯又高效。該方法通過對視覺模態的多種表示形式的預測能力進行全面的消融研究以及詳細使用可解釋性工具來擴展以前的工作。我們使用轉移學習將視覺語義提取為概念,場景和對象,這使我們能夠解釋和解釋經過訓練的模型和預測。這項研究基於從Instagram摘錄的100萬篇帖子中。我們將受歡迎程度預測問題視為排名問題,在其中我們預測對數歸一化的喜歡人數。通過我們的消融研究設計,我們可以建議模型,該模型優於用於Instagram上的多模式受歡迎程度預測的現有最新黑盒方法。

    Twitter上主題標籤的尺度律和動態

    原文標題: Scaling laws and dynamics of hashtags on Twitter

    地址:


    http://arxiv.org/abs/2004.12707

    作者: Hongjia H. Chen, Tristram J. Alexander, Diego F.M. Oliveira, Eduardo G. Altmann

    摘要: 在本文中,我們量化了Twitter上#標籤使用頻率的統計屬性和動態變化。標籤是社交媒體中用來吸引注意力和組織內容的特殊單詞。通過查看一段時間內使用的所有主題標籤的集合,我們確定了主題標籤頻率分佈(Zipf定律),作為標籤大小的函數的唯一主題標籤的數量(希普斯定律)的定標定律。期望值(泰勒定律)。儘管這些尺度定律似乎是通用的,但在某種意義上,無論何時採集樣品,都可以觀察到相似的指數,但標籤的數量和性質在很大程度上取決於時間,在微小的範圍內會出現爆發,這是胖尾的。噪聲和遠程相關性。我們通過計算相距獲得 tau 的標籤分佈之間的Jensen-Shannon散度來量化這種動態,我們發現變化的速度大約衰減了 1 / tau 。我們的發現基於對2015年至2016年使用的35億個標籤的分析。

    時間網絡中的記憶形狀

    原文標題: The shape of memory in temporal networks

    地址:
    http://arxiv.org/abs/2004.12784

    作者: Oliver E. Williams, Lucas Lacasa, Ana P. Millán, Vito Latora

    摘要: 時間網絡是用於描述複雜系統的體系結構的廣泛使用的模型。網絡內存-時空網絡的結構對其過去的依賴-已顯示出它在網絡上發生的擴散,流行病和其他過程中甚至在改變其社區結構方面發揮著重要作用。最近的工作提出了通過使用高階馬爾可夫模型來估計時間網絡中的存儲器長度。在這裡,我們顯示網絡內存本質上是多維的,無法有意義地減少為單個標量。因此,我們引入了一個數學框架,用於定義和有效估計內存的微觀形狀,從而充分表徵每個鏈接的活動如何與所有其他鏈接的活動交織在一起。我們在具有可調整內存的各種時態網絡綜合模型中驗證了我們的方法,然後研究了各種現實網絡中出現的內存的異構形狀。

    多重馬爾可夫鏈

    原文標題: Multiplex Markov Chains

    地址:
    http://arxiv.org/abs/2004.12820

    作者: Dane Taylor

    摘要: 多重網絡是互連繫統和多模式數據的通用建模框架,但是對於多重性如何影響隨機過程,我們仍然缺乏基本的見識。我們引入了“馬爾可夫鏈的馬爾可夫鏈”模型,使得可能帶有(1- omega) in [0,1] 的隨機遊走者留在同一層,並遵循(特定於層的) emph 層內馬爾可夫鏈,而它們以 omega 的概率沿著(特定於節點的) emph interlayer Markov chain移動到不同的層。通過耦合“馬爾可夫鏈層”與“網絡層”,我們確定了新的由多重性引起的現象,包括 emph 多重不平衡(從而可逆馬爾可夫鏈的多重耦合產生了不可逆的)和 emph 多重對流(從而靜態分佈展示出涉及多層的循環流。發現這些現象(以及收斂速度 lambda_2 )對中間的 omega 表現出最佳狀態,並且我們探討了它們與節點內層度不平衡的關係。為了提供分析的見解,我們描述了各層之間以及各層之間的過渡之間存在時標分隔時(即 omega to0 和 omega to1 )的平穩分佈的特徵。

    聲明:Arxiv文章摘要版權歸論文原作者所有,由本人進行翻譯整理,未經同意請勿隨意轉載。本系列在公眾號“網絡科學研究速遞”和個人博客進行同步更新。

    Arxiv網絡科學論文摘要33篇(2020-04-28)


    分享到:


    相關文章: