畫個草圖生成2K高清視頻，這份效果驚艷研究值得你跑一跑

2018-08-20 18:34:00 機器之心

選自GitHub，作者：Ting-Chun Wang 等，機器之心編譯，參與：劉曉坤、王淑婷。

在圖像到圖像合成的研究領域熱火朝天的當下，英偉達又放大招，聯合 MIT CSAIL 開發出了直接視頻到視頻的轉換系統。該系統不僅能用語義分割掩碼視頻合成真實街景視頻，分辨率達到 2K；能用草圖視頻合成真實人物視頻；還能用姿態圖合成真人舞蹈視頻。更令人驚豔的是，在語義分割掩碼輸入下，換個掩碼顏色該系統就能直接將街景中的樹變成建築！目前該項目已開源。

項目展示：https://tcwang0509.github.io/vid2vid/
項目地址：https://github.com/NVIDIA/vid2vid

1 引言

模擬和再現動態視覺世界對於打造智能體來說必不可少。除了純粹的科學興趣，學習合成連續的視覺體驗在計算機視覺、機器人學和計算機圖形學領域都有廣泛的應用。例如對於 model-based 的強化學習，逼近動態視覺的視頻合成模型能以較少的真實體驗數據訓練智能體。使用學習的視頻合成模型，人們可以生成逼真的視頻，而無需明確指定場景幾何形狀、材料、光傳輸以及它們的變換，這在使用標準圖形渲染技術時會遇到很多麻煩，但卻是必要的。

視頻合成的形式有很多種，包括未來視頻預測和無條件視頻合成。在本文中，作者研究了一種新的形式：視頻到視頻的合成。從核心來說，其目標是學習一種映射函數，它可以將輸入視頻轉換成輸出視頻。就目前已知的研究工作來看，儘管圖像到圖像合成研究進行得熱火朝天，但視頻合成的通用解決方案還沒有被探索過。作者表示，本論文提出的方法是受到之前專用視頻合成方法啟發。

作者將視頻到視頻的合成問題稱之為分佈匹配問題，其目標是訓練一個模型，使得在給定輸入視頻後構建一個條件分佈以近似合成類似於輸入視頻的真實視頻。為此，他們利用了生成對抗學習框架完成這一建模過程。

給定成對的輸入和輸出視頻，作者學習把輸入視頻映射到輸出域。通過精心設計的生成器和判別器網絡以及新的學習目標函數，該方法可以學習合成高分辨率、時間連貫的照片級視頻。此外，作者還將該方法擴展到多模態視頻合成。在相同的輸入條件下，該模型可以製作不同外觀的視頻。

作者對在幾個數據集上進行了廣泛的實驗驗證，任務是將一些列分割掩碼轉換成照片級的視頻。定量和定性結果都表明，該方法合成的鏡頭看起來比強基線更逼真。他們還進一步證明，該方法可以生成長達 30 秒的真實感 2K 分辨率視頻。它還允許用戶對視頻生成結果進行靈活的高級控制。例如，用戶可以輕易地用街景視頻中的樹替換建築物。此外，作者還將該方法擴展到了未來預測，結果表明其方法優於現有系統。作者所用代碼、模型和其它結果都可以在其網站上找到。

圖 1：Cityscapes 結果。其中左上為輸入圖像、右上為 pix2pixHD 生成的圖像、左下為 COVST 生成的圖像、右下為本論文提出方法生成的圖像。

論文：Video-to-Video Synthesis

論文地址：https://tcwang0509.github.io/vid2vid/paper_vid2vid.pdf

摘要：我們研究了視頻到視頻的合成問題，目標是學習從輸入源視頻（例如，一系列的語義分割掩碼）到輸出照片級視頻的映射函數，輸出視頻精確地描繪了源視頻的內容。與之對應的圖像問題，即圖像到圖像合成問題是目前流行的研究課題，而視頻到視頻的合成問題則在文獻中很少出現。在沒有理解時間動力學的情況下，直接把已有的圖像合成方法應用到輸入視頻通常會導致視覺效果低、時間不連貫的視頻。在本文中，我們提出了一種新型的生成對抗網絡框架下的視頻到視頻合成方法。通過精心設計生成器和判別器架構，結合空間-時間對抗目標函數，我們在多種輸入視頻格式下生成了高分辨率、時間連貫的照片級視頻，其中多種形式的輸入包括分割掩碼、草圖和姿態圖。在多個基準上的實驗結果表明，相對於強基線，我們的方法更具優越性。特別地，我們的模型可以合成長達 30 秒的 2K 分辨率街景視頻，與當前最佳的視頻合成方法相比具備顯著的優勢。最後，我們把該方法應用到未來視頻預測中，結果超越了多個當前的最佳系統。

4 實驗

表 1：在 Cityscapes 街景數據集上視頻到視頻合成方法的對比結果。

表 2：控制變量研究。作者對比了提出的方法和 3 個變體的性能。分別是初始 vs 無背景-前景先驗；初始 vs 無條件視頻判別器；初始 vs 無流扭曲。

表 3：在 Cityscapes 數據集上未來視頻預測方法的對比結果。

圖 2：Apolloscape 的結果。左圖：pix2pixHD。中間：COVST。右圖：作者提出的方法。輸入語義分割掩碼視頻在左下角展示。

分享到:

閱讀更多 機器之心 的文章

關鍵字: 建築 GitHub 畫個

2020“給我你的照片，讓我給你畫個像”網絡畫手特別版

03.08 2020“給我你的照片，讓我給你畫個像”網絡畫手特別版

設計師的悲傷，集合在這套Emoji中

疫情下，她與團隊把握多出來的時間設計“Designer

洛陽商業】洛陽西工區長申廣場航拍+細節（圖）

#洛陽#

“新國標”也配得上優雅的設計，小牛電動MQi2體驗

就在這個時候，小牛推出了一款符合“新國標”規範的小牛MQi2系列電動——如同其名字所暗示的一樣，這款產品的設計是沿襲自M系列產品。

重慶｜龍湖千山新嶼——以簡單的筆墨迴歸自然的設計

項目概況

Frederic Kielemoes新作丨精緻獨立的空間氣質

Frederic

杭州｜宸宇府——流行即逝，風格永存

工程檔案項目名稱

“學習強國”山東學習平臺文創大賽獲獎作品今日公示

聯合網訊

小宅基地的趕緊看過來，佔地88平帶車庫別墅，建棟在村裡風光極了

現如今宅基地越來越難批，小宅基地的也越來越多，今天這款佔地僅88平帶車庫的現代風別墅，為你解決小宅基地的煩惱，小宅基地的趕緊收藏圖紙。

曝光！合肥中央公園智慧園區規劃設計正式招標！設計方案出爐

近日，據官方公告顯示:合肥中央公園智慧園區規劃設計正式招標，設計方案曝光。據瞭解，合肥駱崗中央公園位於包河大道以西，錦繡大道以北，合安高速以東，京臺高速以南，總面積約15.3平方公里，目前項目處於片區規劃深化設計階段。

時代天境——摹寫自然與生活藝術

項目名稱：時代天境項目地點：

凱天集團仙遊凱天城S1地塊設計（95頁，街區式體驗性商業設計）

凱天城項目總佔地面積約150畝，建築面積29.66萬平方米，是一個大型現代城市綜合體，凱天城項目在功能上囊括了商務、辦公、住宅、購物、餐飲、休閒、娛樂等，業態形式一應俱全。

商業綜合體設計與研究（125頁）

城市建築綜合體的特殊性很大程度就是體現在多功能、多系統、多聯繫等方面。城市建築綜合體功能組織設計是複雜的問題，對其研究的入手點是對於研究對象的劃分。

建業·世和府——以鶴為形，詮釋當代景觀美學

該項目是提升鶴壁市住區品質的一大契機，我們希望打造一個區別於傳統歐式、中式的全新審美產品，給予項目更具有本土人文精神的獨特體驗與格調。

《動物之森》「我的設計」教學第二彈！五項實用繪畫觀念

這些說明預設一些背景知識，建議大家先讀過上一篇，建立《動物之森》繪圖系統的基本概念。第二層是，一般人不熟悉像素圖創作，較難順手畫出自己預想中的圖案。

什麼是UI交互設計零基礎該怎麼掌握UI設計

值得一提的是UI設計入行門檻低，薪資福利卻很可觀，這吸引了很多人轉行學習，下面跟隨小編一同來看看吧。

邛崍未崍時光 ——致敬東方意境的極簡美學

沉水落座擇一片竹葉為舟；飄飄乎如遺世獨立；在靜謐純淨中開啟禪意冥思效果圖四進

是誰說，滿身機能設計才可以叫山系小包？l《老司機的十件套》（下）

來自日本新晉的戶外品牌WINDY

被不少設計師“登門拜學”的美國製藍染品牌，到底有何來頭？

image：ins@drcollectors雖然Dr.Collectors

失蹤旅館,輕觸時間的肌理

▼從入口看向庭院，view

經典 l 亞特蘭大萬豪侯爵酒店 PORTMAN

“Toomuch

克里斯·範杜恩未來·新湖中心（杭州光稜）

OMAis

聖達菲測量專業學院改造

屋頂分解圖項目圖紙原始平面圖改造後平面圖剖面圖細節圖項目信息建築師：EstudioIrigoyen

圓臉大眼這畫想不萌都不行啊！

junwool，日本插畫師對獸耳有著莫名的好感畫了那麼多人物插畫幾乎沒哪個長著普通耳朵圓臉大眼睛加獸耳充分闡釋了一個字——萌看了他的畫之後終於明白為什麼那麼多人喜歡獸耳了真的超可愛啊這麼萌，我愛遼私信“資料”領取免費繪畫資料美院老師帶你學來源網絡侵刪

插畫美學，爆款來撩：內江第一城漢安印象定製周邊限量預售

自《國家寶藏》《我在故宮修文物》到《上新了故宮》，故宮已經成為了文創界的一線“網紅”。一系列艱辛和努力，內江第一城第一批文創周邊，漢安印象系列手機殼出爐。

【藝術暴走】設計界的一抹紅，美到了心坎！

軟裝設計|

大理石、花崗岩也會“翻臉”

2、避免出現設計錯誤：石材的表面處理不僅僅只是為了視覺上的美觀，更是為了滿足特定空間功能的需要，若忽略功能需要則可能會導致出現設計問題，如：1、桑拿房地面石材未做拉槽或酸洗面處理，直接使用光面石材，導致地面不防滑；2、衛生間地面石材拉槽未倒角圓滑，導致洗澡時會割到腳趾；3、牆面裝

日本設計師打造的聯合辦公，把省錢做到了極致~

△室內概覽SHIBUYAQWS

年輕運動員之家：法國國家體育學院公共空間改造

-強調圖形材料和原材料之間的對比-建立空間的互動關係▼ADIDASx

新加坡字母住宅

這一點對於我們來說極為重要，因為在設計的過程中我們總是會回到人體的尺寸，去研究人體能夠怎樣去理解並被放置到一個空間，一個家庭中。

瑞士新使徒教堂

位於瑞士洛桑的新使徒教堂擴建在設計上汲取了現有建築的內在品質。在設想當中，我們在尋求某種方式，使新建築能夠紀念和保留現有的空間概念，同時增加具有當代感的亮度和開放性。

生活在英國茂盛森林裡的藝術家，玩出三維立體的刺繡

從小生活在英國茂盛森林裡的LindsayTaylor，在植物豐富多樣的美以及野蠻複雜的形態獲得靈感。

新都繼太古裡設計團隊項目後，又迎來IFS建築事務所打造城市地標

新都川音文創園詳情點擊：新都“太古裡”——川音文創園3#，4#地塊工程規劃來源成都向上上一篇報道旭輝廣場詳情點擊：四川首個上海旭輝廣場第二篇正當我們還沉浸在新都川音文創園的歡喜中，又聽到新都區招商引資項目——旭輝廣場由曾打造成都IFS的LWK+建築師事務所傾力打造，以藝術設計與城

上海托馬斯實驗學校

上海托馬斯實驗學校外部實景圖上海托馬斯實驗學校外部實景圖上海托馬斯實驗學校外部實景圖上海托馬斯實驗學校外部實景圖上海托馬斯實驗學校外部實景圖上海托馬斯實驗學校外部實景圖上海托馬斯實驗學校外部實景圖上海托馬斯實驗學校外部實景圖上海托馬斯實驗學校外部實景圖上海托馬斯實驗學校外部實景圖

泰國Tara別墅

泰國Tara別墅外部實景圖泰國Tara別墅外部實景圖泰國Tara別墅外部實景圖泰國Tara別墅外部實景圖泰國Tara別墅外部實景圖泰國Tara別墅外部實景圖泰國Tara別墅外部實景圖泰國Tara別墅外部實景圖泰國Tara別墅外部實景圖泰國Tara別墅外部實景圖泰國Tara別墅外部

下沉式庭院爆火，比傳統院子更實用！

想來很多人對“下沉式庭院”一詞感到困惑以為就是把院子挖深一點然後在凹下去的地方造景其實並不是，“下沉式庭院”又稱“花園層”一般是指運用在前後有高差的地方通過人工方式處理高差和造景的方式使地下室擁有面向花園的敞開空間因為“沉”下去便會產生一個圍合空間無形之中給人增加幾分安全感同時，

動態張揚的住宅改造

建築造型為一個笨拙的黑色體塊，帶有白色的窗洞裝飾，以蛇爬行的方式扭轉體塊，環繞在主臥周圍，材質基本採用舊式車庫裡拆掉的磚體。

23幅發人深省，卻又十分幽默的插畫作品，讓你一次看個過癮

與其說我們今天正處於一個快節奏時代，倒不如說我們正處在一個“快餐”時代，很多人不願意再耐心地讀一本書、看一次畫展，甚至花時間準備一頓精緻的晚飯。

畫師筆下的小哥哥，不一樣的風格，你喜歡哪種

韓國畫師komiro筆下的美男子們，不一樣的風格，不一樣的感覺，你喜歡哪種？

別墅設計：設計師太牛了，一棟住宅有8個戶外露臺，真是人間天堂

你是否希望星辰大海都能收入眼中，今天小諜給大家帶來的設計案例是一個能滿足你享受自然的案例，一棟大宅8個戶外露臺，每一個角度都能享受星光璀璨項目名稱：劉家山舍設計方：劉九三聯繫郵箱：[email protected]項目設計&

園林景觀設計施工小祕訣

8、展示區小而精，生活區大而簡9、營銷路線上鮮花不敗，生活區域內綠樹成蔭10、路在林蔭下，人在樹下行11、道路無障礙，標識有文化，小品有情趣12、累了有處可坐，坐了有物可看13、人行道不可直來直去14、人行道同車行道交接處必須設計緩衝空間。

點亮昔日風采0505

SVG佈局的工具條上可以設置動畫各種參數同時可以設置寬高比，達到SVG層和佈局內容的完美對齊

湖北小夥，花30萬建中國風別墅，帶後花園，賺大了

湖北一小夥，僅僅花了30萬建了一棟帶後花園的別墅，村裡人人都說他賺大了。圖紙編號：JF20113，層數：1層，結構形式：框架結構，主體造價30-40萬，開間15.34米，進深19.5米，佔地面積292平方米，建築面積292平方米，建築高度5.958米。

質樸無華的本真！

Thegentle

被設計師玩壞的建築，遠看是佛像近看才知是酒店，被評中國最醜

在我國就有這麼一個酒店，靠奇醜無比而出名，甚至因此還獲得了吉尼斯紀錄，這就是河北三河市的“福祿壽”酒店。

2020 年度建築大獎公佈，中國 3 座上榜

今年是ArchDaily

別墅還可以這樣設計，從內到外的階梯式曲線太美！

那麼這一套JalanSeaview

蓋這樣的中式別墅竟然30萬不到，鄰村人都搶著仿建！

在農村建房子，最重要其實是造價低，雖然但大家都知道便宜沒好貨，但是隻要好好斟酌選料，避免浪費，合理利用空間，還是可以做一棟既好看又造價實在的漂亮別墅！

創意海報設計素材圖片高清桌面壁紙高清大圖1920×1200

logo複雜就不吃香？Oh，No！這幾個logo夠複雜，也夠耐看

不過這麼清晰的描繪，相信也讓消費者一看就知道，這家公司搞“漁”。旱冰鞋，相信大家都不陌生，不過把滑旱冰的時候那種又颯、又快樂的形象表現出來，只有這麼具象才可以，後面加一個小星星是要顯示，穿上這雙旱冰鞋之後就能夠像明星一樣嗎？同樣都是WIFI但是人家就是自帶霓虹效果，夜空裡，樓宇間

看完這位95後業餘小姐姐筆下的手繪插畫，我覺得我買了支假筆!

Minmonsta越南業餘插畫師一位熱愛插畫的95後小姐姐她的十二星座馬克筆畫曾在網絡上爆火ins擁有超過65萬粉絲她不僅是手繪高手同樣什麼筆都能駕馭不管從人物的造型還是表情簡直太貼合了這顏值真的是帥，太讚了造型些許粗狂、線條筆觸細膩但整個畫面感給人非常的舒服上色完稿不管是手繪插

畫個草圖生成2K高清視頻，這份效果驚艷研究值得你跑一跑

相關文章:

2020“給我你的照片，讓我給你畫個像”網絡畫手特別版

03.08 2020“給我你的照片，讓我給你畫個像”網絡畫手特別版

設計師的悲傷，集合在這套Emoji中

洛陽商業】洛陽西工區長申廣場航拍+細節（圖）

“新國標”也配得上優雅的設計，小牛電動MQi2體驗

重慶｜龍湖千山新嶼——以簡單的筆墨迴歸自然的設計

Frederic Kielemoes新作丨精緻獨立的空間氣質

杭州｜宸宇府——流行即逝，風格永存

“學習強國”山東學習平臺文創大賽獲獎作品今日公示

小宅基地的趕緊看過來，佔地88平帶車庫別墅，建棟在村裡風光極了

曝光！合肥中央公園智慧園區規劃設計正式招標！設計方案出爐

時代天境——摹寫自然與生活藝術

凱天集團仙遊凱天城S1地塊設計（95頁，街區式體驗性商業設計）

商業綜合體設計與研究（125頁）

建業·世和府——以鶴為形，詮釋當代景觀美學

《動物之森》「我的設計」教學第二彈！五項實用繪畫觀念

什麼是UI交互設計 零基礎該怎麼掌握UI設計

邛崍未崍時光 ——致敬東方意境的極簡美學

是誰說，滿身機能設計才可以叫山系小包？l《老司機的十件套》（下）

被不少設計師“登門拜學”的美國製藍染品牌，到底有何來頭？

失蹤旅館,輕觸時間的肌理

經典 l 亞特蘭大萬豪侯爵酒店 PORTMAN

克里斯·範杜恩 未來·新湖中心（杭州光稜）

聖達菲測量專業學院改造

圓臉大眼這畫想不萌都不行啊！

插畫美學，爆款來撩：內江第一城漢安印象定製周邊限量預售

【藝術暴走】設計界的一抹紅，美到了心坎！

大理石、花崗岩也會“翻臉”

日本設計師打造的聯合辦公，把省錢做到了極致~

年輕運動員之家：法國國家體育學院公共空間改造

新加坡字母住宅

瑞士新使徒教堂

生活在英國茂盛森林裡的藝術家，玩出三維立體的刺繡

新都繼太古裡設計團隊項目後，又迎來IFS建築事務所打造城市地標

上海托馬斯實驗學校

泰國Tara別墅

下沉式庭院爆火，比傳統院子更實用！

動態張揚的住宅改造

23幅發人深省，卻又十分幽默的插畫作品，讓你一次看個過癮

畫師筆下的小哥哥，不一樣的風格，你喜歡哪種

別墅設計：設計師太牛了，一棟住宅有8個戶外露臺，真是人間天堂

園林景觀設計施工小祕訣

點亮昔日風采0505

湖北小夥，花30萬建中國風別墅，帶後花園，賺大了

質樸無華的本真！

被設計師玩壞的建築，遠看是佛像近看才知是酒店，被評中國最醜

2020 年度建築大獎公佈，中國 3 座上榜

別墅還可以這樣設計，從內到外的階梯式曲線太美！

蓋這樣的中式別墅竟然30萬不到，鄰村人都搶著仿建！

創意海報設計素材圖片高清桌面壁紙高清大圖1920×1200

logo複雜就不吃香？Oh，No！這幾個logo夠複雜，也夠耐看

看完這位95後業餘小姐姐筆下的手繪插畫，我覺得我買了支假筆!

如果你正經歷生活中“餘歡水”式的悲劇，各種不順會怎麼想、怎麼做？-比奇堡的槓把子丶的回答-悟空問答

美國可以不斷印美元，但它為什麼不這麼做呢？-宋思考的回答-悟空問答

手抓餅怎麼做才好吃？-布穀姐美食日記的回答-悟空問答

擀麵條時，用什麼粉能有效防止麵條的粘連？-家常美食小廚房的回答-悟空問答

濟南至西安遊不走回頭路怎樣安排路線求大神指點？-自駕遊八方的回答-悟空問答

從濟南出發3天左右的自駕遊，不去海邊不去爬山，有什麼推薦的地方嗎？-泉城自駕遊俱樂部的回答-悟空問答

吳三桂為啥不接受削藩？做富家翁不香嗎？-老森的回答-悟空問答

玉米饅頭怎麼做？-明澤美食的回答-悟空問答

支付寶支付，微信支付對印鈔造幣公司有影響嗎？-澤哥愛基金2020的回答-悟空問答

央行數字貨幣誕生，能顛覆支付寶、微信支付的位置嗎？-慧算賬的回答-悟空問答

今年由於疫情的影響小學延期開學，暑假是否繼續上學補課呢？-PRINCE的回答-悟空問答

疫情之下，我們如何應對，老百姓該如何準備？-蒔涘的回答-悟空問答

湖南寧遠九嶷山美不美？有何遊玩攻略呢？-寶哥碎碎遊的回答-悟空問答

五一快到了，去國外旅遊安全還是國內旅遊安全，哪個地方最保險？-馬德里官方發言人的回答-悟空問答

疫情過後，你有什麼變化？（請用最簡單的語言陳述）？-滿足176482102的回答-悟空問答

男人一生愛過幾個女人才算正常？-鵬獻舞的回答-悟空問答

時間會治癒一個人的傷嗎？-小凡聊趣事的回答-悟空問答

為什麼美國確診58萬多，死亡兩萬多，還不宣佈美國為疫區國？-自在來賢的回答-悟空問答

孩子在學習看圖寫話的時候，不知道怎麼動筆，要怎麼引導？-草木一卒的回答-悟空問答

如何培養孩子畫畫的習慣？-觀上書苑的回答-悟空問答

小孩子學畫畫的圖案一般都去哪找比較好？-職場詭事的回答-悟空問答

繪畫真的需要天賦嗎？-大臉貓的畫的回答-悟空問答

為什麼有些人在小學對繪畫感興趣到了高中就不感興趣了？-學做書的蜜瓜的回答-悟空問答

調查一下，大家對於畫家一邊畫畫一邊做自媒體怎麼看？-當代書畫名家繆月紅的回答-悟空問答

孩子水彩畫可以自學嗎？-大墨蒲公英素質美育的回答-悟空問答

你覺得在英超哪些教練可以排在前三名（沒有時間限制）？-足球實戰營的回答-悟空問答

什麼是UI交互設計零基礎該怎麼掌握UI設計

克里斯·範杜恩未來·新湖中心（杭州光稜）