分享|Google爲數據工作者推出的又一「神器」

分享|Google為數據工作者推出的又一“神器”

Google和數據技術的發展一直是齊頭並進的,現在Google通過更快搜索數據來進一步強化大眾和數據的關係。

眼下,一個好消息又來了:Google再次宣佈開放一個全新的搜索服務:Dataset Search(數據集搜索)。

分享|Google為數據工作者推出的又一“神器”

還記得不久之前Google發佈的Google Scholar(學術搜索)嗎?當時的Google Scholar 填補了快速查找學術資料的空白,那麼這一次,Google直接將注意力更精準地聚焦到了數據集,簡直“體貼又細心”!

Google人工智能研究科學家Natasha Noy表示,科學家、研究人員、數據記者和其他有興趣使用數據的人是這個工具的主要受眾,與此同時,Google認為這些數據集在整個Google產品中的地位將會變得更加突出。

分享|Google為數據工作者推出的又一“神器”

數據工作者的又一“神器”

首先,數據集到底是什麼?先來普及下概念。Dataset(數據集),又稱為資料集、數據集合或資料集合,是一種由數據所組成的集合。Dataset通常以表格形式出現。每一列代表一個特定變量,每一行都對應於某一成員的數據集的問題。它列出的價值觀為每一個變量,如身高和體重的一個物體或價值的隨機數。每個數值被稱為數據資料。對應於行數,該數據集的數據可能包括一個或多個成員。

從歷史上看,這個術語起源於大型機領域,在那裡它有一個明確界定的意義,非常接近現代的計算機檔案。

Natasha Noy表示,這個新服務會將數萬個不同在線數據集存檔統一起來。那最終這些數據集的歸屬在哪呢?Natasha Noy談到:“我們想要讓這些數據可以被發現,但數據仍保留在原始位置。”

分享|Google為數據工作者推出的又一“神器”

如何運行?我們嘗試進行了操作

這個Dataset Search怎麼運行的?事實上,即使對於組織最完善、數據最豐富的人來說,也需要利用來源於外部的數據。

舉個天氣和環境數據的典型例子。

假設你想要將農業數據與天氣現象相關聯以預測作物生長,或者想要研究天氣對整個歷史時期發生的現象的影響。這種歷史天氣數據,幾乎不可能由任何單一組織積累和策劃,很可能由NOAA和NASA等組織隨時提供。

這些組織會通過專用數據門戶定期策劃和發佈其數據,因此,如果你需要定期獲取數據,可能需要熟悉通過這些門戶定位數據的過程。

當然,你還必須同時關注NOAA和NASA之外的其他可能的信息來源。

如果不僅需要天氣數據,還想找到正確的來源,然後再找到這些來源的更多正確數據,在此之前一個搜索界面根本無法做到,現在Google開發了Dataset Search,可以實現一個界面搜索出來,是不是很驚喜很意外?

實際上,Google對結構化數據的熱愛一直是持續的,標誌性事件就是通過收購Metaweb整合了Google的知識圖譜,並通過schema.org支持結構化元數據。

分享|Google為數據工作者推出的又一“神器”

分享|Google為數據工作者推出的又一“神器”

諸多問題值得考慮:錯誤內容、排名與盈利的可能

推出了這個搜索,不僅為專業用戶提供方便,而且對於數據集提供商也是大有好處。NOAA的CDO(首席開發官) Ed Kearns是該項目的堅定支持者,並幫助NOAA在該工具中搜索了許多數據集。

“這種類型的搜索,長期以來一直是開放數據和科學界許多研究人員的夢想。對於NOAA而言,一部分工作是與他人共享我們的數據,Dataset Search對於讓更廣泛的用戶社區更容易訪問我們的數據至關重要。”

分享|Google為數據工作者推出的又一“神器”

Dataset Search搜索後進入某一個數據集鏈接,其對一些信息的排名,為了避免數據集提供商將內容錯誤地描述為“數據集”,Google能夠告訴它“這不是一個數據集”或者降低它的排名嗎?Google並沒有給出明確的應對措施,只是表示,Google會在用戶開始使用該工具後獲得更多經驗,進行改進,努力地提高結果的質量。

如何解決被搜索出的數據集排名問題呢?Google表示,對數據集來自的頁面使用Web排名的組合(基於Google算法),並將其與數據集特定信號(如元數據質量、引用等)相結合。

不論如何,眼下這個項目是有助於科學決策的,需要的人士儘管放心的使用。不過隨著數據的價值越來越凸顯,Google也越來越重視,包括其在雲計算和AI不斷加大投入。大膽猜測一下,Dataset Search會是Google在學術數據領域的商業化的第一步。

分享|Google為數據工作者推出的又一“神器”

樂天雲谷產業園位於廣州市南沙區市南大道黃閣黃金地段,距離地鐵四號線黃閣站僅300米,總建築面積約為5萬多平方米,背靠上萬平米的天然氧吧、綠色生態環繞的園林創業社區。園區將致力於打造國際科技創新產業基地,功能配套完善,開展國際技術交流和高峰論壇,秉承樂天地產匠心打造創新創業生態圈,搭建科技企業孵化器一站式公共服務平臺,形成有效資源整合平臺和科技創新全方位服務。項目重點強化國際間合作、粵港澳臺兩岸四地科技創新合作,以科技創新驅動為引擎,貼近國家新區、國家自貿區政策、國家一帶一路戰略和2025計劃戰略,打造國際科技創新產業基地。入園企業可享受省、市、區科技企業孵化器政策扶持和其他相關政策,並與世界500強企業為鄰!

樂天雲谷產業園憑藉自身完善的功能配套、搭建的公共服務中心和國際科技創新產業基地的定位獲得了廣州市科技企業孵化器及眾創空間的評審工作認定!

分享|Google為數據工作者推出的又一“神器”

園區配套人才公寓、園區餐廳、特色餐飲、咖啡廳、路演中心、運動場地等,為您的工作和生活提供一站式的服務,使您工作生活雙無憂。

分享|Google為數據工作者推出的又一“神器”

分享|Google為數據工作者推出的又一“神器”

分享|Google為數據工作者推出的又一“神器”

樂天雲谷產業園

盛大招商,恭迎品鑑!

地址:廣州市南沙區市南大道230號(黃閣地鐵站旁/烏石灣公交站)

溫馨提示

自駕車路線指引:

番禺大道南---市南路(樂天雲谷)


分享到:


相關文章: