Astar區塊鏈公開課:建立去中心化語言識別社區

近日,由Sialia Capital主辦,Astar區塊鏈應用學院協辦的《鏈接未來 | Blockchain IL亞洲行北京站》邀請到了Nir,與大家講述了目前語言識別市場的壟斷以及LangNet的去中心化願景和解決方案。

Astar區塊鏈公開課:建立去中心化語言識別社區

以下為當天演講譯文,經本人同意後,略有編輯。

大家好,我是Nir。我給大家簡單的介紹一下LangNet這樣一個龐大的項目的核心。

Astar區塊鏈公開課:建立去中心化語言識別社區

首先,它是一個語言網絡,是以色列團隊和首爾團隊,以及來自美國、印度、德國團隊精誠合作的一個項目。

Astar區塊鏈公開課:建立去中心化語言識別社區

他們的主要目標就是要進一步繪製人類語言協議,他們主要是要創建一個語言識別系統,那這意味著什麼呢?

Astar區塊鏈公開課:建立去中心化語言識別社區

我們思考一下,未來幾年之後,我們溝通的方式、不管是在車裡還是在廚房裡,還是在計算機前,還是採用移動設備,我們也不會通過鍵盤來進行溝通了,我們會通過肢體語言還有其他的聲音來進行更好的溝通。

Astar區塊鏈公開課:建立去中心化語言識別社區

我們可以看到,就像今天Alexa技術,我不知道大家知不知道來自亞馬遜的Alexa技術還有Google home這個項目,在中國我們有百度,我們有語言識別系統,我們一共有1260億的語言識別市值,所以市場巨大,大多數的設備都會關注我們,進行語言識別。

我們覺得目前的市場存在什麼樣的問題呢?如果我們思考一下今天一個公司希望能夠創建一個語言輔助解決方案。

小的公司、大的公司還有很多中型公司,他們進入市場的這個門檻非常的高,在整個語言識別市場上,為了創建基本的系統來進一步瞭解並且把語言翻譯成文字,我們需要每個語言10萬多個小時數。

所以,我們要創建這樣一個公司,創建這個語言輔助系統的話,從整個經濟的角度來說,我們需要花很多的錢才能夠獲得一個基礎的區別。

Astar區塊鏈公開課:建立去中心化語言識別社區

這是創始公司無法實現的,如果是中等規模的公司,我們可以獲得這個數據,之後下一步就是來培訓整個人工智能系統,這樣我們才能讓他們更好的學習語言並且學習其他不同的語言。

在當今的市場上,Google和亞馬遜已經每個月花200億美金,專注整個語言識別服務。

我們看到進入市場的門檻很高,只有那些非常大的公司才能夠提供這方面的服務,或者能夠創建一種語言系統,解決方案,這才能夠把語言轉化成文字,一些大的公司,其實做這種業務非常的昂貴,他們可以先從英文開始,之後日語,之後再進一步發展德語的從語言到文字的轉化。

整個市場的情況主要是被大的企業所主載的,也就是說,目前這市場創新很少,小的企業還有有才華的團隊,他們在語言識別系統上並沒有太多的一些創新,這樣的話,整個發展狀況還是非常基礎的。

如果要是進一步進入到高階的語言識別的話,我們只能夠依靠這些大的公司,看他們是不是願意進入到下階段的發展,才能夠看到市場的發展。

在市場上,如果我們是LG或者是三星,或者是一些小的公司,想要能夠提供語言識別系統和設備的話,我們就必須要和這些大的公司合作,因為他們有一些數據庫,他們有一些基礎的算法才能夠讓我們進行語言的識別,如果我們要決定和這些大的公司合作的話,我們給用戶提供的對話也是最後轉移給這些大的公司。

所以,他們會在整個生態系統上會有大的壟斷,如果我們設想一下未來的幾年,如果我們能和設備進行對話的話,從商業的角度來說,還是由這些大的公司來主導,也就是說,如果我們問谷歌,我應該買哪雙鞋,我們可以設想一下,這會進一步把我引導到亞馬遜的網店上。

那麼,他們會有一些商業上的青睞對象,因為他們是大的公司主導這個市場,因為他們的推薦肯定並不是本真的推薦,而是具有偏見性的推薦,他們會選擇那些利潤最高的鞋推薦給我們。

Astar區塊鏈公開課:建立去中心化語言識別社區

所以我們在市場上面臨這方面的挑戰和問題,所以為什麼語言網絡公司希望能夠進一步推廣他們這方面的創新。

Astar區塊鏈公開課:建立去中心化語言識別社區

我們現在也有新的一系列的方式,與其讓一兩三四個大的公司來壟斷整個市場,我們要把市場能夠進一步去中心化,能夠讓整個社會從整個產業當中獲益,也就是讓所有的公司能夠進一步支持這樣一個項目,來把我們自己的聲音構建出來,並且創建一些應用。

Astar區塊鏈公開課:建立去中心化語言識別社區

之後和整個社區進行更好的互動,給整個社區提供一些語言之後,我們能夠整合到系統當中,從整個社區角度來說,對整個生態系統做出貢獻的人,會以代幣的形式拿到獎勵。

Astar區塊鏈公開課:建立去中心化語言識別社區

通過這種方式,我們可以創造不同語言的數據庫,不僅僅是日語、英語或者是德語,現在我們有60多個國家的貢獻者,願意參與到這個項目當中,我們也可以瞭解提供很多的語言。

在未來的三年中,我們需要有這樣的數據庫,他是為我們社區所擁有的,我們有50多種語言,他可以作為我們的創新的一些基線,尤其是我們對語音識別的一些發展,和語言識別的技術,還有我們不同的算法。

所有的這些數據,都能夠幫助我們建立起來語言的AI,能幫助我們自己的一個互動和交流,一旦我們有了這樣的很好的算法,同時有這樣的AI,我們也可以能夠提供,來提供給其他的一些公司。

Astar區塊鏈公開課:建立去中心化語言識別社區

比如說像我們有一頁專門我們是提到了這樣一點,我們目前現在有很多這樣的合作伙伴,我給大家展示一下,LG目前已經是我們很重要的合作伙伴商。

我們現在將這樣的社區的聲音,這都是為我們所擁有的,而這樣的公司我們也可以讓他們自己創建,以對話級別的這樣一些的語言識別的體系,而這樣的一些數據每一次都是我們的社區所擁有的。

我們這樣的社區得到的獎勵,通過我們的這樣的一些算法,和一些不同的模塊所建立起來也得到了所應應有的獎勵。

Astar區塊鏈公開課:建立去中心化語言識別社區

說到我們的團隊,尤其是涉及到這個項目的團隊,大家可以看到,我們有很多的以色列和美國,盧卡斯是從韓國來的,我們過去的兩年半一直在提供語言識別的這樣的一些技術和解決方案,也能夠解決人們的需求,我們是初創的公司來進行了很多的創新,尤其是在語言識別方面。

很多時候,有些公司他們想要去這些的一些數據庫,但是數據庫很貴,尤其他們進行這樣的不光是亞馬遜進行數據的組距,他們也想要通過自己建立自己社區的一些數據和相應的一些信息,所以我們現在也做了NLP還有很多不同的盡整,我們現在將所有的能力進行槓桿化的平衡,來進行一個語音識別的生態系統的建立。

Astar區塊鏈公開課:建立去中心化語言識別社區

我們可以看到另外的一個團隊是我們很多的專家還有很多的開發者,他們都是從不同的一些維度,不同的市場中,也包括我們的加密的市場,共同建立社區。

我們也受到了很多的一些加密經濟和一些知名的數據和模塊化的技術支持。


分享到:


相關文章: