03.04 我們能否建立以漢字為主體的計算機語言、漢語為主體的計算機網絡環境?

海藍天長


在五筆輸入法發明之前,全世界都認為漢字不適合計算機輸入。甚至提出放棄漢字,以便中國能更快更好的追趕高科技。

漢字對於其它文字就是三維對二維的區別。漢字的複雜性,如果仍舊用二維思維去使用,就無法解釋和正確使用漢字。

總是有人說漢字的不確定性,比如好字的不同讀音,就有不同的的意思。這會讓二維思維的人或現在計算機抓狂。但是大家有沒有發現,中國發展到現在,只要是合格的中學生都能讀懂古文,而且對其中的不同讀音的字,也不會誤解。這也說明了漢字的傳承性,可靠性和簡潔性。

相反,英文這方面完全無法和中文對比,現在的高中生也無法讀懂幾百年前的著作。而且如果不學習,估計幾年後的文章都讀不懂。

說英文佔字節少的,可以試試搜索最長的英語單詞。

漢字是最符合人類特性的,相反計算機對什麼都量化了。哪怕是一個遊戲,都可以看出二維的思維,就是一屬性對比。當然有人會說這是科學。但是現實中以弱勝強的例子比比皆是。這就不科學了嗎?

所以以漢字為主體計算機系統沒有建立,不是漢字不行,是人類還沒有達到這種高度。

現在講AI,我個人認為只要採用二維方式,就不能稱之為智能,只是模仿加大數據,只要計算機不能理解好字不同讀音的不同意思,就不能稱之為智能。

真正的智能估計要漢字化計算機才能實現。


簡單而不簡略


完全可行,雖然會有一定難度,想用漢字作為一種全新的編程語言,編寫操作系統和做相應cpu指令集、架構等,必須對現在的計算機架構,做出顛覆性的變革。

現在計算機架構,自計算機在美國誕生之初,採用的是二進制,計算邏輯、存儲方式、指令編寫等等核心,到現在都沒有什麼改變,只是集成度高、處理速度大幅提升。



基於這些,為了更方便計算機的編程學習,從彙編、Basic、Pascal、C、C++、Java、Python等編程語言不斷的發展,但編程的核心思想並沒有太大的變化,美國的二進制計算機標準一統全球后,世界上就很少人去做些基礎研究了,包括操作系統、高級語言等。大學的計算機課程:操作系統、計算機結構,基本上還在用二十年前的教材。


不破不立!


想用漢字作為一種全新的編程語言,必須重新編寫操作系統和做相應cpu指令集、架構等,可以設想如下研究方向:


1、 所有的漢字可以濃縮成300個標準的漢字圖形組合而成,而300個漢字圖圖形可以濃成30個基礎的漢字圖形基礎代碼,再把這些代碼變成一個一個標準的指令集。


2、 拋棄二進制架構,採用三進制計算機(前蘇聯有過樣機),對於計算速度大幅提升、存儲空間擴展、增加邏輯判斷選項等有極大的好處,這種架構更適合中文漢字的思考方式。


3、 現在的計算機判斷只有是與否,不太適合人腦思維,也就是說現在所說的人工智能其實只是大數據的統計、分類、關聯、比對及判斷預測,沒有真正的人腦學習能力,真正的人工智能,應該像人腦一樣思考,對外界物體的認知有三種判斷狀態:是、否、未知,通過自我學習,把未知變成明確的認知判斷。


4、 漢字的優勢,包括機器人腦模擬、機器學習、語音識別、圖像識別及神經網絡等優勢,可以形成有統一、標準、高效、共享的代碼庫及指令集。


5、 解放程序員的手,通過語音來編程,通過接收語音指令,給出最優代碼模塊,實現所要功能,漢字語音指令相對英語語音會更有效率及優勢。


6、 未來是物聯網、人工智能、神經網絡等萬物互聯的世界,這些對網絡安全的要求非常高,漢字密匙優勢也遠遠超出英文,二維碼是明碼,而漢字三維碼則是帶密匙信息碼,承載的信息量也會遠遠超過二維碼。


7、 5G物聯網時代即將來臨,信息流動及交互的速度與效率極大的提升,漢字的優勢會變得極為明顯,對於教育而言,最大的顛覆:改變知識獲取的渠道方式及知識(信息)的表達形式。因為,不再有平臺的概念,不管是社交平臺還是教育平臺等,未來5G物聯網時代,現實當中的每個人,每個物體都會是網絡的節點,人與人的交流、人與物的聯繫、物與物的關聯,不需要通過某一平臺去實現,因為節點就是面,面即平臺。對於教育行業而言,信息與知識的節點是漢字,每個漢字都可以瞬間組合成立體知識平臺,組合出關聯的字、詞、句、詩、文、即時信息及從古到今的關聯古物及歷史事件,使知識的廣度及深度同時呈現。




.

.


【專注說文解字、快速識字、K12全語文、海外漢語,漢字創新思維、漢字國學、解字古詩文】

漢字師認證課程,讓你成為一名合格的漢字老師、一名漢字啟蒙師!

想了解詳情,關注本號,私信留言 “99

想 瞭解《人字學習法》,私信留言:“


漢字谷主


完全可以,就是要有耐心,要有幹細活,幹瑣碎活的心態,

現代計算機是建立在二極管,門電路,硬件基礎上得二進制數學代碼體系。

0,1,之上,是26鍵,是英語字母縮寫的函數名

要改不是很難,

26鍵,用漢語拼音,直接從底層函數做,與門AND,或門OR,非門NO,改成yu,huo,fei,正弦,餘弦,正切,都改用漢拼,或漢拼簡寫,

漢字字符好辦,都是字符串$變量,建個漢字庫就差不多了。16X16的點陣漢字庫在早期很奢侈,佔內存,現在都不是事。

最底層的函數名變成漢語拼音縮寫了算法都不是事。

如果還有更多耐心,還可以把早年市場上出現的,漢字輸入法整合到底層,有種天然碼,是按漢字形聲書寫邏輯做的,其實直接裝上軟件文字庫就夠了,底層函數名理順成漢拼後基本就差不多了,不必再多改,

其實底層彙編語言並不多,沒有多少句,就是埋的歷史深,中上層覆蓋的軟件太多太厚了

人工改是超級工程,

但是一旦做好底層函數名,可以暴力換算機器編譯。

做好底層函數名漢拼簡寫,做好漢字字形點陣數據圖形庫,在弄個編譯器,

就改過來了。

還是二十六鍵字母鍵盤,但完全是漢拼邏輯了。


星輝650


漢字為主體的計算機語言的可持續發展性

首選說一下計算機根本上就是字節,就是0和1,無論什麼語言到根本上就是01的二進制體現,也就說計算機語言不區分語言,不管你是英的,還是中的,計算機的根本認知就是0,1。

上面的問題是根本問題,那麼人機對話,就是使用什麼語言開發的問題了,計算機是美國開發的所以編程語言就是英文的,這也是大家認為天經地儀的,但是如果使用其它語言來開發,並不是不可能,而只是時間問題。而漢語言為主體也是極其可能實現的!

1、政策

大力鼓勵漢語編程的發展,如易語言編程就是一個非常好的例子,現在易語言發展的是已經非常成熟了,可以說是中國的C++。並且大家入門容易學習簡單,例程也多,國家曾經是大力的支持撥款,可以說這個是一個非常好的方向!

2、發展

如WPS,WPS編程語言,但這個可以學習WPS的發展方式,WPS從開始的無人使用,各種廣告,各種植入,各種流氓形式來發展自己到現在幾乎是無人不用,這種形式發展雖不可取,但也是一個成型的例子。

3、應用

主要是使用單位,很多人都認為是老外的最牛,這也是一種歷史的遺毒,可以說從清道光帝時期開始,國人就怕洋人,洋人的東西就牛。而國人一旦會一點老外的,肯定就看不起自己的,就拿易語言來說,有人會了26個英文字母后就看不上中國字了。

4、制約

制約一個工具的發展是太多了,比如,易語言隨意寫個程序360連查都不查直接報毒,而老外寫的程序,360就是要合計合計了怕引起國際爭端。這個不只是360,其它殺毒工具也是這樣。

5、發揚

如果想發展,首先是要自己看的起自己才行,否則不可能發展,一切全是空談。

漢語為主體的計算機網絡環境

漢語為主體的計算機網絡環境就目前來看是已經在實現了,中國人可以說是遍佈世界,人口最多,形成主體是已經事實了,這個並沒有什麼太大的難度,倒是第一個問題難度非常大


江中游老師


我們完全能夠建立以漢字為主體的計算機語言和以漢語為主體的計算機網絡環境。

條件有兩個:

一是使用融入拼音字母的通音漢字。

二是須經國家語委的研討及領導人的決擇。











先生劉興華


後半個問題,對於絕大多數網絡用戶來說,現在國內的網絡環境已幾乎是全中文的,比如各大網站的界面和內容等等。它並不直接依賴中文編程語言。下面主要關注前半個問題。

中文語法的編程語言和配套開發環境早就有,也有了相當大的用戶群,但商業項目中尚未成氣候。主要原因是編程語言工具本身的定位和商業運營策略。十幾年前剛推出時推廣的速度之快,可以看出國內對中文編程語言的巨大需求。而隨著全社會越來越認識到計算機編程與各行業轉型的精密關係,編程越來越成為一種基本技藝。在這個背景下,中文編程語言與開發環境的推廣和商業化迎來了最佳發展機遇。

在技術上,現在開發一套中文編程語言和開發環境的代價比起十幾年前要低一些,因為這麼多年的開源編譯器項目發展,有更多的框架、工具、資料可以利用。

比如,有現成的教程可以幾乎從零開始開發一個簡單的通用腳本語言

而藉助語言生成工具如 xtext,更可以在十幾分鍾內實現基於Java的一個領域專用語言(DSL)

也可以藉助 Antlr 等代碼分析器生成工具,簡化開發,較簡便地實現下面這樣的類LOGO語言

另一種方式是修改現有英文編程語言的編譯器或交互控制檯,實現漢化關鍵字和/或接口,甚至反饋信息。

下面是漢化了TypeScript的入門代碼:

漢化了Python控制檯的反饋錯誤信息:

一套中文的標準庫和接口以及對應文檔的開發和維護仍需要相當工作量,也很考驗開發者的實踐經驗。即使是像上面對英文編程語言進行漢化,也需術語一致恰當。

除了中文編程語言本身的功能能夠滿足基本開發需要之外,一個適合中文代碼輸入和支持提示、補全、幫助的開發環境是決定這個語言能多容易被開發者接受的重要因素。

早在十幾年前的中文編程開發環境就已經實現了中文輸入法和自動補全的集成。在自動補全成為開發環境標配的今天,這個功能更是必需。而更進一步的智能提示,還依賴中文自然語言處理技術和代碼分析技術。從這個角度說,中文編程語言和開發環境的探索和推廣更是迫在眉睫,因為它和自然語言處理技術可以相輔相成,加速發展。

如果目標是商業大規模應用,編程語言項目如果開源,可以得到更大程度的信任,以及更多用戶和合作開發者。

由於中文編程語言項目的特殊性,它還有一個優勢,那就是從項目之初就可以使用中文命名標識符。對於母語命名對代碼可讀性的好處,之前的文章已經有了不少闡述,這裡不贅述。它的特殊性就是,中文編程語言的用戶必然會中文,同樣會參與到語言工具本身開發中的合作者也都會中文,因此中文命名標識符沒有非技術原因的障礙。

上面的腳本語言實現就在Java中使用了中文命名:

上面的LOGO語言實現是在JavaScript中用了中文命名

用中文命名標識符,不僅可以減少項目開發和維護成本,也可以一致編譯器方面的中文術語,從而避免國內編譯器開發者交流技術時大量夾雜英文術語的現狀。

中文編程源遠流長,現在就是最好的機遇。看到了很多個人和公司在進行中文編程語言和IDE的嘗試和探索,相信在三年(現在是2019年)甚至更短的時間內,就可以看到更大的突破。

更多中文命名和編程語言技術,請關注本號“用中文編程”!


用中文編程


狹隘的民族主義。計算機的本質是數學。數學的所有符號體系方便和簡化了數學的表達,使全世界的數學家有了共通的語言,統一的符號語言才使數學有了現在的發展。

等你們琢磨出一套漢字體系的計算機科學,結果必然是閉關鎖國,自絕於世,一落千丈。世界上其他國家的計算機科學早就在不斷的溝通交流中長足進步,騰飛了。

科學技術不需要民族主義,技術要的是發展,要的是實用!

你們怎麼不考慮在物理化學中使用中文,比如水分子,要寫成氫貳氧,硫酸寫成氫貳硫氧肆?

這種愛國,這種民族主義只會使我們再次倒退100年!


omg43


哈哈,很多年以前我也是這麼想,還開發了一種中文BASIC,實際操作才發現問題多了。

其中主要還是鍵盤問題,同一個代碼,需要輸入漢字,在鍵盤上輸入漢字遠比輸入英文麻煩,即使已經很熟練輸入漢字了,也比很熟練輸入英文麻煩,所以當變量可以使用漢字以後,基本就沒有人提漢字編程了。

現在的編程語言基本都有聯想功能,當你輸入一個字母,相應的關鍵字或函數就會出來,選擇起來很方便,即使英文不太好也沒啥關係。


觀上靈雲


      電腦直接漢字輸入和讀寫聽說一直沒有確定的方案,更不說編程了。早前學Basic語言也頭暈,如果能搞出直接的民族性的計算機語言,大眾無償受惠,也是功德無量,所以有個想法也來表達一下,不喜勿噴。

       我可是認真想了一個小時得出結論:雖然可能囉嗦一點,但讀入,表出想想也是可以的,後又想了一個晚上深化了:

       中國文字:音一形一義,英文:音一意,表意為主,形的方面很少。中文比英文強在形上,一字一形有一義。

       我想輸入可以五花八門,運行用漢字的形,表意用漢字也可以英文等其他。也就是輸入一運行一表述可以分開。

       計算機的讀,以前是二進制,是0,1和易經合拍,或者說來源於易經。現在說三進制,00,01,11?。

       我想說這三進制是指縱向的三,道生一(無極生太極),一生二(太極化二儀),(二儀生四象),二生三(四象為八卦),三生萬物,只有到三這個層次才能生而括萬物,達到運用的層次。前面一,二隻是說明原理,引而深入。

       到三,八卦這裡就是8個字,坤,乾,坎,離,兌,震,艮,巽,既表方向,亦表屬性,還是其他。其實,就是每三個信號組成的組合,這是我認為的三進制。

       有了新的八個信號,再進一步排列組合就是64卦了,當然還可以進階。

那麼對一個字怎麼讀?

       我想現在來談一個字的認識就簡單了,接下來要建立一個模型,一個認知模塊來解決,這個是巧妙的方案,不單單是平面,也可以立體。易經不單是二維平面,更是立體三維,甚至四維等更高維。

比如把一個字認同為一幅圖:中國漢字是方塊字,有米字格,有固定的邊旁部首,把一個字用8個信號來表達,應該不難,如4角碼輸入法,就是十個數涵蓋了全部字,如元昊輸入法也是幾個數字。現在改10字到8個字也不難吧。

      比如1.坤指內,其小無內,2.乾指外,其大無外,其餘,3.點,4橫為艮,5.坎為豎,6撇,7捺,8折,順序我也懶得想了。錄入應該不難吧。

如此都是0和1這一陰一陽,計算機的原理沒打破,算法也都在,但表達的內容是三生萬物,千變萬物。如果相同部首,計算機自動都會形聲字認讀了。

      如果英文26個字母都是圖;埃及文字也是圖;,,,來個轉換編程就解決了。

          天馬行空的想法,不知亂槽槽有用否?我姓何,姬姓。


用戶1453499051575


一天學會五筆輸入法

製作這個五筆輸入法視頻,是因為網上很多人在問:"拼音輸入法很流行,五筆輸入法淘汰了嗎?"

我想說五筆輸入法不僅不會淘汰,而且會隨著網絡信息化的發展,會變的越來越流行。視頻中講解的”什麼是字根“,用”七色板“的”七個色板“來比喻”五筆輸入法“中的”字根“,直接演示在”智能五筆輸入法狀態“下如何在”本人自編的五筆口訣中找到相應字根“,然後輸入到電腦上。

特別演示了大家都認為很難的”識別碼“是如何打出來的,相信看了視頻的朋友們,會覺得比看"識別碼的解釋文章"要更簡單了。

先來了解一下什麼是字根,我們拿七巧板作個比喻,七色板小朋友都玩過。正方形的七巧板是由7個色板組成,有三角形,有平形四邊形,有正方形等。七色板下面就有四個圖,有兔子,有小狗,有農夫。你看看“兔子”是由三角形和正方形等拼成;“小狗”也是由三角形和正方形等拼成;“農夫”也是由三角形和正方形等拼成。

那麼很簡單,“兔子”、“小狗”和“農夫”,它們都是不同的圖形,但它們有一些共同點就是:它們的形狀,都有相同的“三角形”和“正方形”等組成,那麼我們就把“三角形”和“正方形”等看作“兔子、小狗和農夫”圖形的“零部件”吧。那麼三角形、平形四邊形、正方形等就是“七色板”的七個零部件。

我們也可換個概念說:這些三角形、平形四邊形、正方形等就相當於“七色板”的字根。因為這些三角形、平形四邊形、正方形可以組成不同的圖形。那麼我們“字根”的意思了也就相當於這個“七色板”裡的三角形、平形四邊或者正方形等。

而這個“七色板”只有7塊,我們就當作7個字根吧,但是在五筆輸入法裡面有一百多個字根,這一百多個字根可以拼成不同的漢字,那麼這些“字根”就是“拼成漢字的基本零件”。

“字根”就是這意思,也就是說:“七巧板”只允許有七個部件來拼成不同的圖形,那麼我們“字根表有一百多個字根”,也就是允許你在“一百多個字根”裡挑出“幾個字根”,然後找到“挑出來的這幾個字根”所對應的“字母鍵”組成“五筆編碼”,來打出“想要的漢字”。“字根”就是這意思,就是漢字的組成單位,也就是說“字根”在我們“五筆輸入法”裡是組成漢字的“基本單位”。

更多內容請觀看視頻講解,一天就可以學會五筆輸入法的理論和方法了。


分享到:


相關文章: