乾貨!信息分類的原則和方法!

在企業開展信息化建設過程中,信息分類與編碼是首要的工作之一,企業往往需要針對自身的生產活動需求,量身定製適合發展的信息分類與編碼方案,這樣不但可以減少分類冗餘,還可儘量避免後續編碼過程中信息指代不明以及“一物多碼”情況的發生。那麼如何分類可以更好的幫助企業?什麼是科學的分類?本文將通過對信息分類的原則和方法進行介紹來解答以上問題。

生活中的分類活動

在日常工作生活中,我們常常通過分類來對事物或概念進行科學管理。對事物進行分類管理,為人們帶來了許多方便,提高了工作效率。

與我們息息相關的分類活動可以參考以下場景:

以菜市場為例,首先區域上會分為蔬菜區、水果區、肉類區等,其次水果攤主會把蘋果、香蕉、橘子等互相區分放置不同位置供顧客挑選。在購買商品過程中,通過攤主的分類,消費者可以很快找到自己想要的東西,見圖1。

乾貨!信息分類的原則和方法!

乾貨!信息分類的原則和方法!

圖1 分類場景

可以想象,如果不對區域、商品分類,這將會對人們產生很大的困擾。 那麼分類活動除了可以帶給人們識別事物的便利外,還可以有什麼作用呢?

信息分類的作用

信息分類是人類分析、總結事物的相似性與特殊性的手段,分類是人類認識事物的重要途徑,分類的過程也是認識事物的過程。

以動物分類為例,動物分類的結果是通過進化理論、生物理論、化學理論等總結出來的,由於各物種都具有共同的起源,在漫長的進化過程中,通過遺傳、變異、分化的發展,使得它們之間都存在著或近或遠的親緣關係。生理、生化、細胞、遺傳、血清、分子生物等科學理論也是動物分類的重要基礎。由此可見,分類是知識的重要表達方式,也是人類知識的體現,動物分類展示見圖2。

乾貨!信息分類的原則和方法!

圖2 動物分類

信息分類的目的

對事物(概念)進行分類是為了有效的進行研究和管理,分類實際上是使分類對象有序化。按照工作目標不同,信息分類的目的有如下兩種:

° 實現分類對象的“劃分”

為了便於對事物(概念)進行必要的分工和管理,每個分類對象必須屬於某一類,且每個分類對象只能屬於某一類。

° 實現分類對象的“聚集”

為了便於對事物(概念)進行查找、檢索,需要將有共同特徵的事物(概念)聚集到一起,便於人們通過其特徵,快速準確的查找、檢索。這樣就需要允許一個分類對象同屬於多個不同的類。如圖書分類時,同一本書既可以屬於科普類又可以屬於生物類。

信息分類的原則

信息分類需要根據實際工作要求,對相關信息進行劃分,便於管理和使用。為了保證信息分類後的效果,需遵循以下基本原則:

° 穩定性

也可稱為科學性,即通常要選擇事物(概念)最穩定的本質或特徵作為分類的基礎和依據,確保分類結構不因環境因素而發生變化。

° 確定性

對於任何一個分類對象,在分類體系中應有唯一確定的類目與之對應。

° 可擴延性

對於在分類體系新增的類目時,不會影響已有的分類結構和原有類目,一般情況下采取設置收容類目。

° 系統性

將選定的事物(概念)的屬性或特徵按一定順序排列,形成一套系統的、科學的分類體系。

° 綜合實用性

分類要從系統工程角度出發,把局部問題放在系統整體中處理,達到系統最優。即在滿足系統總任務、總要求的前提下,儘量滿足系統內各有關單位的實際需要。

° 兼容性

儘量與有關標準(如國際標準、國家標準和行業標準)協調一致,即可以按照需求對已有標準分類進行適當的裁剪、增添,保持與有關標準協調一致。

5

信息分類的方法

分類是把問題中一個事物集合分成若干個小的集合,由於分類角度、分類目的等因素不同,對同一個事物集合的分類方法也會有所不同。例如同樣一批零件,可以按其材料分成鐵製品、鋼製品、鋁製品等,也可以按其加工工藝分成機加件、鍛鑄件、鈑金件等。分類方法的多樣性使得一個事物對象有多個分類特徵,也保證了對事物的刻畫更加準確。

信息分類的方法基本上分為如下三種:

° 線分類法(層級分類法、體系分類法)

是將分類對象按所選定的若干個屬性或特徵逐次地分成相應的若干個層級的類目,並排成一個有層次的,逐漸展開的分類體系。在這個分類體系中,被劃分的類目稱為上位類,劃分出的類目稱為下位類,由一個類目直接劃分出來的下一級各類目,彼此稱為同位類。同位類類目之間存在著並列關係,下位類與上位類類目之間存在隸屬關係。

其中,採用線分類有如下優點:

(1)容量大:可涵蓋較多條目信息。

(2)結構清晰:採用樹狀結構能較好反映類目之間的邏輯關係。

(3)使用方便:符合手工處理信息的思維習慣,便於計算機處理。

° 面分類法(組配分類法)

是將所選定的分類對象的若干屬性或特徵視為若干個“面”,每個“面”中又可分成彼此獨立的若干個類目。

通過各個屬性的組合,可以描述出一個設備的信息。如小型非數控車床。面分類各屬性彼此之間沒有隸屬關係。

其中,採用面分類有如下優點:

(1)具有較大彈性:一個面內的屬性與數量調整不會影響其他面。

(2)適應性強:可根據需要組成任何類目,便於計算機處理。

(3)易於管理:可對各個屬性進行增、刪、改等操作。

°混合分類法

在現實情況中,往往會遇到比較複雜場景,是無法僅用單一的方法進行分類,這就需要用到混合分類法。將線分類法和麵分類法組合使用,以其中一種分類法為主,另一種做補充的信息分類方法。

總結

對事物進行分類是為了有效地進行研究、管理,根據事物(信息主體)的特徵,把大的信息集合劃分成小的信息集合,將信息按一定的原則和方法進行區分和歸類,並建立起一定的分類系統和排列順序,使事物有序化。同時,信息分類往往與信息編碼相互配合,信息編碼是給信息對象賦予代碼標識,當信息編碼含有分類信息時,需要在信息科學分類的基礎上,才可以保證後續編碼工作的準確性和唯一性。因此,企業在信息化建設時,務必要重視信息分類的工作,在工作過程中,可以將分類與信息表達規範進行標準化工作,為數據治理起到指導作用。後續文章,將會針對編碼進行介紹,重點闡述信息分類與編碼的關係以及編碼的原則方法等內容。

參考文獻

  • 《信息分類與編碼及其標準化》孫香雲 劉增進 鄭朔昉
乾貨!信息分類的原則和方法!

“本文轉自融融網。

信息編碼服務 請諮詢:010-84142197


分享到:


相關文章: