999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

學貫中西:讓機器學習華夏智慧

2021-03-22 09:10:20高煥堂
電子產品世界 2021年11期
關鍵詞:特征

高煥堂

0 前言

機器學習(ML)除了能夠學習大數據(big data)中的規律和法則之外,也能夠學習人類的智慧。華夏文化淵源長久、博大精深,處處充滿智慧。因此,我們可以讓機器來學習華夏的文化底蘊和智能,還能更上層樓而學貫中西。

1 復習:什么是特征(feature)

機器學習之路,首先從觀察特征出發。回憶一下,人們對于周圍的問題或事件常從不同的角度來觀察或看出不同的特征。所謂特征(feature),就是一件事物或一群事物,其具有與眾不同的特色或表征。例如,人們在辨別其他人的長相時,常常會觀察對方的臉形、眼神、嘴巴、發型等特征來區分和判斷,只要記住對方獨特的長相特征就可以,而不必記憶其他細節。這是人們天賦的觀察和提取特征的能力。再如,當您一大早從家里出門時,常常會先觀察天氣的特征:溫度23℃、“陽光普照”等。

在前面各期曾經說明了ML(機器學習)的目的并不一定是拿數據來運算,而是在于〈觀察〉在此X空間里數據的大小、分布及重復出現頻率(次數)等。每一條數據成為空間里的一個點(point),而每一項特征則成為空間的一個維度(dimension)。于是,各條數據的特征值成為該點的坐標值。

2 特征的種類

在ML(機器學習)領域,特征常分為兩種:數值型(Numerical)特征與分類型(Categorical)特征。“數值型特征”是大家很熟悉的,可以用整數或浮點數表示,是能拿來進行加減乘除等數學計算的特征(值)。例如剛才提到的氣溫是23℃。這就是一個數值特征。再如,人的身高、貓尾巴長度等也都是數值特征。至于分類型特征,又可細分為兩種:次序型(ordinal)特征和名目型(nominal)特征。

其中,“次序型特征”是具有順序、可分等級的特征。例如,衣服的大小常常分為:小(S)、中(M)、大(L)、特大(XL)4個等級。再如,牛排的熟度可分為:Blue、Rare、Medium Rare、Medium、Medium Well和Well Done 6個級別。

再如,《孫子兵法》有言:“不戰而屈人之兵,善之善者也。故上兵伐謀,其次伐交,其次伐兵,其下攻城。”其中分為4個等級:伐謀、伐交、伐兵和攻城。《孫子兵法》又言:“知彼知己,百戰不殆。不知彼而知己,一勝一負。不知彼不知己,每戰必殆。”其中分為三個等級:知彼知己、不知彼而知己和不知彼不知己。

“名目型(nominal)特征”只是對事物分門別類之后各類別的名稱或標簽而已。例如,性別:男、女。兩儀:陰、陽。五行:金、木、水、火、土。它們之間沒有級別之分。

3 如何對“分類型特征”進行編碼

在ML領域,必須將分類型特征轉換成數字,又稱為對這些特征進行編碼(encoding)。對于次序型與名目型特征,各有不同的方法將它們轉換成數字。

例如,對于次序型(ordinal)特征常使用卷標編碼(label-encoding)方式進行轉換。例如,衣服的小(S)、中(M)、大(L)、特大(XL)4個等級對應1、2、3、4,這樣特征(值)之間的大小順序也就呈現出。再如,牛排熟度的Blue、Rare、Medium Rare、Medium、Medium Well和Well Done 6個等級對應1、2、3、4、5、6,這樣就可以了。

另外,對于名目型(nominal)特征則常使用唯1編碼(one-hot-encoding)方式進行轉換,在中文里又稱為“獨熱編碼”。例如上述的兩儀。

由于它們之間不具有順序性,所以也可把“陽”對應成[01],而“陰”對應成[10]。

由于每一個編碼中都含有一個1,其他都為0,所以稱為One-Hot-Encoding編碼;簡稱OHE編碼。

4 “分類型特征”的范例

剛才已經提到了華夏文化中的五行觀念,就是金、木、水、火、土。使用OHE編碼如下:

大家知道,五行之間有“相生”關系,也有“相克”關系。

現在,來建立一個兩層神經網絡(NN)模型,如圖5所示。

以NN模型表示如圖6所示。

在Z空間中設定了5個目標值,如圖7所示。

只要按下“學習”按鈕,ML就會尋找出隱藏層的權重WH和BH,同時尋找出輸出層的權重W和B。如圖8所示。

有了隱藏層的權重WH和BH,以及輸出層的權重W和B之后,就可以隨時輸入層X空間,對應隱藏層H空間,再對應輸出層的Z空間,就得到預測值了。例如,把剛才訓練好的權重拿過來,就可以隨時輸入X值,然后通過兩層權重的計算得到Z預測值。這個過程,就是所謂的:預測(Predict)。如圖9所示。

請按下“相生”,輸入木和水的OHE編碼,然后通過兩層權重的計算得到Z預測值。如圖10所示。

例如,輸入測試數據:木=[0,1,0,0,0],通過NN模型的兩層權重計算得到預測值。此時,ML計算出預測值:Z=[0.02、0、0、0.95、0.03]。那么,ML如何得知這個預測值就是“火”呢?非常簡單,只要看看Z空間中這個預測值代表的點靠近哪一個目標值(點)就知道了。例如,預測值Z=[0.02、0、0、0.95、0.03],非常靠近[0、0、0、1、0],所以歸于“火”類。如圖 11所示。

同樣,另一測試資料:水=[0、0、1、0、0],通過NN模型的兩層權重計算得到預測值:Z=[0、0.97、0、0、0.03]。那么,ML如何得知這個預測值就是“木”呢?非常簡單,只要看看Z空間中這個預測值代表的點靠近哪一個目標值(點)就知道了。例如,這預測值Z=[0、0.97、0、0、0.03],非常靠近[0、1、0、0、0],所以歸于“木”類。

5 結語

善于使用OHE編碼將非常方便表達華夏文化中的概念(Concept)和術語。然而,您可能會問:如果數千或數萬個術語,其OHE編碼將變得很冗長,實際上可行嗎?答案是沒問題的。因為ML有很好的機制可以進行“降維”,能有效化解上述問題。下一期,將會繼續說明。

3175501908239

猜你喜歡
特征
抓住特征巧觀察
離散型隨機變量的分布列與數字特征
具有兩個P’維非線性不可約特征標的非可解群
月震特征及與地震的對比
如何表達“特征”
被k(2≤k≤16)整除的正整數的特征
中等數學(2019年8期)2019-11-25 01:38:14
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
詈語的文化蘊含與現代特征
新聞傳播(2018年11期)2018-08-29 08:15:24
抓住特征巧觀察
基于特征篩選的模型選擇
主站蜘蛛池模板: 老色鬼久久亚洲AV综合| 无码人中文字幕| 三级欧美在线| 日本精品视频一区二区| 日韩视频精品在线| 在线视频精品一区| 亚洲午夜福利在线| 亚洲精品动漫| 亚洲一区波多野结衣二区三区| 亚洲综合色吧| 粉嫩国产白浆在线观看| 国产白浆在线| 911亚洲精品| 男女男免费视频网站国产| 黑人巨大精品欧美一区二区区| 国产日韩欧美成人| 久久久久国产精品嫩草影院| 亚洲精品第五页| 福利视频久久| 精品国产成人av免费| 乱人伦中文视频在线观看免费| 亚洲欧美日韩天堂| 亚洲无码免费黄色网址| 亚洲精品桃花岛av在线| 日本手机在线视频| 啦啦啦网站在线观看a毛片| 国产成人91精品免费网址在线| 毛片在线区| 亚洲男人的天堂网| 99资源在线| 国产99视频免费精品是看6| 国产a网站| 韩国v欧美v亚洲v日本v| 成·人免费午夜无码视频在线观看| 99久久国产综合精品女同| 亚洲欧洲日韩久久狠狠爱| 日韩在线成年视频人网站观看| 日韩大乳视频中文字幕| 欧美精品在线免费| 亚洲天堂首页| 欧美特黄一级大黄录像| 婷婷亚洲综合五月天在线| 波多野结衣AV无码久久一区| 国产chinese男男gay视频网| 人人91人人澡人人妻人人爽| 69国产精品视频免费| 亚洲A∨无码精品午夜在线观看| 日韩精品无码免费一区二区三区| 亚洲精品麻豆| 亚洲男人的天堂久久精品| 99热这里只有免费国产精品 | 欧美日韩午夜| 999精品免费视频| 色综合激情网| 国产日韩精品欧美一区灰| 中日韩一区二区三区中文免费视频| 91精品国产91久久久久久三级| 亚洲精品欧美日韩在线| 成人字幕网视频在线观看| 中国精品久久| 亚洲综合狠狠| 国产91丝袜| 在线观看亚洲人成网站| 午夜a级毛片| 91色老久久精品偷偷蜜臀| 波多野结衣在线se| 拍国产真实乱人偷精品| 天天爽免费视频| 中文字幕免费在线视频| 成人免费午夜视频| 亚洲天堂精品在线观看| 免费人成网站在线高清| 免费一级毛片不卡在线播放| 亚洲αv毛片| 狠狠色成人综合首页| 日本久久网站| 欧美色视频日本| 美女高潮全身流白浆福利区| 小说区 亚洲 自拍 另类| 亚洲美女AV免费一区| 日本91视频| 日本不卡在线|