《重生學神有系統》第20章 寫論文
二十來分鐘后,大家鍛煉完畢,回寢室稍作整頓,盥洗一番之後,就去了食堂。
由於早起運的關係,每個人都多吃了一個饅頭,神頭也好了不。
飯後溜達了一會兒,幾個人就結伴回班,上早讀。
江寒端正地坐在座位上,拿出一個嶄新的筆記本,開始寫論文的第一稿。
先寫下標題:《知機:大腦信息存儲和組織的概率模型》。
然後是摘要:「本文探討了生神經元的工作機制,並建立了一個簡單的數學模型,以及探索了如何在機學習中運用這個模型……通過對生神經元的模擬,來解決線可分的二分類問題。」
寫完摘要后,又設了幾個關鍵字,接下來就進了正文。
第一部分是背景介紹,主要討論生神經元。
「要了解智能對知覺識別,泛化,回憶和思考的能力,首先我們要回答三個問題:生系統如何知或檢測理世界的信息?以什麼形式存儲或記住信息?存儲或記憶中的信息如何影響識別和行為?
第一個問題屬於生理學領域,而且人們對它已經有了可觀的認識。第二和第三個問題,目前仍然只有大量的猜測,而且神經生理學提供的一些相關事實,還沒有被整合為一個可以被人們接的理論……」
開宗明義之後,接下來,就可以詳細討論生神經元的工作機制了。
足足用了兩千來字,才寫完這些羅里吧嗦的東西,最後下了結論。
「綜上所述,不管什麼信息被保留,都必須以某種方式,存儲為特定響應的偏好,即信息包含在連接或關聯中!」
接下來,進下一環節,建立數學模型。
對於很多人來說,這是論文寫作之中,最為困難的地方。
就算拿出「知機」這種大殺,江寒也並不擔心,會被人懷疑是重生者。
除非屢見不鮮,否則誰會一到厲害的人,就懷疑是穿越、重生來的?
網上關於劉秀和王莽的段子,只是調侃和玩笑罷了。
但江寒仍然決定,將數學部分簡一下,盡量不涉及太高深的東西。
很多高等數學的東西,大學生學起來都費勁,自己一個普通高中生,憑啥能練運用?
除非能證明自己,的確是個不世出的天才,不然很難解釋。
如果得到足夠的學點,將七維屬都加到10以上,那自己不想當天才都不可能。
可現在是起步階段,還是穩一點的好。
「知機」的工作邏輯很簡單,本來也不是什麼複雜的東西,只是表述上要稍微嚴謹一點。
前世刷過的那篇同名論文,大部分容都是枯燥的論述,數學推導並不多,關於如何在計算機上實現,則基本沒怎麼講。
這也不怪原作者,那個年代的計算機科學,本來就不怎麼發達。
而且那篇論文的華,也就是一個模型,一個原理。
至於編程實現,有了模型之後,那還不是Soeasy嗎?
但現在是2012年,計算機技已經取得了長足進步,足夠將機學習技,運用於生產生活實踐了。
所以,江寒將這篇論文的重點,放在了原理解析,以及如何實現上。
除了開頭第一段,江寒並沒有照抄原文,事實上,他也沒那個本事。
那麼長的論文,能記住大概思路,就相當不錯了。
一個字不差背下來?江寒做不到啊!
據自己對該技的理解,江寒開始自由發揮。
先從最簡單的況,也就是單變數開始討論。
「對於只含有1個輸信號xi的樣本集T,我們期找到一個線函數y=wx+b,通過輸的數據xi和標籤yi,確定其中的權重w和偏置b,其中權重w控制輸信號的重要,而偏置b可調整神經元被激活的難易程度……」
江寒越寫越順,下筆如飛。
「……
我們定義損失函數如下:L(w,b)=(1||w||)∑yi(wxi+b),據預設的學習率η,不斷調整權重w和偏置b,直到損失函數到達極小點,即可得到可用的函數模型。
綜上所述,學習演算法如下:
首先選定訓練數據集T=(x1,y1),(x2,y2),...,(xN,yN),yi∈{1,+1}並指定一個學習率η(0<η<1);
1、任意選定權重w和偏置b;
2、讀數據點(xi,yi);
3、判斷該數據點是否為誤分類點,如果yi(wxi+b)≤0則更新w=w+ηyixi;b=b+ηyi;
4、重複進行2、3步,直到沒有誤分類點。
此時,我們就獲得了最佳的w和b,把它們代y=wx+b,就得到了一個數學模型。」
知機的學習過程,有個非常形象的比喻。
假設在一個棋盤上,有一堆黑子,和一堆白子,它們不相混合。
下面,拿一細放上去。
我們希這子,能恰好將黑子和白子分開,子的一邊全是黑子,另一邊全是白子。
先把子隨機扔到棋盤上,如果恰好將黑子和白子分開了,那就皆大歡喜,否則的話,就平移和調整子的角度,直到所有白子和黑子恰好分開……
那子就是知機,而挪子的過程,就是知機在學習。
子的角度和平移量,就是要尋找的參數w和b,也就是直線(子)在平面直角坐標系(棋盤)里的函數解析式。
瞧,夠通俗易懂吧?
可惜寫論文就不能這麼寫了。
知機是人工神經網路的雛形,其中有個關鍵概念,激活函數,它決定了一個神經元是否有輸出。
江寒在這裡,用一個階躍函數sign(x)作為激活函數,其定義為:x<0時函數取值-1;x≥0時函數值為1。
只要將sign換sigmoid或者其他非線函數,就是真正的單層前饋神經網路了。
但江寒並沒有著急將sign之外的函數拋出去。
在第一篇論文里,最重要的是提出概念,其他東西完全可以在下一篇論文中再討論。
能多水幾篇,豈不更加滋滋?
搞定了輸空間是1維的況,接下來,就可以擴展到N維。
「對於一般況,當有n個輸信號時,假設輸空間是x∈Rn,輸出空間是y∈{+1,-1}。輸x∈X表示實例的特徵向量,對應於輸空間的點;輸出y屬於Y表示實例的類別。
由輸空間到輸出空間的如下函數:Ψ(x)=rsign(w1x1+w2x2+……+wnxn+b)=rsign(wTx+b),就可以稱之為知機,其中w∈Rn,b∈R為知機演算法的參數……」
在討論完n個輸信號的況后,江寒指出:
「模型建立之後,經過訓練,就可以得到一組權重和偏置,這些參數確定了一個分離超平面(定義為n維空間上的一個n-1維子空間),此超平面可以將訓練集中的數據,完全正確地分兩份,一份為正,一份為負(或者0,可以自己定義)。」
取得了模型的參數后,就可以把測試數據放進去,據模型函數運算的結果,就能對數據進行分類。
知用很廣泛,幾乎所有二分類問題,都可以用它來試一試。
當然,必須是線可分的問題,線不可分的問題,是不能用單層知解決的。
例如年齡和有沒有生活經驗,就不存在線關係;長得帥不帥和學習好不好,也沒有線關係……
關於如何高效地判斷數據是否線可分,江寒還真研究過,只是這個題目比較大,三言兩語說不清楚。
嗯……好像又能多水一篇或幾篇SCI?。
- 完結135 章
黑暗之手
山上,住著一個奇怪的人。他從不跟人交談,出門總是戴著墨鏡圍巾口罩,還很傲慢。但是聽說,他是一個神探。 我知道。 為什麼? 因為我曾經與他相遇過。 但是他現在…… 別說了。我知道,我什麼都知道。 —————— 你好,我是刑警簡瑤,薄靳言教授的妻子。 ———————— 他曾經差點就抓到了我。 但是我不會讓這種事再發生。
8 7657 - 完結6022 章
萬道龍皇
少年陸鳴,血脈被奪,淪爲廢人,受盡屈辱。幸得至尊神殿,重生無上血脈,從此腳踏天才,一路逆襲,踏上熱血輝煌之路。噬無盡生靈,融諸天血脈,跨千山萬水,闖九天十地,敗盡天下英豪,修戰龍真訣,成就萬道龍皇。
8.32 5024750 - 完結727 章
不死的我只好假扮血族
方誠被砍下腦袋。被刺穿了心臟。被塞了滿嘴大蒜。被拉到陽光下暴曬。被憤怒的仇敵碎屍萬段。方誠復活了,對仇敵們攤開雙手:“跟你們攤牌,其實我不是吸血鬼!”衆人怒吼:“我信你個鬼!”
8 10392 - 完結925 章
萬華仙道
仙界至寶遺落人間,李修賢意外獲得萬華珠,從此靈藥不再愁,煉丹不求人!帶領自己的家人走出困境,在漫漫仙道上留下了屬於自己的印記.
8 63765 - 完結600 章
是你們逼我成巨星的
那一年……剛拿到駕照的老實人周洋撞壞了草臺班子劇組的攝像機,身無分文的他只能賣身到劇組打零工。原本以為干活干到電影拍完,自己就能重獲自由。然而!!!當詐騙犯導演帶著副導演跑了,而自己則差點被長腿美女投資人當成詐騙同伙以后,老實人周洋傻眼了。…
8 10699 - 完結834 章
靈氣復蘇:開局搶了輪回眼
“靈氣復蘇+穿越+系統+無敵+不隱藏+熱血+不圣母+殺伐果決+休閑+火影+海賊……” 以日行一善為人生目標的林羽,因扶了一個摔倒的老人,不僅吃了官司,還賠的傾家蕩產,精神恍惚間被闖紅燈的小車撞飛,當場領了盒飯! “若有來生老子一定不當好人了!” 彌留之際的林羽腦海里閃過一個想法。 。。。。。 “叮!!最強打劫系統加載完畢,親愛的宿主,您好!9527竭誠為您服務!” 。。。。。。 “恭喜宿主成功打劫宇智波斑,獲得輪回眼(sss)×1” “恭喜宿主成功打劫千手柱間,獲得木遁大禮包(sss)×1” “恭喜宿主成功打劫愛德華·紐蓋特,獲得震震果實(覺醒)×1” 。。。。。。 “爸爸,我們把這個打劫了吧”9527認真的對林羽說道。 。。。 當那道霸絕寰宇的身影出現在戰場上時,區區神魔,有何俱哉! 戰!! (輪回眼,木遁,仙人體,神威,震震果實………一切你想要的都在這里!) 簡介無力請各位看官移步正文!
8.18 49142