第758章 流形學習

姚夢娜提出的這個問題,對於常浩南來說,不難理解。

只是很難解決。

真要說起來的話,這涉及到文本挖掘、數據可視化、信息檢索、數據挖掘、機器學習乃至人工智能等一系列問題。

如果真做到姚夢娜所設想的那樣全自動化生產,那就是工業4.0了。

在1999年這個時間點上,顯然不大現實。

但不可能完全實現這一整套東西,並不意味着其中沒有可以作爲突破口的部分。

比如數據挖掘和信息檢索,就是千禧年附近很火熱的研究方向。

也就是一維數據。

再假設X中的數據樣本來自於或近似來自於低維嵌入空間中的數據Y={y1,y2,…,yn}Rd。

倒是旁邊的小超市,來來往往的人流量不少。

但當年的他作爲一個工科出身的普通技術人員,並沒有太多理論功底。

“信息……”

“這個麼……”

姚夢娜看了看紙上的一個名詞和三句話,也知道常浩南大概是沒什麼思路,乾脆站起身道:

“要不先去吃個飯?”

給定一組高維數據X={x1,x2,…,xn}RD,n爲數據樣本個數,D爲高維數據的維數。

不過,這個思路卻是可以被借鑑的。

3、提取到高質量的數據特徵,提升後續的數據表示和分類任務的效果。

而對於稍複雜一些的情況來說,要完全描述一個含義,往往需要一組數據。

姚夢娜的反應稍微慢了一點,剛想起身,又意識到還沒結賬,只好掏出錢包,無奈地走向收銀臺。

“在封裝步驟之前,專門找個人在流水線旁邊看着不就行了麼?”

餐桌周圍又恢復了平靜,只剩下偶爾發出的微弱咀嚼聲。

2、消除,或者至少降低隱藏在原始高維數據中的噪聲。

“?”

但與此同時,這一組數據又往往不只能描述這一個含義。

但主成分分析法只相當於找到投影距離最小的意義下的最佳線性映射,而現實中卻沒有那麼多簡單的線性問題。

常浩南思索半晌,又在紙上寫下了三個基本條件:

幾分鐘之後,當朱雅丹都快要吃完麪前盤子裡的炒麪時,常浩南突然開口道:

確實有點餓了。

1、對原始高維數據進行壓縮,降低原始高維數據的維度,進而節省存儲空間,同時也降低高維數據的計算複雜度。

朱雅丹瞬間縮了縮頭:

“我只是隨便一說……但有些時候人腦的作用或許還是沒辦法代替的……”

實際上,在常浩南重生之前,飛機設計和製造領域已經開始應用這方面的技術,他本人也接觸過不少。

正在低頭吃飯的姚夢娜一愣,旋即意識到常浩南這還是在思考剛纔她提出來的問題。

顯然,這並不能被算作是“完整且可行”的思路。

更何況數學這種東西,光靠俺尋思是尋思不出個一二三的。

小學和中學時候做的應用題,大體上就是這樣。

常浩南放下只吃了一口的羊湯麪,蹭地站起身,快步離開食堂。

不如先放鬆一下,換個思路。

……

常浩南搖搖頭否定道。

姚夢娜猜測道:

雖然她覺得在兩位博士面前有點班門弄斧,但最後還是沒忍住:

沒有反應。

但到了99年這會,大學生在宿舍備上幾袋甚至一箱,都不算什麼稀罕事了。

而對於理論研究來說,明確地提出問題,幾乎也就相當於走完了成功之路的一半。

朱雅丹滿腦袋問號地擡起頭,但看着常浩南思考的樣子,很有自知之明地沒有打擾。

實際生活中面臨的,其實大多數也是這種問題。

十五分鐘後,三人(連同朱雅丹)已經圍坐在了食堂二層的一個圓桌旁邊。

直到一陣來自腹部的叫聲把它從深思中吵醒。

“人類的大腦能夠通過某種辦法解析高維數據,從而獲取對外部世界的感知。”

在理想化的模型中,最好是一個數據就可以精確且唯一地描述一個含義。

“換句話說,具有高維數的外部信息必定潛在於一個低維空間中的非線性流形結構上……”

常浩南面前擺着一份熱氣騰騰的羊湯麪,但卻並沒有急着動筷子,而是出神地看着不遠處樓梯口上上下下的人羣。

常浩南突然開口道:

“那個……”

要想在數學上描述這種一組(多個)數據對應多個含義的現象,就需要將一組數據在不同的維度上進行展開。

回到辦公室的常浩南重新找到了剛纔那張紙。

而如果想要讓計算機處理這些高維數據……

“你們說……”

旁邊的朱雅丹左看看常浩南,右看看姚夢娜,實在是不知道這兩個人爲什麼突然討論起這個問題了。

這裡算是個點餐制的小竈,價格比下面的大食堂貴一些,加上還要多上一層樓,因此來這裡吃飯的人並不算多。

這就導致如今他腦子裡空有一大堆名詞,但卻不知道哪個是破局的關鍵——

在近70年前,美國統計學家哈羅德·霍特林就已經提出過將高維數據進行降維的主成分分析法。

而系統,則首先需要構建出一個完整且可行的思路出來。

儘管仍然沒有給出完整的思路,但是,他至少已經把三個抽象的基本條件解析成爲了一個具體的數學問題。

“嗯……但麪餅重量本身就有誤差,而且調料包有好幾種,稱重只能證明總量沒問題,但不能保證沒放錯……”

在三個基本條件下方又寫下了幾行字。

90年代這會,方便麪還屬於非常流行的即食類食品。 常浩南讀本科那陣子,大家的條件普遍比較差,有閒錢吃得起的人不多。

而生產方便麪的企業,顯然不太可能有多麼高大上的設備和技術。

沒有靈感,說啥都沒用。

身負安保職責的朱雅丹趕緊跟上。

他認爲方差越大提供的信息越多反之提供的信息越少,於是通過原分量的線性組合構造方差大、含信息量多的若干主分量,再進行矩陣奇異值分解,實現數據維數的降低。

“調料包大概佔整包方便麪重量的10%左右,如果少放或者多放,那應該很容易檢測出來。”

姚夢娜單手扶額:

“我們就是在想,如何才能不用這個人,但實現一樣的效果。”

常浩南從旁邊扯過一張紙,在紙的最中間寫下了兩個字。

給方便麪裡面塞調料包和給飛機打鉚釘,在數學模型上其實是差不多的。

實際上,他此時就面臨着無法從大量繁雜信息中提取出有價值信息的困境。

“大概……稱重?”

但常浩南仍然沒有動筷子。

不知不覺間,常浩南就在辦公桌前枯坐到了快要吃午飯的時候。

常浩南不是那種死鑽牛角尖的人。

尋找一個從高維觀測空間到低維嵌入空間的映射關係,使得yi=(xi),以及一個一對一的重構映射關係^-1,使得xi=^-1(yi)。

仍然沒能想出一個很好的思路。

“生產方便麪的企業,是怎麼保證不漏裝或者多裝調料包的?”

而反過來,現實中收集到的信息,在多數情況下,本身就是已經展開過的高維數據。

“你說得對。”

他在腦子裡把這三條內容過了一下,然後試圖讓系統給出一個結果。

這是由數學理論推向現實的情況。

“也好。”

其核心目的是從海量數據庫和大量繁雜信息中提取出有價值的知識,並進一步提高信息的利用率。

寫到這裡,常浩南的臉上露出了一個滿意的微笑。

想到這裡,他回到這張紙的最上面,重新寫下六個字。

流形學習方法。

第1165章 化被動爲主動第1295章 他們給的實在太多了第668章 萬家燈火第1449章 消失的坦克方隊第76章 關注一下發動機(爲盟主flankerr加更第96章 你憑什麼去研究?第572章 打破對日本的濾鏡,從你我做起第1285章 波音的困擾第1349章 鹹魚翻身的810旅第170章 客機背後的利益279.第279章 以爲是主角,其實是龍套第936章 鋌而走險!第813章 通過海峽!第718章 新裝備太多,也是一種煩惱第107章 一個月,十二年(我爬起來了)第950章 買一送一巡航導彈?第719章 上閱兵!第1390章 比核聚變規格還高的項目?第1021章 讓華夏參與遄達900項目?第878章 以光爲刀第116章 自主航空工業的新起點(二合一)247.第247章 元器件卡脖子?不是問題!340.第340章 跑得飛快的西方記者第839章 理論水平LV4,獲得被動技能!357.第357章 我,博士,還沒入學,但已經有第148章 伊留申的野望第850章 糧食戰爭的開始第1252章 我們來拯救國際空間站!第1079章 我已經全都算到了第1373章 誰來保衛美國?第1344章 我們的動作已經展開,沒有什麼秘密可言了第684章 確實需要一個課題組了第870章 新的發動機測試平臺第894章 給未來鋪路第545章 身法靈活的意大利人第1365章 相位幽靈第1342章 橫須賀快遞和關島快遞301.第301章 那就說點什麼吧(二合一)第1309章 如果不只是導彈呢?第204章 挑戰米格25!第1288章 大力出奇跡第1005章 網絡編碼技術216.第216章 沒有條件就創造條件!第1299章 沾沾常院士的喜氣第1357章 身份逆轉(新的一月,求一波月票)第76章 關注一下發動機(爲盟主flankerr加更第971章 猜中了,但沒完全猜中298.第298章 多物理場仿真第1205章 進攻還是防禦?第899章 投稿華夏期刊?376.第376章 華夏航空發動機產業大會!第475章 2711發動機結構第727章 真就買不如租了?第51章第737章 陣容離譜的畢業答辯第498章 魔改直9,火炬集團的新業務(求一波第166章 麥道,無了?第1151章 陽謀對陽謀226.第226章 他們還得謝謝咱呢!第477章 往垂直起降方面努努力吧第817章 資源二號,高光譜遙感衛星第737章 陣容離譜的畢業答辯401.第401章 首飛前的最後準備第540章 AC139直升機,進軍通用航空的鑰匙!第145章 二十年前的055型驅逐艦第1209章 摸着美國人過河第985章 少年,你想要讀博士麼?第1016章 SeA650發動機,完成總裝!357.第357章 我,博士,還沒入學,但已經有第757章 給殲11擴大產能第950章 買一送一巡航導彈?302.第302章 沒辦法低調了(二合一)第647章 側衛進化論第1105章 一炮雙響第1089章 東風航天城266.第266章 伊爾114?你們是不是搞錯了什麼第641章 “等渦扇10定型之後”第866章 國產大涵道比渦扇的裝機對象336.第336章 電磁干擾,噩夢重演第953章 M883上的新型氣膜孔第799章 影響整個數學史的郵件第1351章 “玄鳥”高超音速飛行驗證平臺第496章 爲什麼不聯繫一下作者本人呢?第983章 馬赫數0985第1344章 我們的動作已經展開,沒有什麼秘密可言了第1082章 一字型天線第641章 “等渦扇10定型之後”第54章 組織已經決定了第734章 搞到名額了第1072章 奇怪的風扇設計第122章 你晚上有空麼?第1077章 目標是全球適航第1324章 重新定義成功第1140章 形勢逆轉第1258章 歐空局的誠意第606章 宜將剩勇追窮寇第818章 佩雷爾曼的到訪第1253章 把衛星給抓下來!(求一波月票)第1385章 氚增殖模塊第848章 慄亞波的發現