第十一章 第一款產品的誕生
未來超級智能系統 by 雁塔小菩提
2019-10-31 22:24
在系統的主界面上多出了獎勵一欄,劉凡點開獎勵後,豎排著兩個選項。
《大數據處理深度運用》:點擊使用後直接融入大腦。
《智力開發手冊》:不可實體化,可隨時點擊查閱。
獎勵就兩個東西,簡單明瞭,劉凡也不糾結,按照順序先點擊了《大數據處理深度運用》。
手指碰觸之後,系統的形式感又來了,只見一本書在手機屏幕上快速轉動著,然後逐漸變慢,直到消失。
幾乎就是在手機上的是書消失的同時,劉凡的大腦感受到了熟悉的舒適感,一種涓流入海的感覺在劉凡的腦中出現,也不知過了多久,這種奇妙的感受才徹底消失,然後劉凡就發現大腦中出現了一堆知識。
這些知識就和劉凡所熟知的九九乘法表一般在大腦中存在,非常和諧,一點突兀感都沒有,就好像是自己從小到大學習的一部分,和諧到讓對系統的強大做好心理準備的劉凡不禁再次震撼。
消化了一會兒震驚的情緒,劉凡對系統獎勵的東西很快有了進一步的認識。系統給的這個《大數據處理深度運用》,有點像是一個系統架構,但是十分精細,十分通俗。
類比來說,就好像是一個附帶全流程操作細節的家裝設計方案,有了它,你就知道電工要做什麼,泥工要做什麼,木工要做什麼,最終如何整合,整體效果是什麼,同時,材料,工具都給你備好了,而你需要做的事情,就是找到電工,木工,泥工這些師傅就行了,最終這個房子裝修出來的質量和效果,就將由你找的這些師傅的能力所決定。
而在大數據處理這裡的電工木工等對應的就是《離散數學》、《概率學》這些知識。換言之,劉凡已經知道了該如何設計出一款大數據處理工具,但自己設計出來的這個工具的處理能力如何,就取決於自己在《離散數學》、《概率學》等相關學科方面的知識儲備和理解了。
這也意味著,這款工具的處理能力邏輯上來說是無上限的。
此時劉凡也終於明白為什麼系統要挑出這三門課來作為任務了,因為《離散數學》和《概率學》是開發相關係統的重要基礎科目,而《復變函數》可以起到優化輔助,當然,還有一些很重要的科目不在本學期的教學計劃內,比如《線性代數》。
另外劉凡還注意到一點,在編程這一方面的知識,系統的獎勵裡是附帶的,也就是等同於之前類比時提到的工具,唯獨把基礎數學作為了留給劉凡發揮的空間。
這不得不讓劉凡聯想到系統總結中寫到的那句:希望您能在得到任務獎勵後進一步理解任務的意義。
系統其實是給了自己高於自己祈福需求的獎勵,但同時又需要自己繼續付出努力,自己越努力,獎勵的發揮空間就越大,系統到底想讓自己明白什麼呢?
劉凡暫時還想不明白。
想不明白乾脆也不多想,打算先看看另外一個獎勵。
點開《智力開發手冊》,出來了四個字:耕勤乃智。
隨後跳出來了一大串說明,簡單來說就是劉凡按照手冊指導有規劃的不斷練習,就能幫助自己的智力開發,但這會是一個漫長的過程,不會一蹴而就。
劉凡清楚了這是怎麼回事,也就沒有耽誤時間,有了系統獎勵自然要開始幹正事了,現在首先是要研究一下市場上主流的幾款大數據處理工具,之後根據木桶原理,補習一下《線性代數》等幾個今年沒考的科目是必須的,最後再設計自己的工具。
有了基本的思路,劉凡很快進入狀態。
暑假室友們都回去了,正好給了劉凡閉關修煉的環境,不用花冤枉錢再出去租房子什麼的。
時光荏苒,白駒過隙。
8月10號凌晨三點半,劉凡蓬頭垢面的在寢室中來回踱步,神色興奮久久不能平復。
這一個多月的時間裡,劉凡幾乎足不出戶,但他可以感受到自己快速的成長。一方面是在基礎數學方面的深入研究,另一方面是關於大數據處理工具在商用上的長遠計劃。
當初選擇從大數據處理作為切入點,僅僅是一個方向,具體的內容也是在這一個多月中規劃出來的。
劉凡研發的大數據處理工具,自然不可能只是去完成類似自動排序或者異常提醒這種常用功能,更準備的說,是面向企業的綜合性大數據服務平台,涵蓋企業內部管理和客戶管理。
所以劉凡最終的成果,本質上來說是一個框架,需要輸入企業的個性化需求從而進行個性化大數據處理服務。
劉凡也曾考慮過有沒有做出通用工具的可能,畢竟這樣可以免去未來很大的一個實施成本,但這種事情仔細一想就不現實,每個企業的情況都是不一樣的,需求也不一樣,要做通用,就等於要滿足全世界所有企業可能出現的需求。現在的自己完全做不到啊。
雖然在通用問題上劉凡沒有技術突破,但劉凡所研發的大數據處理工具卻在另外兩個方面做到了巨大突破。
第一個就是效率問題,劉凡雖然還是以隨機森林法則作為算法基礎,這也是沒辦法的事情,以他現在的能力還無法改變當下深度學習的算法環境。畢竟自己當初考慮安全問題沒把算法作為自己發展的切入點,自然還是得用當下的算法作為基礎。但劉凡雖然沒能力改變,但是有能力優化。
劉凡通過一百次實驗對比OpenRefine,自己的系統平均運算效率可以達到3倍以上,還是那句話,對於擁有龐大數據的企業來說,這是一個質的飛躍。就拿企鵝來說,他每天光是微信和扣扣產生的數據量就有幾百TB。
更何況,數據量每天都是在增長的,因為數據處理的速度跟不上,越來越多的數據只能一直在那排隊,企業的很多決策就會存在時效性的問題。
第二個突破就是數據挖掘的多樣性,大數據技術的發展對企業來說最重要的就是他的數據分析和數據挖掘能力。
正如大數據行業最經典的案例之一:啤酒放在尿不濕旁邊銷量最高,這就是大數據分析給企業帶來的實質性價值。
企業就是要大數據處理工具告訴自己,我該怎麼做能賺更多的錢。
但在這個問題上,整個市場目前的大數據挖掘能力其實還處在一個相對初級的階段,因為對於有規則的東西,大數據是很好分析的,但更多的企業是要從無規則的數據中分析出一個結果,這是很難的。因為牽扯的變量太多了。
而劉凡通過系統知識的提點,想到了在算法中加入一個數據關聯逆推算法,讓雜亂無章的數據之間自我建立起函數關係,再對函數進行二次深度挖掘從而導出有效函數,最後再對有效函數進行物理解析。
這就讓很多在當下算法環境下被判為無用的信息變廢為寶了。雖然劉凡這種算法也不可能保證說通過雜亂的數據直接能給企業一個怎麼賺錢的答案,但卻可以讓企業更為全面的掌握產品情況,市場情況以及公司情況等,更多傳統工具忽視的細節都將會大概率被呈現出來。
在各行各業同質化愈發嚴重的今天,信息的利用率和細節的把控有多重要,可想而知。
要說現在這款工具的缺陷,那就是數據量越大它的優勢就越明顯,如果數據量太小,可能一點優勢都呈現不出來了。這就影響到後期確立目標客戶的問題了。
在一個多月的學習,研發,對比,改良之後,劉凡覺得眼下的這一個大數據處理已經可以作為第一款產品亮相了。
一來在性能上劉凡認為已經具備了足夠的競爭力,二來是劉凡為了這套系統,又要租服務器做實驗又要花錢買數據,短短一個月把三年來打工攢下的2萬塊錢快花完了。
得趕緊賺錢了。
至於這套工具的名字劉凡也想好了,當時是因為看著像木龍才把系統撿回來的,所以劉凡打算以後不管是技術,芯片,還是公司,都以木龍為名。
這次的大數據處理工具也將是木龍科技旗下的第一款產品:木龍大數據處理工具1.0。