第三百零一章 智能搜索引擎
未來超級智能系統 by 雁塔小菩提
2019-10-31 22:24
當天下午,一個又一個黑華文編程語言的自媒體被挖了個底朝天,然後一堆律師函就送到了他們的家門口。
由於事態的發展越來越嚴重,當天不少警方出動,再加上網上的一些內幕爆料,大家這時才發現,這些傢伙文章裡看似拽了幾個專業術語好像很懂的樣子,結果一看自媒體人的履歷,跟計算機行業壓根沒有半毛錢關係。
有好些個還是刷號的,手裡一堆號,啥都寫,天文地理八卦娛樂,什麼都寫,其實什麼都不懂。
那他們是這麼拽出那麼些個專業術語,又怎麼感覺好像黑的還有點道理的呢?無非就是到網上去搜點專業名詞,大概瞭解一下這個東西,然後就開始瞎掰。
但是因為像華文編程語言這種東西屬於小眾的東西,就像之前說,大家都習慣用英文了,幾乎沒有人想過要改成華文,但小眾的同時又是技術含量很高的東西,更沒什麼人會去網上探討這個話題。內行人都在私下溝通呢,誰沒事跑網上去瞎探討。
所以一上網搜,搜到的內容本身很多就是瞎掰的,再加上造謠者本身的瞎掰,把原本就瞎掰的東西拿來整理一下,搞成了一篇看似很高大上的技術類文章,其實就是瞎掰上瞎掰,所以很容易就被專業人士給拆穿。
但因為造謠者其實並不懂,也就無法分辨網上那些東西是不是瞎掰,總之能說出點道理就完了,本來就是為黑而黑,真的讓他們去好好研究技術,他們才沒那功夫,也沒那腦子。
更搞笑的是,這些還願意去整理一下的自媒體都算好的了,還有一些自媒體就是看到別人發的,直接拿來抄,改幾張照片,前後改幾句話,就變成自己的內容了。
所以這是包含了自媒體的原創瞎掰,自媒體的抄襲瞎掰,還有網上隨處可見的瞎掰,就暴露了兩個問題,第一,在網上的造謠成本太低,開局一張圖,內容全靠編。還有一點就是,這麼多瞎掰的內容就這麼在網上散佈著,壓根沒人管。
相信大家肯定看得到過類似趙雲是丞相,乾隆是私生子之類的文章,有依據麼?有個錘子,就是瞎掰啊,可各種各樣的瞎掰就這麼在網上擺著,當有人真的想去瞭解的時候就很容易獲取到錯誤的信息。
但瞎掰歷史人物的影響可能還潛移默化一點,但像瞎掰木龍科技,瞎掰華為,瞎掰一些當代人的影響可就直接的,真的有時候就因為某些人的幾句瞎掰,就把一個人的努力全打壓了,就活生生的毀了一個人或者是一個企業。
這年頭,大反轉的誣陷瓜網友們也吃了不少了,可還是有很多人喜歡造謠,實在是可恨又無奈。
當天晚上,網上關於反製造謠的聲音一浪高過一浪,對華文編程語言的造謠神奇了成為大家對造謠厭惡的導火索,不斷放大。
而這一晚,木龍科技燈火通明。
第二天中午,劉凡正在辦公室吃飯,有人敲響了辦公室的門,網上的事情他也都看到了,但事情鬧成這樣,這麼多人為自己打抱不平,他反倒沒想好自己該這麼表態。
推門進來十八人,都是木龍科技目前算法、系統等部門的頂樑柱級人物。
為首的正是當初劉威帶劉凡在燕京見的燕大教授徐飛鴻,「劉總,我們想來申請推出一個產品。」
「什麼產品?」看著眼前這架勢,劉凡已經知道這事不簡單了。
「智能搜索引擎。」
「智能搜索引擎的幾個難題你們都解決了?」
智能搜索引擎是木龍科技的一個儲備技術,當初本以為可能要跟谷歌剛的時候,木龍科技就投入了大量人力財力研究智能搜索引擎,但當時的技術和人才情況下做出來的智能搜索引擎並不完美,後來跟谷歌達成了深度合作,這個智能搜索引擎項目就作為了一個長期儲備項目在不斷優化中。
但想做智能搜索引擎難度還是很大的,因為要解決現在搜索引擎的一些主要問題,比如說現在大家想搜一個東西的時候經常搜出來的根本不是自己想要看的,且不說他的廣告競價導致一大堆廣告,就算是沒有廣告,因為現在度娘是以關鍵詞作為匹配信息的,再加上他內部的權重機制,導致用戶經常搜非所找,而且經常前幾頁搜出來的信息都是一模一樣的,無非就是發佈的網站不一樣,這就搞得大家很頭疼。
還有一個問題就是上面提到的,信息真偽度無法辨別,現在的搜索引擎只管搜索基本無法做到信息審核,只要不涉及三個進取,啥都能放出來,所以大家經常可以搜出假信息,尤其是一些小眾的知識點,只要有人造謠,然後你可能就按照造謠者說的去理解了。
但這個問題又很難解決,因為信息本身的真偽辨別需要一個強大的評判系統,可是很多東西可能連專家都判斷不出真偽,人工智能如何保證,還有抄襲問題,現在度娘上為什麼雷同的內容那麼多,大家都在抄襲,再加上權重機制導致了關鍵詞左右了搜索結果,用戶就很難看到更多的信息,除非不斷往下翻。
就像以前在淘寶上買東西,想買衣服,看了一件衣服之後,後面全部都推薦類似的款式,可問題是,我挑衣服的目的就是為了可以看到更多的款式啊,你清一色給我推一樣的款式,我還挑個屁啊。
可如果要改變這種極致首先就得有辦法找出誰是原創,但這也很難,因為如何判斷原創呢,就算是第一個發佈的人都不一定是原創。
當然,還有無效信息太多,很難判斷信息的有效與無效性,以及信息更新速度慢,時效性等常見問題。
要解決這些問題,一方面是改變機制,一方面的話增加交互也能改善,如果有智能交互計算機就可以更清楚的瞭解到用戶到底想看什麼,這樣可以更準確的為用戶提供所需要的信息。
可這裡就又有一個問題了,這對芯片的智能性要求就高了,也就是說要設計出高AI性能的電腦芯片,價格就上去,可電腦的智能化一直都是一個發展緩慢的領域,畢竟大家用電腦就那麼點事情,看電影,打遊戲,辦公,需要智能的地方太少了,總不能為了智能而智腦,搞點人臉識別開機什麼的吧,所以搞這樣的智能搜索引擎,整個電腦行業的性價比問題這麼解決。
所以智能搜索引擎研究了這麼久,木龍科技都沒有推出,因為這東西做出來簡單,要做好很難。
徐飛鴻沒有回答,而是把一份文件擺在了劉凡的面前。
劉凡快速瀏覽了一遍文件,33套信息處理方案,287個PC應用智能方案。
在33套信息處理方案中,改變搜索機制就不提了,關鍵是都對信息的排查提出了建設性意見,最被推薦的一套六段過濾法,將信息進行分層的智能分析,從第三段開始,還會涉及到人工審核,同時,對信息進行了不同的標注方式。
用戶在搜索信息的時候,就可以看到這個信息是官方發佈的還是個人發佈的,這個信息是否有參考來源,這個信息是否僅供參考,或者這個信息存在誤導風險等等合計100多種標注方式,至於那些確認了的虛假信息,則會直接被打上造謠的標籤。
另外,對於造謠者,系統直接與警方鏈接,人工智能不能百分百確定信息發佈者是否造謠,但可以把信息交給警方由警方進行下一步行動,一旦確定造謠,會對該造謠者發佈的所有信息貼上警告標籤,當然,轉發者不會受到這種待遇。
但對於抄襲者,木龍科技會提供抄襲質疑係統給各個平台,比如同一賬號下多個內容都涉及到抄襲嫌疑就會進入人工審核,然後進入人工質疑等環節,如果確認惡意抄襲,那等待他們的也會有特定的標籤,以及嚴重者也會受到法律的制裁。
當然,也許法律制裁的後果並沒有那麼眼中,但隨著實名認證的普及,未來對於諸如造謠者來說,將來所有的言論都將在木龍科技的搜索引擎內被貼上警告的標籤並且被系統納入重點觀察對象。
想要在線上繼續斂財,或許就沒那麼容易了。而且在方案中還考慮與阿里的徵信系統合作。
「會不會太狠了點,造謠一次就影響一生。」劉凡有意無意的問了一句。
「狠?他們造謠的時候有沒有想過,被他們造謠的受害者會受到什麼樣的傷害?這些年因為造謠家破人亡甚至輕生的新聞還少麼?這些年因為造謠導致的社會問題還少麼?
覺得狠,丫別造謠啊!」
劉凡看了眼情緒激動的徐飛鴻,做了個冷靜的手勢,「你的想法我能理解,先不說這個,你們這些方案我看了,有些確實還挺成熟的,你們花了多少時間研究出來的?」
「一晚上。」
劉凡看著徐飛鴻一臉疑惑。
後者接著解釋道,「昨天晚上,木龍科技一萬多名編程人員共同參與頭腦風暴,這是大家共同研究的結果。」
劉凡:「...」
這麼野的麼...