開源開放是人工智能發展主要趨勢之一

張蓋倫

2019年10月17日11:03  來源:科技日報
 

“飛槳”,顧名思義,想讓深度學習領域的開發者順利渡河靠岸。10月16日,在首屆世界科技與發展論壇上,百度發布了飛槳產業級深度學習開源開放平台。

飛槳以百度多年的深度學習技術研究和業務應用為基礎,同時與華為等芯片企業深入合作,集深度學習核心框架、基礎模型庫、端到端開發套件、工具組件和服務平台於一體,於2016年正式開源。它的開源開放,降低了AI技術門檻,已累計服務150多萬開發者。

當今時代,“開源”,是一個不斷被提起的詞。百度首席技術官王海峰在接受科技日報記者採訪時表示,開源開放,是人工智能發展的全球趨勢之一。

要開源,也要自主可控

“深度學習是新一代人工智能的核心支撐。”王海峰介紹,在人工智能的技術體系中,深度學習框架處於硬件層和應用層之間,其作用相當於個人電腦時代的Windows和移動時代的Android/IOS,堪稱智能時代的操作系統。以深度學習框架為核心的深度學習平台,是人工智能技術研發和產業化的關鍵基礎設施。

不過,如果要獨立研發深度學習框架,搭建完整的深度學習平台,需要強大的技術支撐。迄今為止,全球范圍內能夠做出功能完備深度學習平台的企業,隻有Google、Facebook等少數幾家。而它們推出的深度學習開源平台,也確實在全球人工智能領域佔據很大份額,不少國內企業同樣使用。

不過,國內企業也不能隻想著“背靠大樹好乘涼”。畢竟,深度學習框架是如此重要,若隻依賴少數幾個,難免會有掣肘﹔況且,不同國家人工智能發展特點並不一樣,開發者也需要更能滿足自身需求的平台。

而且,開源深度學習平台若與人工智能芯片結合,便能發揮軟硬一體優化的技術優勢,構筑智能時代的“芯片+操作系統”聯盟,掌握話語權。另外,深度學習相關人才稀缺,培養成本高,如果沒有自建生態,可能難以持續培養深度學習相關核心人才。

王海峰說,研究和發展技術領先、功能完備、自主可控的深度學習框架和平台,對於推動我國人工智能的技術創新、產業發展和人才培養,實現人工智能技術和產業的自主可控,加速各行各業智能化升級,具有至關重要的作用。

據介紹,飛槳已經在基本功能、性能、芯片支持的完備性等技術指標上與國外框架相當,在中文自然語言處理的算法模型、大規模分布式訓練、推理引擎等技術上還領先於國外框架。

“雖然在用戶規模、社區活躍度、使用便利性方面還存在短板,但是通過發揮我國在數據和人工智能產業應用上的優勢,國產深度學習框架完全可以實現與國外並跑,並有能力領跑。”王海峰說。

建設開源社區的關鍵是樹立開源思維

截至今年8月,開源社區GitHub上已經匯集了4000多萬的開發者、210萬家公司和機構,擁有超過1億的代碼庫。“在GitHub上的熱門開源項目中,人工智能類佔了很大比例。開源開放是人工智能領域發展的全球主要趨勢之一。”王海峰說,人工智能的快速發展,推動開源開放生態越發繁榮﹔而開源開放同時也推動人工智能快速普及,兩者相互促進。

GitHub算是一個開源社區的典范。那麼,要如何打造一個真正活躍的開源社區,補上上述所說的短板?

王海峰認為,開源社區要有活力,核心是社區對開發者要有價值﹔它要能提供大量有益的項目、工具和模型,並為產業創造價值,這樣一來,開發者會自發地積極貢獻自己的力量,讓社區持續繁榮。

“建設開源社區的關鍵,一是建立我國軟件行業的開源思維。”王海峰建議,可以鼓勵企業、高校和科研機構建立開源技術人才的評價和激勵機制,推動高端人才隊伍建設﹔支持相關企業聯合高校、科研院所等開展開源技術和應用的教師培訓﹔在大學的課程教育中,也培養學生的開源意識,開設國產軟件相關課程,培養更多的基礎軟件人才。

他也呼吁加強我國自主可控開源軟件及平台的推廣和應用,通過政策引導、設立專項等方式,鼓勵廣大開發者基於我國自主可控的開源軟件、平台和社區進行創新。“在國家支持的重大科技和產業化項目中,也可以使用我國自主的開源軟件開展科研工作,確保底層自主可控和信息安全。”王海峰說。(記者 張蓋倫)

(責編:趙春曉、喬雪峰)