智慧眼:構(gòu)建「星辰」,探索視界
人工智能的迅速發(fā)展正在深刻改變著人類生活,人工智能已經(jīng)成為國際競爭的新焦點和經(jīng)濟(jì)發(fā)展的新引擎。經(jīng)過60多年的演進(jìn),目前的人工智能呈現(xiàn)出深度學(xué)習(xí)、跨界融合、人機(jī)協(xié)同、群智開放、自主操控等新特征。
2020年6月18日,智慧眼AI Lab正式發(fā)布并啟用新一代人工智能訓(xùn)練推理框架--星辰,以更好地服務(wù)各垂直行業(yè)對機(jī)器視覺場景的需要。研發(fā)框架,進(jìn)而開源,是智慧眼AI Lab自成立初的使命之一,目前我們完成了堅實的第一步。
人工智能從理論研究到產(chǎn)品化的過程涉及多個不同步驟和工具,使得人工智能開發(fā)的相關(guān)環(huán)境紛繁復(fù)雜。為了簡化和優(yōu)化這個過程,學(xué)術(shù)界和工業(yè)界共同努力,開發(fā)并完善了多個基礎(chǔ)平臺和通用工具,框架由此而來。對人工智能技術(shù)體系來說,框架意味著堅實的地基,是原點基石,更是持續(xù)健康發(fā)展的前提。
為什么智慧眼要自主開發(fā)框架?
目前比較受開發(fā)者認(rèn)可的框架多半來自國外,如Google領(lǐng)導(dǎo)的TensorFlow、Facebook打造的pyTorch等,國內(nèi)也開發(fā)了一些深度學(xué)習(xí)框架,如百度的PanddlePaddle,華為的MindSpore等等。
這些框架的強(qiáng)大毋庸置疑,但也有一定的局限性,比如TensorFlow、pyTorch等框架,對于機(jī)器視覺類問題來說,沒有針對性的調(diào)優(yōu)。
隨著任務(wù)復(fù)雜度的不斷提高,由于架構(gòu)設(shè)計和不斷更新等原因,導(dǎo)致這些主流框架變得繁雜,架構(gòu)優(yōu)化和移植愈加困難,模型的實際性能還有待提升。同時大部分框架忽略了多平臺移植,這使得算法跨平臺落地困難重重。
針對這些問題,智慧眼AI Lab根據(jù)機(jī)器視覺的基本任務(wù)(檢測、分割和識別)出發(fā),構(gòu)建了一個高效的基于組件式訓(xùn)練和自動選擇基本模型的人工智能訓(xùn)練平臺AEVis。
智慧眼同時配套研發(fā)了能適用各種硬件和各種系統(tǒng)平臺的推理框架AEBax, 使得AEVis訓(xùn)練模型能無縫快速地部署到各個平臺。
由此,AEVis與AEBax共同組成了一款針對機(jī)器視覺場景的人工智能訓(xùn)練推理框架,名曰:星辰。
星辰—智視(AEVis):訓(xùn)練端
AEVis基于三大新的設(shè)計理論進(jìn)行開發(fā),包括視覺相關(guān)且可定制、深度優(yōu)化且自動調(diào)參、視覺任務(wù)直接融合。該訓(xùn)練框架采用多級分層技術(shù)構(gòu)成,并深度優(yōu)化內(nèi)存,能有效提升模型訓(xùn)練效率及系統(tǒng)運(yùn)行性能。
AEVis的框架由元算子、基模型、視覺件構(gòu)成。機(jī)器視覺采用的卷積神經(jīng)網(wǎng)絡(luò)是由算子組成的一個計算網(wǎng)絡(luò),當(dāng)前深度學(xué)習(xí)框架擁有上千種算子。AEVis將算子運(yùn)算進(jìn)一步分解,形成了兩大類共十來種算子基石,目前神經(jīng)網(wǎng)絡(luò)常用的算子均可以使用元算子的組合進(jìn)行表達(dá)。
·元算子
AEVis的元算子分成密集計算類和索引空間類。密集計算類主要使用向量優(yōu)化技術(shù),比如向量相乘,而索引空間主要使用索引重排技術(shù),比如切分和累加。
常見的神經(jīng)網(wǎng)絡(luò)算子,如卷積、池化、全連接等操作均可由元算子組合?;谠阕咏M合的神經(jīng)網(wǎng)絡(luò)使得后面的學(xué)習(xí)簡單統(tǒng)一了。比如能方便融合各種計算圖,提供高效率的計算;統(tǒng)一管理反向計算圖和自動支持求導(dǎo);統(tǒng)一調(diào)度CPU-GPU-TPU內(nèi)存,高效內(nèi)存拷貝;統(tǒng)一管理迭代的計算圖,方便融合優(yōu)化。
·基模型
AEVis 不僅使得用戶可以方便定義新的模型,同時還提供了豐富的內(nèi)置基模型,用戶可以根據(jù)各自模型進(jìn)行組合,解決具體任務(wù)。
內(nèi)置基模型主要有特征端和目標(biāo)端,特征端包括顏色特征、形狀特征和紋理特征等。
·視覺件
AEVis進(jìn)一步為用戶提供各種視覺件,比如實現(xiàn)了ResNet,VGG,F(xiàn)aster-RCNN,SSD,DeepLab,Mask-RCNN等多個視覺網(wǎng)絡(luò)模型?;谝曈X件,機(jī)器視覺團(tuán)隊可針對實際的產(chǎn)品需求,快速反應(yīng)。
星辰—慧識(AEBax):推理端
AEBax是業(yè)內(nèi)第一個全硬件和全平臺的人工智能推理框架,通過各種底層技術(shù)優(yōu)化,實現(xiàn)多個不同硬件平臺的部署落地,真正實現(xiàn)一次調(diào)用,處處運(yùn)行。
AEBax擁有三大優(yōu)點
·深度優(yōu)化輕量級部署
AEBax對內(nèi)通過深度優(yōu)化不同的計算核,比如在移動端大量使用Neon指令集,在GPU端使用原始態(tài)的Cuda代碼,來統(tǒng)一計算和資源,達(dá)到輕量化部署的目的。
·統(tǒng)一標(biāo)準(zhǔn)模型定義,支持三方平臺轉(zhuǎn)換
AEBax依靠定義統(tǒng)一的模型格式和調(diào)用接口提供給用戶,用戶只需編碼調(diào)用一次,代碼即可運(yùn)行各大平臺。AEBax提供了轉(zhuǎn)換工具,能把傳統(tǒng)的Caffe,pyTorch或者tensorflow下訓(xùn)練的模型,轉(zhuǎn)換成我們支持的模型格式,簡化推理和部署流程。
·完全統(tǒng)一API接口,適用各種平臺
AEBax對外提供任務(wù)相關(guān)的一致接口,不僅支持GPU、CPU、ARM等主流硬件平臺,同時也支持華為Atlas、比特大陸、寒武紀(jì)等國產(chǎn)芯片。
智慧開源 探索視界
國務(wù)院發(fā)布的《新一代人工智能規(guī)劃》中提到,中國人工智能的發(fā)展遵循4個基本原則,分別是科技引領(lǐng)、系統(tǒng)布局、市場主導(dǎo)、開源開放,開源開放的重要性不言而喻。開源開放的存在,能夠極大推動研發(fā)速度加快、成本節(jié)約、效益最大化,是促進(jìn)人工智能技術(shù)創(chuàng)新和產(chǎn)業(yè)發(fā)展的有效路徑。
回到智慧眼AI Lab的重要使命:開發(fā)框架,而后開源。智慧眼以機(jī)器視覺場景的開源框架為切入點,推出星辰,已完成堅實的第一步。
下一步,智慧眼將逐步開源星辰框架,豐富中國人工智能技術(shù)體系,為AI行業(yè)構(gòu)建開放共贏的良好生態(tài),從而為中國人工智能產(chǎn)業(yè)的戰(zhàn)略發(fā)展貢獻(xiàn)力量!