2022年6月23日,年度計(jì)算機(jī)視覺頂級(jí)會(huì)議CVPR(國際計(jì)算機(jī)視覺與模式識(shí)別會(huì)議),在美國新奧爾良落下帷幕。
據(jù)悉,CVPR會(huì)議的主要內(nèi)容是計(jì)算機(jī)視覺與模式識(shí)別技術(shù),每年有約1500名參加者,收錄的論文數(shù)量一般300篇左右。CVPR有著較為嚴(yán)苛的錄用標(biāo)準(zhǔn),會(huì)議整體的錄取率通常不超過30%,而口頭報(bào)告的論文比例更是不高于5%。而OPPO今年有七篇論文成功入選,躋身一流科技廠商之列。同時(shí)在廣受關(guān)注的挑戰(zhàn)賽上,OPPO也取得了三項(xiàng)第一、一項(xiàng)第二、四項(xiàng)第三的良好成績(jī)。

在AI深度學(xué)習(xí)打天下的時(shí)代,人工智能技術(shù)從“感知智能”向“認(rèn)知智能”邁進(jìn)。多模態(tài)被眾多學(xué)者“押注”為開啟下一代人機(jī)交互的鑰匙。讓人類見識(shí)了AI從語言到視覺桎梏的威力。開始初步逐步具備像人類一樣的思考能力。多模態(tài)融合、3D視覺智能技術(shù)、自動(dòng)機(jī)器學(xué)習(xí)等正在成為人工智能領(lǐng)域的關(guān)鍵研-究熱點(diǎn)。OPPO在上述領(lǐng)域都均實(shí)現(xiàn)論文收錄,在AI關(guān)鍵學(xué)術(shù)領(lǐng)域取得創(chuàng)新突破。

本次CVPR2022上,OPPO的7篇論文涵蓋多模態(tài)信息交互、三維人體重建、個(gè)性化圖像美學(xué)評(píng)價(jià)、知識(shí)蒸餾等多個(gè)研究領(lǐng)域。尤其是OPPO研究院提出CRIS框架,這個(gè)框架基于基于CLIP模型,但明顯要強(qiáng)于CLIP模型,使得AI能夠更加細(xì)粒度地理解圖像與文本兩種模態(tài)的數(shù)據(jù)。即使輸入包含多重信息的文本描述,該框架也能夠準(zhǔn)確聚焦到對(duì)應(yīng)的圖像區(qū)域,顯示出強(qiáng)大的細(xì)粒度跨模態(tài)匹配能力。可以說OPPO正在助力AI認(rèn)知水平升級(jí)。

比如:只需說明金發(fā)男孩,AI就能準(zhǔn)確識(shí)別出圖中的人物。
OPPO對(duì)AI算法的耕耘很深,比如其首款自研芯片馬里亞納X的落地證明了OPPO自研芯片的技術(shù)與能力,而對(duì)于AI產(chǎn)業(yè)來說,馬里亞納X或許為AI在移動(dòng)領(lǐng)域的加速落地提供了新的思路。馬里亞納X這枚NPU主要用于手機(jī)影像計(jì)算領(lǐng)域,專門為提升OPPO手機(jī)的影像體驗(yàn)而定制對(duì)專用AI芯片,AI算力達(dá)到了18TOPS,高過iPhoneA15的NPU算力(15TOPS),能耗僅11.6TOPS/W。而在峰值算力強(qiáng)勁的同時(shí),還能實(shí)現(xiàn)較好的能效。

基于這樣的AI性能及高能效比,馬里亞納X在手機(jī)影像領(lǐng)域?qū)崿F(xiàn)了諸多突破,手機(jī)計(jì)算攝影發(fā)展多年,但大多數(shù)AI算法仍然只能針對(duì)單張或者多張照片進(jìn)行處理,比如AI美顏、AI夜景拍照的后處理,本質(zhì)上依然是以時(shí)間換計(jì)算,如果要算的更多,那意味著消費(fèi)者往往需要在拍攝后等待更久的處理。
而馬里亞納X讓算法在視頻端的應(yīng)用從不可能變?yōu)榱丝赡埽@對(duì)于AI算法應(yīng)用效果的提升來說是“從量變到質(zhì)變”。也就是OPPO的手機(jī)可以實(shí)現(xiàn)在RAW上進(jìn)行AI處理并實(shí)現(xiàn)4K的視頻。通過這個(gè)芯片,OPPO首次把AI的20bitRAW、4K、UltraHDR集成在一起,同時(shí)也首次在其安卓手機(jī)上實(shí)現(xiàn)了計(jì)算攝影的里程碑式的跳躍。

正如OPPO創(chuàng)始人兼首席執(zhí)行官陳明永所說,OPPO已經(jīng)走入了技術(shù)研發(fā)的“深水區(qū)”,尤其是在芯片領(lǐng)域被國外大廠長(zhǎng)期制霸的情況下,國廠商的彎道超車機(jī)會(huì)可能來自于AI技術(shù)的發(fā)展,這一點(diǎn)OPPO與海外公司起點(diǎn)并沒有差太遠(yuǎn)。








