昆騰公司正在開發(fā)一款可以檢查存儲在StorNext文件系統(tǒng)和ActiveScale對象存儲中的非結(jié)構(gòu)化數(shù)據(jù)AI軟件,用以實現(xiàn)對這些非結(jié)構(gòu)化數(shù)據(jù)(視頻、圖像和文檔)中內(nèi)容的識別。

昆騰公司人工智能和云技術(shù)總監(jiān)Plamen Minev在接受《權(quán)威》雜志采訪時透露了這一點(diǎn)。
昆騰公司已經(jīng)開發(fā)了由CatDV媒體資產(chǎn)管理系統(tǒng)和StorNext文件系統(tǒng)支持的AI和機(jī)器學(xué)習(xí)類的內(nèi)容增強(qiáng)解決方案。其中集成了Nvidia DeepStream、Riva和Maxine AI和機(jī)器學(xué)習(xí)技術(shù);其可以在視頻幀內(nèi)進(jìn)行目標(biāo)識別,進(jìn)行語音到文本的翻譯,提供視頻和音頻的超分辨率重建,以及向視頻和圖像文件添加元數(shù)據(jù)。

Minev說,該方案的內(nèi)容識別包括事件、人物甚至可以識別誰在什么時候說了什么,是對誰說的。舉例來說,這些事件可以是足球比賽中的進(jìn)球或點(diǎn)球事件。
比起手動標(biāo)記對象的行為,這樣的解決方案可謂是向前邁進(jìn)了一大步。其依靠復(fù)雜的人工智能技術(shù),可以對文件、錄音、圖像和視頻進(jìn)行操作;而文檔內(nèi)容的識別,相對來說比查看圖像和視頻更為簡單。就如上一段中的舉例來說,“進(jìn)球”或“點(diǎn)球”這兩個詞可以簡單地就在文本文件中找到,但在圖像或視頻中找到進(jìn)球要困難得多:需要對圖像或視頻從不同角度查看門柱和守門員,并探測到越過球門線的足球。
未來,昆騰公司希望系統(tǒng)可以自動向文檔、圖像和視頻記錄中添加元數(shù)據(jù)。從而使得用戶能夠在潛在的數(shù)百萬個文件和對象中搜索自己所需要的內(nèi)容,例如“查找過去5年曼聯(lián)足球比賽中的所有的黃牌判罰”。
這樣的解決方案也可以協(xié)助人工搜索,通過自動總結(jié)文件和對象的內(nèi)容以及其中重要的事情或人物,從而進(jìn)行有效排序。
CatDV會將人工智能生成的元數(shù)據(jù)添加到其中,然后在媒體資產(chǎn)搜索中用作索引,通過該索引可以查找到相關(guān)內(nèi)容,比如,這些內(nèi)容可以在創(chuàng)建廣播新聞項目時提供參考或再次使用。
當(dāng)然,人工智能技術(shù)的領(lǐng)域跨度非常大,涵蓋了諸如自然語言處理、語音識別和計算機(jī)視覺等等領(lǐng)域。而昆騰公司期望能夠以垂直市場為重點(diǎn),然后再將一整套的人工智能/機(jī)器學(xué)習(xí)功能添加到CatDV系統(tǒng)之中。當(dāng)然,這樣的環(huán)境依舊是非常有挑戰(zhàn)性的,因為物體的識別大概率取決于現(xiàn)場情況與具體需求。比如,棒球、足球、板球和網(wǎng)球賽事可以用到的物體識別技術(shù),是否能為一場F1賽事識別類似的圓形的物體?雖然前者需要的是一個球;而后者則需要發(fā)現(xiàn)一個頭盔。
此外,昆騰公司還可以提供CatDV媒體元數(shù)據(jù)發(fā)現(xiàn)服務(wù),該服務(wù)可以通過內(nèi)容掃描操作來檢查存儲在本地或云中的媒體資產(chǎn)。
具體的人工智能/機(jī)器學(xué)習(xí)服務(wù)可以是來源于由昆騰公司或其他第三方所提供的插件,從而使得CatDV系統(tǒng)能夠基于不同的機(jī)器學(xué)習(xí)模型,查看視頻監(jiān)控文件或醫(yī)學(xué)圖像,比如X光、CAT和MRI掃描圖像等等,并對需要存儲的圖像做好標(biāo)記。這樣,該系統(tǒng)可以做到提醒臨床醫(yī)生,掃描圖像是否需要人工檢查來判斷疾病是否真的存在。
這種跨內(nèi)容類型元數(shù)據(jù)的自動創(chuàng)建,很可能成為用戶決定是否購買特定存儲產(chǎn)品的決定性因素。一套能夠覆蓋本地+云端的文件和對象的存儲系統(tǒng),兼具有自動分層、基于人工智能的內(nèi)容發(fā)現(xiàn)和標(biāo)記功能;無疑是要比基本的文件或?qū)ο蟠鎯ο到y(tǒng)具備更大吸引力的——無論這樣的系統(tǒng)成本有多低、速度有多快。







