關于案例背景
“百度AI尋人”項目是2016年底百度推出的一項AI公益服務,探索用人工智能技術幫助找到走失或被拐兒童回家。2017年,百度與民政部的全國救助尋親網合作,推出基于人臉識別技術的AI尋人平臺。首批接入全國救助站內3萬多條走失人員數據,實現家屬上傳走失人員照片后即可一鍵對比庫內所有照片,系統自動給出相似度最高的十個結果。
此外,寶貝回家志愿者協會作為在民政部門正式注冊過的民間志愿者組織,其下的寶貝回家尋子網站在中國尋親領域有較大的影響力。但是在技術層面,特別是“人臉識別比對”等人工智能的應用上需要外部技術公司的支持。寶貝回家平臺上有兩個照片庫:走失孩子尋找父母的“寶貝尋家”和父母尋找孩子的“家尋寶貝”,因此如何將兩個數據庫中的照片進行匹配,找出相似的照片,是至關重要的一環。之前人工力量來完成,費時費力,而且人眼非常容易產生紕漏,再者最為關鍵的便是跨年齡段的人臉比對工作,如何用技術解決這一問題,成為百度發力的關鍵。
百度“AI尋人”項目利用深度學習技術進行人臉特征的提取,通過度量學習的方法,在大規模人臉數據訓練模型基礎上,與走失兒童數據庫中的照片進行實時對比,使用跨年齡數據進行針對性優化,即使兒童走失多年,在跨年齡人臉識別技術的幫助下也有機會實現重聚。
關于技術方案的具體措施
百度應用跨年齡段人臉比對技術,尋找高度疑似案例,并交給志愿者團隊進行實地調查與追蹤。這個過程看似簡單,背后卻需要從算法到篩選、標注等各項技術支持。開展合作后,百度IDL(深度學習實驗室)、AIP(AI平臺部)、AIQA(AI測試部)、眾測(平臺測試部)等多個部門的十幾位技術同學成立了“AI尋人”虛擬團隊,同時為了確保跨年齡段人臉比對技術的準確性,百度通過動員所有的百度員工貢獻自己小時候的照片,以此來不斷訓練相關模型,確保識別技術的穩定性。
2019年初,“AI尋人智能小程序”上線,簡單上傳一張照片,就能與民政部全國救助尋親網及寶貝回家等平臺的數萬條走失人口數據進行一鍵比對。同時,小程序增加了尋親登記模塊,有尋人需求的用戶在登記后,信息可實時推送到尋人服務機構后臺,從而大大提升了實時尋親的效率。通過“搜索+信息流”的雙重加持,智能小程序即搜即得、無需下載的特性,更方便觸達有需求的人群。2020年9月,百度將小程序進一步升級,增加了信息推送和網友助力兩大功能,幫助更多有潛在需求的用戶了解和獲取尋找丟失被拐賣的兒童服務。
百度AI選用度量學習方法來進行識別算法研發,并搭建了一套完整的比對流程。

圖1 人臉特征提取流程
如上圖所示百度搭建了一套人臉圖片特征流程,包括以下幾個步驟:
(1)人臉檢測(FaceDetection):人臉檢測器負責從原始圖像中找到人臉的位置,以便于后續的特征分析。百度人臉算法團隊研發了一種語境輔助的pyramidbox人臉檢測,引入基于anchor的上下文輔助方法,尺度感知的Data-Anchor-Sampling方法,中稿當年頂級計算機視覺會議ICCV,多次刷新人臉檢測最權威榜單WIDERFace世界紀錄,后不斷迭代Box系列方案,在2019年WiderChallenge競賽中獲得冠軍。
(2)人臉對齊(FaceAlignment):人臉對齊是根據一組預定義的參考坐標對人臉圖像進行放縮和裁剪,從而使所有輸入人臉的五官處于一個標準的位置。這一過程中首先需要使用人臉關鍵點檢測器找到圖像中的人臉關鍵點坐標,然后計算從原始坐標到參考坐標的最佳仿射變換。百度的關鍵點檢測模型也獲得了2019ICME人臉關鍵點檢測比賽冠軍。
(3)人臉特征提取(FaceRepresentation):在人臉特征表示階段,由像素表示的原始人臉圖像經由特征提取算法被轉換為密集且具有區分度的特征向量,這也稱為模板(Template)。理想情況下,屬于同一人物的所有人臉圖像都應該被映射到特征空間中的相近位置。
(4)人臉特征匹配(FaceMatching)。人臉匹配構建塊中對輸入的兩個人臉特征向量進行比較并輸出相似度分數,以表明它們屬于同一人物的可能性。基于DCQ人臉識別算法,并使用超過2億張圖片的數據進行訓練,百度人臉識別準確率已達到99.7%。在一些特殊的場景中,人臉識別技術已成為尋親過程中不可替代的重要工具。DCQ人臉識別算法已被計算機視覺峰會CVPR2021錄用。

圖2 整體系統架構圖
圖3 首頁界面圖
百度AI尋人平臺是面向全社會的公開平臺,有尋親需求的用戶均可通過平臺發起尋人消息,以及進行照片的比對服務,不會根據用戶的年齡、性別做歧視性的限制操作行為。
百度在進行AI算法設計時,會充分考慮算法安全性,在發布新算法或算法存在重大更新時,內部會主動發起安全評估申請,由安全部進行技術支持。
關于應用效果
截至2021年3月1日,百度AI尋人平臺共計收到用戶上傳照片42萬余張,尋親成功數量達到12000多人次。用人工智能切實保護兒童權益,呵護兒童成長,守護千萬個普通家庭的幸福,真正響應人工智能為兒童的全球主張。
此外,以人臉生物信息為例,人臉生物信息被復制概率較高,倘若人臉生物信息被不法分子掌握,利用人臉信息進行網絡支付,或者冒用、販賣他人信息都會給受害者帶來極大的財產損失和人身安全。因此,作為基于人臉信息進行比對的服務,注重保障生物信息隱私。首先,對采集圖片進行base64編碼操作,把圖像轉為字符串,隱藏視覺信息。再通過深度神經網絡對圖片字符串進行建模,其中包括隨機丟棄(dropout)、非線性映射等不可能逆操作,防止從建模特征恢復原始的生物圖像信息。同時為了進一步保障數據安全,對建模的特征進行加密操作,減少特征開放帶來的安全隱患。經過上述的圖片編碼、非可逆建模和特征加密三個操作,有效的解決了生物信息安全和隱私問題。








