荷蘭內(nèi)梅亨大學近日發(fā)布研究報告,指出meta和OpenAI等公司在使用“開源”術語時容易誤導用戶,部分標記為“開源”的大語言模型實際上并非開源的。

該報告特別提及了meta公司的Llama 2模型和OpenAI的GPT/codex模型,表示訓練這些大語言模型的代碼并未向公眾開放。
研究人員表示,當前AI社區(qū)中,缺乏開源大語言模型問題日益突顯。研究人員呼吁公司發(fā)布更多的開源LLM,以便研究人員和開發(fā)人員可以訪問代碼并提高這些模型的性能。
OpenAI的ChatGPT模型是最“神秘”的,不符合開源標準;而meta的Llama 2雖然宣稱是“開源”,但實際透明度只是稍微優(yōu)于ChatGPT模型,在開源排行榜上的程度依然很低。
研究報告認為這些公司主要出于以下幾點原因:
想要保護自己的知識產(chǎn)權
想要控制如何使用大語言模型
而研究人員和開發(fā)人員在面臨開源大語言模型上存在天然的弱勢,可能無法研究論文結果、改進現(xiàn)有大語言模型的性能。
meta的立場是諷刺的,因為該公司自豪地說,Llama 2可用于研究。即便如此,該公司似乎仍將該項目的某些部分鎖定在開發(fā)人員和研究人員之外。







