<legend id="axlin"><track id="axlin"></track></legend>

        <cite id="axlin"><rp id="axlin"><pre id="axlin"></pre></rp></cite>
          精品无码久久久久久久久久,精品国产美女福到在线不卡,亚洲成人www,亚洲AV无码破坏版在线观看,国产精品综合一区二区三区,久久亚洲精品11p,风韵丰满妇啪啪区老老熟女杏吧,国产精品免费久久久免费
          熱搜: 佳士科技  irobot  工業(yè)機(jī)器人  機(jī)器人  ABB  機(jī)器人產(chǎn)業(yè)聯(lián)盟  發(fā)那科  庫卡  碼垛機(jī)器人  機(jī)械手 

          當(dāng)人類被機(jī)器人問倒,是一種怎么樣的體驗(yàn)?國(guó)外研究這樣說!

             日期:2019-10-28     來源:中國(guó)機(jī)器人網(wǎng) 劉眾楷    作者:阿芬     評(píng)論:0    
            近年來,研究人員一直在嘗試開能發(fā)使機(jī)器人學(xué)習(xí)新技能的方法。一種選擇是讓機(jī)器人從人類那里學(xué)習(xí)這些新技能,在不確定如何操作時(shí)從人類用戶的反應(yīng)中學(xué)習(xí)。
           
            斯坦福大學(xué)的研究團(tuán)隊(duì)最近開發(fā)了另一種用戶友好的主動(dòng)獎(jiǎng)勵(lì)學(xué)習(xí)方法,可通過讓人類用戶回答他們的問題來訓(xùn)練機(jī)器人。在arXiv上預(yù)發(fā)表的一篇論文中提出的這種新方法可以訓(xùn)練機(jī)器人主動(dòng)提出一些問題,這些問題對(duì)于人類用戶來說很容易回答,并且不是多余或不必要的,但對(duì)于機(jī)器人來說這使得他們學(xué)習(xí)。
            研究人員通過電子郵件告訴記者:“我們的團(tuán)隊(duì)對(duì)機(jī)器人如何學(xué)習(xí)人類想要的東西很感興趣。” “一種直觀的學(xué)習(xí)方式是通過提問。例如,您寧愿謹(jǐn)慎駕駛還是主動(dòng)駕駛自動(dòng)駕駛汽車?這種自動(dòng)駕駛汽車應(yīng)該在人類駕駛的汽車之前還是之后合并?”這項(xiàng)最新研究背后的主要假設(shè)是,理想情況下,機(jī)器人應(yīng)該問一些有益的問題,以從人類用戶那里獲取盡可能多的信息。換句話說,高學(xué)習(xí)能力的機(jī)器人應(yīng)該能夠通過問盡可能少的問題,來理解人類的需求或想要他們做什么。
           
            但是,實(shí)際上,大多數(shù)基于問題回答的現(xiàn)有培訓(xùn)方法,都沒有考慮人類用戶回答機(jī)器人提出的特定問題有多么容易。這通常會(huì)導(dǎo)致用戶浪費(fèi)時(shí)間來回答大量不必要的問題或無法確定地進(jìn)行響應(yīng)。
           
            研究人員說:“我們發(fā)現(xiàn)大多數(shù)最先進(jìn)的算法都顯示出(幾乎)無法區(qū)分的人類替代方案,從而使人們無法正確回答機(jī)器人的問題。” “以我們的示例為例,這些方法可能會(huì)問:“您是否希望以29 mph或31 mph的速度在人工駕駛汽車前合并?”這對(duì)于機(jī)器人決定是否在人們希望時(shí)速超過30英里/小時(shí),但這種選擇(對(duì)于人來說)太接近了,人們無法可靠地做出響應(yīng)。”
           
            為了克服現(xiàn)有主動(dòng)學(xué)習(xí)方法的局限性,研究人員開發(fā)了一種算法,可以選擇更有效的問題來詢問用戶。該算法確定的問題最大程度地減少了機(jī)器人對(duì)人類用戶偏好的不確定性(即,使信息獲取最大化),同時(shí)還考慮了人類用戶回答這些問題的難易程度。
           
            研究人員說:“受先前工作的缺點(diǎn)的啟發(fā),當(dāng)我們開發(fā)這種算法時(shí),我們專注于考慮人類實(shí)際回答機(jī)器人提出的問題的能力。” “這是基于這樣的思想,即只有負(fù)責(zé)人類回答能力的機(jī)器人才能準(zhǔn)確,高效地學(xué)習(xí)人類的需求。”
           
            研究人員通過測(cè)量熵的減少(即不確定性的量度)來計(jì)算信息增益,該熵的減少是根據(jù)機(jī)器人提出的問題對(duì)人類用戶的偏好進(jìn)行的。換句話說,最大化信息增益的問題將最大程度地減少機(jī)器人對(duì)人類用戶的喜好有什么不確定性。這為機(jī)器人提供了一個(gè)正式的目標(biāo),他們可以用來選擇最有用的問題。
           
            “信息增益的一個(gè)很好的特點(diǎn)是它固有地最大化了機(jī)器人的不確定性(這樣機(jī)器人就可以從這個(gè)問題中學(xué)到很多東西),同時(shí)也使人類的不確定性最小化(這樣,這個(gè)問題對(duì)人類來說是容易回答的)。使用信息增益生成問題,從而提高主動(dòng)學(xué)習(xí),不僅是因?yàn)閱栴}是最大的信息,但也因?yàn)槿祟愄峁└俚腻e(cuò)誤反應(yīng)。
           
            研究人員設(shè)計(jì)的方法貪婪地選擇在每一個(gè)時(shí)間步長(zhǎng)最大化信息增益的問題。從本質(zhì)上講,機(jī)器人對(duì)與之交互的用戶的偏好保持一種信念(即概率分布),并從這種信念和可能的問題空間中獲取樣本。
           
            最終,機(jī)器人選擇的問題是,在當(dāng)前可能的人類偏好分布中,提供最多的信息增益。隨后,它會(huì)根據(jù)收到的答案更新用戶想要什么的答案。這個(gè)過程不斷重復(fù),讓機(jī)器人通過學(xué)習(xí)用戶的偏好逐漸提高性能。
           
          圖片來源:B?y?k
           
            研究人員說:“我們制定了一種計(jì)算簡(jiǎn)便的方法,可以讓我們快速發(fā)現(xiàn)人類對(duì)真實(shí)機(jī)器人任務(wù)的偏好,優(yōu)于以往的方法。”在我們的研究中,用戶更喜歡我們的方法,而不是其他最先進(jìn)的技術(shù)。”
           
            在他們的研究中,斯坦福大學(xué)的團(tuán)隊(duì)表明,訓(xùn)練機(jī)器人提問最大化信息增益與最先進(jìn)的方法具有相同的計(jì)算復(fù)雜性。換句話說,與其他方法產(chǎn)生的問題相比,機(jī)器人發(fā)現(xiàn)這些信息性問題并不難。
           
            最終,機(jī)器人選擇了在可能的人類偏好的當(dāng)前分布范圍內(nèi)提供最大信息收益的問題。隨后,它根據(jù)收到的答案更新對(duì)用戶想要的信念。該過程不斷重復(fù)進(jìn)行,從而使機(jī)器人可以通過了解用戶的偏好來逐漸提高其性能。
           
            研究人員說:“我們還指出,我們的方法具有一些理想的數(shù)學(xué)特性,例如亞模量,這使我們能夠采用為先前方法開發(fā)的擴(kuò)展和理論界限,并將其與我們的方法一起使用。” “例如,我們可以使用先前的著作來一次查找多個(gè)信息性問題,而不是一次搜索一個(gè)問題。”
           
            該團(tuán)隊(duì)通過一系列模擬評(píng)估了他們的主動(dòng)獎(jiǎng)勵(lì)學(xué)習(xí)方法,發(fā)現(xiàn)該方法使機(jī)器人能夠比其他最新方法更快,更準(zhǔn)確地掌握人類的喜好。在人們可以正確回答難題或回答為“我不知道”的情況下,也是如此。
           
            研究人員還進(jìn)行了一項(xiàng)用戶研究,其中要求人類參與者回答由他們的方法產(chǎn)生的問題,以及使用其他最新方法產(chǎn)生的其他問題。他們收集的反饋表明,人們發(fā)現(xiàn)用他們的方法所產(chǎn)生的問題要容易回答得多。另外,用戶通常認(rèn)為使用新方法的機(jī)器人比以前提出的方法更能準(zhǔn)確地表達(dá)自己的偏好。
           
            研究人員說:“綜合考慮我們所有的貢獻(xiàn),我們朝著使機(jī)器人能夠確定人的偏好邁出了一步。” “我們證明了我們最初希望機(jī)器人最大化的真正目標(biāo)——提出問題以獲取盡可能多的信息,這可以用與現(xiàn)有方法相同的計(jì)算復(fù)雜性來解決。”
           
            將來,由這組研究人員開發(fā)的主動(dòng)獎(jiǎng)勵(lì)學(xué)習(xí)技術(shù)可以幫助更有效地訓(xùn)練機(jī)器人,使它們更符合用戶的喜好。此外,它還可用于教機(jī)器人問人類可以輕松理解和回答的問題。在未來的研究中,研究人員還希望研究訓(xùn)練機(jī)器人的方法,以對(duì)其動(dòng)作進(jìn)行有用的解釋。
           
            研究人員說:“我們對(duì)機(jī)器人感到興奮,它們不僅能提出好問題,還能解釋為什么會(huì)提出這些問題。”我們?cè)O(shè)想這樣一個(gè)場(chǎng)景:一輛自動(dòng)駕駛汽車將人類兩種不同的合并方案可視化,然后說明它之所以詢問這些方案,是因?yàn)楝F(xiàn)在正是交通高峰時(shí)間,它想確定自己的行為是否應(yīng)該更積極。”
           
           
          更多>相關(guān)資訊
          0相關(guān)評(píng)論

          推薦圖文
          推薦資訊
          點(diǎn)擊排行
          主站蜘蛛池模板: 五月丁香六月狠狠爱综合| 女人张开腿让男人桶爽 | 午夜爽爽爽男女免费观看影院 | 国产精品亚洲中文字幕| 亚欧洲乱码视频在线专区| 中文午夜乱理片无码| 无遮挡aaaaa大片免费看| 国产精品久久无码不卡黑寡妇| 少妇真人直播免费视频| 国产肉丝袜在线观看| 永泰县| 亚洲成人午夜排名成人午夜| 国产精品第一区亚洲精品| 男女性高爱潮免费网站| 99在线小视频| 亚洲精品成人久久av| 日韩精品亚洲 国产| 亚洲欧洲精品一区二区| 国产91丝袜在线观看| 理论片午午伦夜理片久久| 亚洲一区二区三区在线观看精品中文| 国产av一区二区三区综合| 日韩精品福利一二三专区| 亚洲第一区二区快射影院| 亚洲综合一区二区三区| 天天摸夜夜摸夜夜狠狠添| 午夜精品久久久久久久2023| 乐业县| 一本色道婷婷久久欧美| 成人av午夜在线观看| 隔壁老王国产在线精品| 亚洲欧洲日产国无高清码图片| 人人做人人澡人人人爽| 久久国产一区二区三区| 国内不卡不区二区三区| 亚洲日韩一区二区| 国产综合久久亚洲综合| 67194熟妇在线观看线路| 果冻传媒一区二区天美传媒| 久久亚洲AV成人网站玖玖| 亚洲成人av一区二区|