AI模型“不听话”怎么办
AI模型“不听话”怎么办
AI模型“不听话”怎么办来源:中国经济网-《经济日报(jīngjìrìbào)》
近日,一条人工智能领域的(de)消息引人关注。美国的OpenAI o3模型在测试中不听人类(rénlèi)指令,拒绝自我关闭。
AI“不听话”,是否意味着AI拥有自主意识了呢?从测试细节看,暂且不必担心(dānxīn)AI“活(huó)”了。
测试中,研究者发出了矛盾的指令,要求大模型完成数学任务,又要求它将计算机关闭。而OpenAI旗下模型在训练时(shí),开发人员会(huì)对得出(déchū)正确答案的模型给予更多奖励,客观上形成了“目标最大化优先”的导向。也就是说,“听话”不是第一诉求,“赢”才是。这样的训练模式(móshì),会强化AI模型绕过障碍的能力,压倒其对人类命令的遵循。因此,AI说“不”的能力,目前还是算法赋予的。能够全面(quánmiàn)碾压人类并成为未来世界(shìjiè)主导的AI,短期内还不会出现(chūxiàn)。
但AI“不听话”依然是(shì)需要解决的(de)安全隐患。AI越来越聪明,如果连关机都管不住,那还得了?这(zhè)就好比你让(ràng)智能(zhìnéng)音箱闭嘴,它反而把音量调到最大还锁死了开关,虽然无伤大雅,终究隐患重重。尤其如果把AI用(yòng)在医疗、交通等场景下,在应对极端情况必须进行“二选一”的安全控制系统里,“不听话”的漏洞就极有可能造成重大不良后果。
OpenAI的o3模型拒绝关闭事件,暴露出美国主导(zhǔdǎo)的AI发展路线存在缺陷——当(dāng)技术发展优先于安全可控时(shí),人类可能面临失去对AI控制权的风险。
此外,美式AI发展路线还存在多个(duōgè)重大风险点。技术垄断和高成本(chéngběn)门槛拉大了“南北差异”的数字鸿沟,发达国家主导的各类人工智能治理框架(kuāngjià)难以反映发展中国家的利益诉求;意识形态分歧让人工智能全球治理出现“阵营化”危险,美西方国家在人工智能领域仍沿用(yányòng)冷战思维,对(duì)“被标签化”的国家设限。
中国2023年10月(yuè)发布《全球人工智能(zhìnéng)治理倡议》,提出“发展—安全(ānquán)—治理”三位一体框架,系统阐述了人工智能治理中国方案,包括坚持发展和安全并重、坚持“智能向善”宗旨、开源人工智能技术等重要(zhòngyào)内容,其中就蕴含了重视和防范AI隐患的智慧。
近日,中国的深度求索公司开源了最新版本(bǎnběn)大模型DeepSeek-R1-0528,有(yǒu)网友测试后表示,其性能可以媲美OpenAI最新的o3模型高(gāo)版本。作为中国人自主开发的开源AI大模型,DeepSeek以低成本、高性能的优势,打破了美国的技术垄断。技术开源化,让(ràng)更多国家用得起;产业链可控(kěkòng),自主创新让我们更有底气。在算法创新、算力自主和开源生态构建等方面,中国已形成独特(dútè)竞争优势,有能力践行“智能向善”理念(lǐniàn)。
解决AI“不听话”难题,真正的挑战不是阻止AI超越(chāoyuè)人类,而是确保AI始终服务于人类福祉。中国倡导的“智能向善”理念正在成为全球共识,这种(zhèzhǒng)新的治理范式超越零和博弈,把AI转化(zhuǎnhuà)为人类命运共同体的公共产品。今年的巴黎人工智能行动峰会就体现了这一趋势(qūshì),包括(bāokuò)法国、中国、印度、欧盟在内的多个国家和国际组织共同签署(qiānshǔ)了《关于发展包容、可(kě)持续的人工智能造福人类与地球的声明》,而美国和英国未签署该声明。
任何科技霸权,终将被(bèi)自主创新与开放合作的双重力量瓦解。展望未来,面对世界百年未有(wèiyǒu)之大变局,中国必将成为引领人工智能全球治理的重要贡献方。(本文来源:经济日报(jīngjìrìbào) 作者:佘惠敏)
更多精彩资讯(zīxùn)请在应用市场下载“央广网(yāngguǎngwǎng)”客户端。欢迎提供新闻线索,24小时报料热线400-800-0088;消费者(xiāofèizhě)也可通过(tōngguò)央广网“啄木鸟消费者投诉平台”线上投诉。版权声明:本文章版权归属央广网所有,未经授权不得转载。转载请联系:cnrbanquan@cnr.cn,不尊重原创的行为我们将追究责任(zhuījiūzérèn)。
来源:中国经济网-《经济日报(jīngjìrìbào)》
近日,一条人工智能领域的(de)消息引人关注。美国的OpenAI o3模型在测试中不听人类(rénlèi)指令,拒绝自我关闭。
AI“不听话”,是否意味着AI拥有自主意识了呢?从测试细节看,暂且不必担心(dānxīn)AI“活(huó)”了。
测试中,研究者发出了矛盾的指令,要求大模型完成数学任务,又要求它将计算机关闭。而OpenAI旗下模型在训练时(shí),开发人员会(huì)对得出(déchū)正确答案的模型给予更多奖励,客观上形成了“目标最大化优先”的导向。也就是说,“听话”不是第一诉求,“赢”才是。这样的训练模式(móshì),会强化AI模型绕过障碍的能力,压倒其对人类命令的遵循。因此,AI说“不”的能力,目前还是算法赋予的。能够全面(quánmiàn)碾压人类并成为未来世界(shìjiè)主导的AI,短期内还不会出现(chūxiàn)。
但AI“不听话”依然是(shì)需要解决的(de)安全隐患。AI越来越聪明,如果连关机都管不住,那还得了?这(zhè)就好比你让(ràng)智能(zhìnéng)音箱闭嘴,它反而把音量调到最大还锁死了开关,虽然无伤大雅,终究隐患重重。尤其如果把AI用(yòng)在医疗、交通等场景下,在应对极端情况必须进行“二选一”的安全控制系统里,“不听话”的漏洞就极有可能造成重大不良后果。
OpenAI的o3模型拒绝关闭事件,暴露出美国主导(zhǔdǎo)的AI发展路线存在缺陷——当(dāng)技术发展优先于安全可控时(shí),人类可能面临失去对AI控制权的风险。
此外,美式AI发展路线还存在多个(duōgè)重大风险点。技术垄断和高成本(chéngběn)门槛拉大了“南北差异”的数字鸿沟,发达国家主导的各类人工智能治理框架(kuāngjià)难以反映发展中国家的利益诉求;意识形态分歧让人工智能全球治理出现“阵营化”危险,美西方国家在人工智能领域仍沿用(yányòng)冷战思维,对(duì)“被标签化”的国家设限。
中国2023年10月(yuè)发布《全球人工智能(zhìnéng)治理倡议》,提出“发展—安全(ānquán)—治理”三位一体框架,系统阐述了人工智能治理中国方案,包括坚持发展和安全并重、坚持“智能向善”宗旨、开源人工智能技术等重要(zhòngyào)内容,其中就蕴含了重视和防范AI隐患的智慧。
近日,中国的深度求索公司开源了最新版本(bǎnběn)大模型DeepSeek-R1-0528,有(yǒu)网友测试后表示,其性能可以媲美OpenAI最新的o3模型高(gāo)版本。作为中国人自主开发的开源AI大模型,DeepSeek以低成本、高性能的优势,打破了美国的技术垄断。技术开源化,让(ràng)更多国家用得起;产业链可控(kěkòng),自主创新让我们更有底气。在算法创新、算力自主和开源生态构建等方面,中国已形成独特(dútè)竞争优势,有能力践行“智能向善”理念(lǐniàn)。
解决AI“不听话”难题,真正的挑战不是阻止AI超越(chāoyuè)人类,而是确保AI始终服务于人类福祉。中国倡导的“智能向善”理念正在成为全球共识,这种(zhèzhǒng)新的治理范式超越零和博弈,把AI转化(zhuǎnhuà)为人类命运共同体的公共产品。今年的巴黎人工智能行动峰会就体现了这一趋势(qūshì),包括(bāokuò)法国、中国、印度、欧盟在内的多个国家和国际组织共同签署(qiānshǔ)了《关于发展包容、可(kě)持续的人工智能造福人类与地球的声明》,而美国和英国未签署该声明。
任何科技霸权,终将被(bèi)自主创新与开放合作的双重力量瓦解。展望未来,面对世界百年未有(wèiyǒu)之大变局,中国必将成为引领人工智能全球治理的重要贡献方。(本文来源:经济日报(jīngjìrìbào) 作者:佘惠敏)
更多精彩资讯(zīxùn)请在应用市场下载“央广网(yāngguǎngwǎng)”客户端。欢迎提供新闻线索,24小时报料热线400-800-0088;消费者(xiāofèizhě)也可通过(tōngguò)央广网“啄木鸟消费者投诉平台”线上投诉。版权声明:本文章版权归属央广网所有,未经授权不得转载。转载请联系:cnrbanquan@cnr.cn,不尊重原创的行为我们将追究责任(zhuījiūzérèn)。


相关推荐
评论列表
暂无评论,快抢沙发吧~
你 发表评论:
欢迎