- OpenAI“草莓”新项目曝光,AI推理能力迈向更高峰
- OpenAI人事变动:AI安全高管马德里转岗,专注AI推理新领域
- 作家集体反对番茄小说AI协议,公司回应:已上线解除条款功能入口
- 橡鹿科技再获京东近 2 亿元战略投资
- ElevenLabs推出Turbo 2.5 AI模型:普通话转语音速度飙升3倍
- OpenAI发布GPT-4o mini,号称功能最强、成本效益最高的小模型
- 每秒40 Tokens!商汤绝影开创原生多模态大模型车载新时代
- 通义千问、GPT-4o 等七款大模型“高考”成绩揭晓:前三名文科破一本线,理科跃二本线
- Meta因监管困扰,将不会在欧盟发布新的多模态 AI 模型
- 中国农大发布“神农大模型2.0”,赋能农业多领域创新
- OpenAI“草莓”新项目曝光,AI推理能力迈向更高峰
- OpenAI人事变动:AI安全高管马德里转岗,专注AI推理新领域
【ITBEAR科技资讯】6月24日消息,近期研究显示,OpenAI的最新聊天机器人GPT-4o在道德解释和建议方面展现出了令人瞩目的能力,其表现甚至超越了“公认的”道德专家。
据The Decoder于当地时间周六的报道,由美国北卡罗莱纳大学教堂山分校与艾伦AI研究所的科研人员联手进行的两项研究,对GPT模型与人类的道德推理能力进行了深入的比较分析。这些研究旨在探索大型语言模型是否可以被视为“道德专家”。
在第一项研究中,科研人员邀请了501名美国成年人参与。他们比较了GPT-3.5-turbo模型与其他人类参与者所提供的道德解释。结果令人惊讶,人们普遍认为GPT给出的解释在道德层面更为合理、更值得信赖,同时也显得更为周到。评估者们甚至认为,与其他参与者相比,人工智能的评估更为可靠。尽管差异并不显著,但这一关键发现揭示了AI在道德推理方面已达到甚至可能超越人类水平。
第二项研究则更具挑战性,科研人员将OpenAI最新的GPT-4o模型所生成的建议与《纽约时报》“伦理学家”专栏中的知名伦理学家Kwame Anthony Appiah的建议进行了对比。共有900名参与者对50个“伦理困境”中的建议质量进行了评分。结果再次令人震惊,GPT-4o在几乎所有方面都超越了人类专家。人们普遍认为,AI生成的建议在道德上更为正确、更值得信赖、更为周到且更为准确。仅在感知细微差别方面,人工智能与人类专家之间未表现出显著差异。
据ITBEAR科技资讯了解,研究团队认为这些结果充分表明,AI完全有可能通过“比较道德图灵测试”(cMTT)。此外,文本分析还显示,在提供建议时,GPT-4o使用的道德和积极语言明显多于人类专家,这或许可以部分解释为何AI的建议能够获得更高的评分,当然,这并非唯一因素。
然而,这项研究主要针对的是美国参与者。未来,科研人员仍需进一步探讨人们如何看待AI生成的道德推理在不同文化背景下的差异。
- 小度亮相WAIC 2024,构建未来全场景智能生活
- 全球首颗Transformer AI芯片Sohu发布:每秒处理速度达50万tokens
- 安徽亳州与华为强强联手,合作打造全球首个“华佗”中医药大模型
- OpenAI终止对中国服务,百度、阿里等大模型厂商联手抢占市场先机
- 笑容略显尴尬,日本造出会‘笑’的机器人脸
- 腾讯‘AI翻译公司’TransAgents 上线:成本仅为人译1/80,效率翻倍
- 钉钉全面开放AI生态,首批迎7家大模型厂商入驻
- realme 真我 GT7 Pro 手机被曝搭载骁龙 8 Gen4,1.5K等深微曲直屏设计
- 中国农大发布“神农大模型2.0”,赋能农业多领域创新
- 百度文心智能体平台全面升级,文心大模型4.0免费开放给开发者
- 通义千问、GPT-4o 等七款大模型“高考”成绩揭晓:前三名文科破一本线,理科跃二本线
- OpenAI 提出通用人工智能五级标准,自认为即将达到第二级
- 作家集体反对番茄小说AI协议,公司回应:已上线解除条款功能入口
- AI护航,老小安康——用数智构筑家庭守护多重方案
- AI变“金手指”,助大学生悄无声息拿高分
声明:本网站是公益性科普网站,为网友提供科技类资讯内容,无障碍技术由太阳湾捐增,为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利,请通知我们及时删除。
合作咨询QQ:642361(微信同号) 争议稿件处理QQ:42503264
中国(山东)自由贸易试验区 · 齐鲁软件园 鲁ICP备11015305号-1
Copyright © 小熊科技资讯 2007-2021 ITBEAR.COM.CN All rights reserved.