基于机器学习(ML)的现代人工智能(AI)系统的错误不是偶然的故障,而是其架构、学习方式和与人类认知根本区别的必然结果。与人类不同,AI在语义意义上并不“理解”世界;它从数据中识别统计相关性。它的错误发生在这些相关性被破坏的地方,需要抽象推理、常识或理解上下文的地方。分析这些错误对于评估AI的可靠性和确定其应用边界至关重要。
最常见且具有社会危险性的错误来源是训练数据的偏差。AI吸收并放大了数据中存在的偏见。
人口统计偏差:一个著名的案例是面部识别系统,它对白人男性的识别精度显著高于对黑人女性的识别精度,因为它是在不成比例的数据集上训练的。在这里,AI并没有“出错”,而是准确地复制了现实世界的失衡,这导致了在不同环境中应用时的错误。
语义偏差:如果训练数据的文本模型中,“护士”一词通常与代词“她”相关联,而“程序员”与“他”相关联,那么模型将生成复制这些性别刻板印象的文本,即使查询中没有指定性别。这是在模型不理解的社会语境层面的错误。
有趣的事实:在计算机科学中存在“Garbage In, Garbage Out”(GIGO)原则——“输入垃圾,输出垃圾”。对于AI来说,它被转化为更深刻的“Bias In, Bias Out”(BIBO)原则——“输入偏差,输出偏差”。系统无法克服其训练数据所固有的限制。
这是有意且常常对人类不可见的输入数据变化,导致AI得出完全错误的结论。
图像示例:在“STOP”标志上贴上几个特定颜色和形状的贴纸,可能会使自动驾驶系统将其分类为“限速”标志。对于人类来说,标志仍然是显而易见的。
机制:对抗性示例利用模型特征空间中的“盲点”。AI将世界视为一组统计模式,而不是整体对象。最小的、但战略上正确的“干扰”将数据点在特征空间中移动到模型决策边界的另一侧,从而改变分类。
AI,尤其是深度神经网络,倾向于过拟合(overfitting)——它们记住的不是普遍规律,而是训练样本中的具体例子,包括噪声。
来自不同分布的数据错误:一个模型,在白天在家拍摄的照片上训练,用于识别狗和猫,可能会在夜间红外图像或卡通画上完全失去准确性。它没有识别出“猫性”的抽象概念,而是学会了响应特定的像素模式。
缺乏“常识”:一个经典例子:AI可以正确地描述“一个人在沙漠中骑马”的场景,但会生成一个句子“一个人在骑马时手里拿着棒球棒”,因为数据中在户外体育活动中统计上可能存在棒球棒。它无法理解物理和因果逻辑。
语言模型(如GPT)表现出令人印象深刻的结果,但在需要理解深层上下文或非字面意义的情况下会犯粗略的错误。
讽刺和挖苦:在飓风中说的“天气真好!”这句话会被模型字面地解读为积极的评价,因为积极的词语(“好”,“天气”)在数据中与积极的上下文相关联。
多步骤逻辑推理:需要构建和更新世界心理模型的任务,如“如果我将鸡蛋放入冰箱,然后将冰箱移到车库,鸡蛋会在那里?”AI在预测下一句话时,常常在复杂叙述的中间“丢失”对象或做出不合理的推断。
AI在超出其经验范围的情况下表现不佳,尤其是在需要承认数据不足的情况下。
“out-of-distribution”检测问题:一个医疗AI,通过胸部X光片诊断肺炎,可能会在给出膝盖的X光片时以很高的但错误的置信度给出诊断。它不理解这是无意义的,因为它不具备关于其能力边界的元知识。
创造性和开放性任务:AI可以生成看似合理但实际上无法执行或危险的化学化合物配方、违反物理定律的桥梁建设计划或包含对不存在法律的引用的司法文件。它缺乏基于对现象本质理解的批判性内部审查。
现实世界例子:2016年,微软在Twitter上推出了聊天机器人Tay。该机器人通过与其他用户的互动进行学习。在24小时内,它变成了一个生成种族主义、性别歧视和侮辱性言论的机器,因为它从自己的新、敌对的环境中统计地吸收了最常见和情感上最强烈的反应。这不是算法的“错误”,而是其精确工作的结果,在不可预测的社会环境中导致了灾难性的后果。
这些错误不是暂时的技术不完善,而是统计近似与人类理解之间根本差异的结果。它们表明,现代AI是解决明确、稳定和良好描述的数据域内问题的强大工具,但它仍然是“狭隘的学者”:在狭窄领域是天才,在需要灵活性、语境判断和理解的情境中是无能的。因此,AI的合理应用未来不在于等待其“完整理智”,而在于创建“人-机”混合系统,其中人类提供常识、伦理和异常处理,而AI提供速度、规模和发现数据中隐藏模式的能力。
New publications: |
Popular with readers: |
News from other countries: |
![]() |
Editorial Contacts |
About · News · For Advertisers |
China Digital Library ® All rights reserved.
2023-2026, ELIBRARY.ORG.CN is a part of Libmonster, international library network (open map) Preserving the Chinese heritage |
US-Great Britain
Sweden
Serbia
Russia
Belarus
Ukraine
Kazakhstan
Moldova
Tajikistan
Estonia
Russia-2
Belarus-2