每種具體的人工智能系統往往只具備一個或若干上述提到的功能。例如IBM的深藍強于計算能力,在國際象棋方面可以與人類對手一決高下;沃森系統擁有龐大知識庫系統,因此可以在常識問答比賽中擊敗人類選手。因為沒有統一的模型可以涵蓋這些人工智能系統,就無法形成統一的測試方法進行測試和比較。如圖1.2所示,人工智能系統A 在計算能力上得分為100,人工智能系統B 在計算機視覺識別上得分為80,人工智能系統C在機器翻譯測試得分為90分,我們仍然無法得出結論A的智力能力高于C,C的智力能力高于B的結論。
(2)第二個困難是沒有統一的模型和測試方法,能夠同時對人工智能系統和人類進行測試,這也是當前人工智能威脅論產生最重要的原因之一。因為沒有人工智能系統和人類智能水平統一的測量方法,人工智能威脅論宣揚者往往將計算機或軟件系統表現強大的領域作為標準,例如計算能力,歷史,地理等常識的掌握能力等,而忽略諸如圖像識別能力,創新創造的能力,發現規律的能力等,對于這個原因產生的問題,人工智能威脅論反駁者往往無法拿出定量的數字結果進行反駁。
目前雖然針對人類智力能力的評測方法已經非常成熟,但過去100多年的發展和改進過程中,這些方法并沒有考慮到人工智能系統的特點和發展水平,因此很難將人類的智商測試方法拿來測試人工智能系統。例如目前絕大多數人工智能系統就無法完成圖1.3所示題目,因為測試者需要首先識別圖像中的問題,并與圖中的各個圖形特征關聯起來。做不到這一點,回答問題就無法進行下去。
圖1.4所示的人類智商測試的題目需要測試者運用鉛筆,鋼筆等工具繪制圖形。用手操作物體完成任務,解決問題是人類普通的能力,但對大多數人工智能系統因為沒有相應輸出系統或操控設備,于是無法完成圖1.4所示的測試。
2025-05-12 08:39
2025-05-12 08:33
2025-05-12 08:30
2025-05-12 08:23
2025-05-07 13:20
2025-05-06 10:42
2025-05-06 10:41
2025-05-06 09:28
2025-05-06 09:27
2025-04-28 14:41