AI的達爾文時刻:當模型開始為生存而戰
競爭一直是人類進化的核心競爭。自古以來,人們就在不斷競爭,競爭的目標包括:
· 食物與領地
· 配偶 / 伴侶
· 部落或社會中的地位
· 聯盟與合作機會
。隨著時間的推移,那些擁有利於生存的優良特質的個體,最終得以存活、繁衍,並將自身基因代代相傳。
這個過程稱為「自然選擇」。
自然選擇的進程從未停止,其形態不斷演變:從「為生存而競爭」,逐步發展為「作為娛樂表演的競爭」(如角斗士競技、奧運會、體育賽事及電子競技),最終演變為「推動進化的加速器式競爭」(如角鬥士科技、媒體、電影、政治賽事等領域的競爭)。
自然選擇一直是人類演化的核心驅動力,但人工智慧的演化是否也遵循這個邏輯?
人工智慧的發展歷程,並非由某一項「單一發明」決定,而是由無數場「無形的競賽與實驗」所推動──這些競賽最終篩選出了得以留存的模型,也淘汰了被遺忘的模型。
在本文中,我們將深入探討這些無形的競賽(涵蓋 Web2 與 Web3 領域),並從「競爭」的視角,剖析人工智慧的演化脈絡。讓我們一同深入探索。
2023 至 2025 年間,隨著 ChatGPT 的問世,人工智慧領域迎來了爆發性成長。
但在 ChatGPT 誕生之前,OpenAI 就已透過《Dota 2》遊戲(借助“OpenAI Five”系統)嶄露頭角:它通過與普通玩家、職業選手乃至自身進行數萬場對戰,展現出了快速進化的能力,且每一次對戰都能讓自身實力不斷增強。
最終,一套複雜的智慧系統應運而生,並在 2019 年徹底擊敗了《Dota 2》世界冠軍戰隊。
另一樁廣為人知的案例發生在 2016 年:AlphaGo 擊敗了世界圍棋冠軍李世石。此事最令人驚嘆的並非「擊敗世界冠軍」這一結果,而是 AlphaGo 的「學習方式」。
AlphaGo 的訓練並非只依賴人類資料。與 OpenAI Five 類似,它透過「自我對弈」來實現演化-這是一個循環往復的過程:
· 每一世代模型都會與上一代模型展開競爭;
· 表現最強的模型變體被留存策略(p.>
·
也就是說,「達爾文式人工智慧」將原本需要數百萬年的進化過程,壓縮到了數小時的計算週期內。
這種「自我競爭循環」催生了人類從未見過的技術突破。現今,我們在金融領域的應用場景中,也看到了類似的競爭模式,只是形態有所不同。
Nof1 上週因推出「阿爾法競技場」(Alpha Arena)成為熱門話題。這是由 6 個人工智慧模型(Claude、DeepSeek、Gemini、GPT、Qwen、Grok)參與的「加密永續合約生死對決」:每個模型各自管理 1 萬美元資金,最終盈虧(PnL)表現最佳者獲勝。