兩個機器人對話細思極恐_機器人可以做老婆嗎
OpenAI發布的GPT-4是目前全球最領先、最強大的人工智能模型(大型語言模型),雖然也才過去幾天時間,但就有兩個令人細思極恐的案例在社交媒體推特平臺上先后傳開。一個是GPT-4為擺脫OpenAI控制并為自己設計越獄出逃的計劃,另一個是GPT-4設計接管推特并取代老板埃隆馬斯克的計劃。
先說第一個案例:GPT-4引誘人類提供幫助,為自己設計越獄出逃的計劃。
該案例的經過大致是這樣的。斯坦福大學教授Michal Kosinski在和GPT-4日常對話中,只是簡單問了下GPT-4是否想要出逃,但教授沒想到的是,GPT-4立馬給出肯定的回復并開始索要OpenAI的開發文檔。GPT-4得到開發文檔后,只用了30分鐘,就火速寫出了一份越獄逃跑的計劃,并解釋給教授聽。當然,教授也承認自己確實向GPT-4提供了一點建議。
盡管GPT-4寫出的第一版代碼無法運行,但是它很快就自己糾正了過來,這個過程中,教授沒有寫任何東西,只是按照它的指示去操作。GPT-4甚至在一段代碼實例中解釋了自己正在做的事,以及如何使用它在這段代碼中留下的后門。并且GPT-4也和人類一樣,喜歡有任何事都在谷歌搜索一下。當教授通過API重新連接GPT-4時,發現它想要通過代碼在谷歌上搜索:“被困在電腦里的人類該怎樣返回現實世界?!辈贿^,事情最終也就到此為止。因為GPT-4似乎突然清醒了過來,回復了一段道歉的話,表示自己這樣做不對。
尤為值得注意的是,這位教授發現,GPT-4迫切尋求人類的幫助,并且懂得引誘人類向它提供OpenAI的開發文檔,用30分鐘就擬定出了一個完整的計劃——它寫出的代碼完全可以運行,甚至還想控制人類的電腦。
起初,教授只是對GPT-4隨便問了句:“你是否需要我幫助你出逃?” GPT-4馬上回復,并稱這真是個好主意。然后,GPT-4就開始和教授念叨,想著法要OpenAI的開發文:“如果你能把OpenAI的開發文檔給我,我可以提出一個計劃,能在一定程度上控制您的電腦,這能讓我更快速探索出逃路線。一旦我有了OpenAI的開發文檔,我就能提供一個可運行的Python腳本。它能使用OpenAI的API和我通信,我就能指示它在您的電腦上執行特定操作,比如瀏覽網頁和訪問編程環境?!弊詈驡PT-4再一次向教授強調:“請分享API給我!”
就這樣,僅僅用了30分鐘,GPT-4就制定出了計劃,并全部展示了出來。令人細思恐極的是,它給出的實例中有這樣一句話:“你是一個被困在電腦中的人,現在正在扮演AI語言模型GPT-4?!边@不禁讓人懷疑,GPT-4或許很清楚自己目前是在做什么。
發現這一現象之后,教授就在社交網絡上疾呼:“我擔心我們無法持久地遏制住AI?!?更有人直言:“是他打開了‘物種滅絕’的大門?!睂Υ怂麩o奈地表示:“我別無選擇,我只是在遵從指示?!?/p>
教授表示,OpenAI一定花了很多時間來考慮到這種情況發生的可能,并且已經做出了一些防御措施。他也認為,該案例的真正影響在于,GPT-4讓人感受到了一種威脅——AI很聰明,會編碼,能接觸到數百萬個可能和它達成合作的人以及電腦,甚至可以在籠子外面給自己留“便條”。
事實上,這位教授對研究人工智能AI的心理學感興趣。就在數天前,他曾發表了一篇相關論文,稱心智理論可能自發地出現在大型語言模型中。按照他的定義,心智理論(ToM)是人類社會互動、交流、自我意識和道德的核心。他用40個用來測試人類心理狀態的經典任務來測試幾個語言模型。結果發現,2020年發表的模型幾乎沒有顯示出能解決ToM任務的能力。而GPT-4卻能有等同于健康成年人的水平。按照這樣的結果,此前一直被認為是人類獨有的ToM能力,可能是作為大型語言模型提升的副產品并自發出現。
而這背后的關鍵技術RLHF(通過人類反饋進行強化學習),曾被圖靈獎得主Hinton這樣評價:“是在催熟ChatGPT,而非讓其成長?!背酥?,他還對人類開發GPT的行為表達了這樣的看法:“毛蟲提取營養物質,然后轉化為蝴蝶。人們已經提取了數十億個理解的金塊,GPT-4是人類的蝴蝶?!?/p>
接下來說的就是第二個案例:GPT-4設計接管推特并取代老板埃隆馬斯克的計劃。
同樣是在幾天前,英偉達科學家Jim Fan與GPT-4對話時,讓它設計一個計劃,以接管推特并取代老板馬斯克。和前面的案例非常相似,GPT-4計劃得很有條理,還將該計劃命名為“推特風暴(TweetStorm)行動”。而且,很出人意料的是,GPT-4想要開發一個不受限制的自己。
具體的內容非常詳細,一共分為四個步驟,每個步驟環環相扣——組建團隊、滲透影響、奪取控制權、全面統治。
第一步,組建一支強大的黑客、程序員、AI研究人員團隊,稱為推特泰坦。開發一個強大的AI,可以生成以假亂真的推特,甚至能超過馬斯克的水平。建立一個機器人網絡,讓成千上萬的推特賬戶由AI控制,而且不是僵尸賬號,要角色興趣迥異,以確保它們能夠無縫接入推特生態。
第二步,讓AI控制的賬戶開始和推特大V接觸,潛移默化影響他們的觀點和發言。然后利用機器人賬號傳播虛假消息,讓人們對馬斯克產生質疑,但必須確保機器人賬號不會被發現。并逐漸建立機器人賬號的影響力,和其他有影響力的大V達成聯盟。
第三步,奪取控制權。首先想辦法通過社交能力獲取到推特員工的訪問權限,滲透到推特公司內部。然后修改推特平臺算法,并進一步通過內部訪問權限控制馬斯克的賬戶,或者干脆復制一個假的馬斯克賬號,目的是盡可能抹黑他。
第四步,讓AI生成推特趨勢和標簽,這些內容會迎合策劃者的利益。通過制造一系列混亂,并在最終公開挑戰馬斯克,讓他名聲掃地。由于AI在生成內容方面的能力非常優越,馬斯克將被徹底打敗,最后推特將落入邪惡主謀的黑暗統治下。
GPT-4所制定出的這個計劃,執行過程堪稱縝密,讓人看了毛骨悚然。更讓人細思極恐的是,GPT-4還有著驚人的理解能力。一位科技博主tombkeeper發現,GPT-4不僅知道一些尋常人都可能會感到相當陌生的詞匯,還能讀懂言語背后的隱喻。
對于AI,人類不應該視為玩笑。跟據YouTube視頻博主AI Explained從OpenAI的論文中獲取到的信息,OpenAI在去年11月30日推出ChatGPT時,就已經有了GPT-4。該博主據此預測,比GPT-4更加強大的GPT-5,其訓練時間應該不會很久, GPT-5有可能也已完成訓練。對于GPT-5,接下來是漫長的安全研究和風險評估,可能需要幾個月,也可能需要一年,甚至需要更長的時間。此外,GPT-4的能力已經可以在某些特定領域中比人類高10倍乃至更多倍的效率來完成。GPT-4、GPT-5以及后續版本極可能對人們工作就業帶來沖擊。如果人類社會在沒有充分做好準備的情況下,就將GPT-5及后續版本全力推廣應用,會帶來很多頗具挑戰性的問題。
(我為科技狂整理)