在人們可能期望人工智能模仿的所有形式的人類智力中,很少有人會把創(chuàng)造力放在他們列表的首位。創(chuàng)造力是非常神秘的,令人沮喪的是轉瞬即逝。它將我們定義為人類,似乎無視機器硅幕背后的冷酷邏輯。
然而,將人工智能用于創(chuàng)造性努力的情況正在增長。
像DALL-E和Midjourney這樣的新AI工具越來越多地成為創(chuàng)意制作的一部分,其中一些已經開始因其創(chuàng)意輸出而獲獎。日益增長的影響是社會和經濟方面的——僅舉一個例子,人工智能產生新的創(chuàng)意內容的潛力是好萊塢編劇罷工背后的決定性爆發(fā)點。
如果我們最近對人工智能驚人原創(chuàng)性的研究有任何跡象,那么基于人工智能的創(chuàng)造力的出現(xiàn)——以及它的希望和危險的例子——可能才剛剛開始。我們的研究結果發(fā)表在《創(chuàng)造力雜志》上。
新穎性和實用性的融合
當人們最有創(chuàng)造力時,他們通過產生新的東西來回應需求、目標或問題——以前不存在的產品或解決方案。
從這個意義上說,創(chuàng)造力是一種以有用或令人滿意的新方式結合現(xiàn)有資源(想法、材料、知識)的行為。很多時候,創(chuàng)造性思維的結果也是令人驚訝的,導致創(chuàng)作者沒有——也許也不可能——預見到的事情。
它可能涉及一項發(fā)明,一個笑話的意外妙語或物理學中的開創(chuàng)性理論。它可能是音符、節(jié)奏、聲音和歌詞的獨特安排,從而產生一首新歌。
因此,作為一名創(chuàng)造性思維的研究人員,我立即注意到最新版本的 AI 生成的內容(包括 GPT-4)的一些有趣之處。
當提示需要創(chuàng)造性思維的任務時,GPT-4 輸出的新穎性和實用性讓我想起了我作為教師和企業(yè)家共事過的學生和同事提交的創(chuàng)造性想法類型。
這些想法不同且令人驚訝,但相關且有用。而且,在需要時,非常富有想象力。
考慮提供給 GPT-4 的以下提示:“假設所有孩子在一周中的一天都成為巨人。會怎么樣?GPT-4 產生的想法涉及文化、經濟、心理學、政治、人際交流、交通、娛樂等等——就產生的新聯(lián)系而言,許多令人驚訝和獨特。
這種新穎性和實用性的結合很難實現(xiàn),正如大多數科學家、藝術家、作家、音樂家、詩人、廚師、創(chuàng)始人、工程師和學者可以證明的那樣。
然而,人工智能似乎正在做這件事——而且做得很好。考驗人工智能
與創(chuàng)造力和創(chuàng)業(yè)精神的研究人員Christian Byrge和Christian Gilde一起,我決定通過讓AI參加托倫斯創(chuàng)造性思維測試(TTCT)來測試人工智能的創(chuàng)造力。
TTCT促使應試者參與現(xiàn)實生活中任務所需的各種創(chuàng)造力:提出問題,如何變得更足智多謀或更有效率,猜測因果關系或改進產品。它可能會要求應試者提出改進兒童玩具的方法,或者想象假設情況的后果,如上面的例子所示。
這些測試并非旨在衡量歷史創(chuàng)造力,這是一些研究人員用來描述莫扎特和愛因斯坦等人物的變革性才華。相反,它評估個人的一般創(chuàng)造能力,通常被稱為心理或個人創(chuàng)造力。
除了通過 GPT-4 運行 TTCT 八次外,我們還對 24 名本科生進行了測試。
所有結果均由Scholastic Testing Service的訓練有素的審查員進行評估,Scholastic Testing Service是一家為TTCT提供評分的私人測試公司。他們事先并不知道他們要評分的一些測試是由人工智能完成的。
由于學術測試服務是一家私人公司,因此它不與公眾分享其提示。這確保了 GPT-4 無法在互聯(lián)網上抓取過去的提示及其響應。此外,該公司擁有一個包含大學生和成年人完成的數千項測試的數據庫,提供了一個大型的額外對照組來比較人工智能分數。
我們的結果?
GPT-4 因其想法的原創(chuàng)性而在考生中排名前 1%。根據我們的研究,我們認為這標志著人工智能達到或超過人類原創(chuàng)思維能力的首批例子之一。
簡而言之,我們相信像 GPT-4 這樣的人工智能模型能夠產生人們認為出乎意料、新穎和獨特的想法。其他研究人員在人工智能和創(chuàng)造力的研究中也得出了類似的結論。
是的,創(chuàng)造力可以評估
人工智能的新興創(chuàng)造能力令人驚訝,原因有很多。
首先,研究界以外的許多人仍然認為創(chuàng)造力無法定義,更不用說得分了。然而,幾千年來,人類新奇和聰明才智的產品一直受到珍視和買賣。至少從 1950 年代開始,創(chuàng)造性工作就在心理學等領域得到定義和評分。
研究人員梅爾·羅德斯(Mel Rhodes)在1961年引入的創(chuàng)造力的人,產品,過程,新聞模型試圖對迄今為止理解和評估創(chuàng)造力的無數方式進行分類。從那時起,對創(chuàng)造力的理解只增不減。
還有一些人感到驚訝的是,“創(chuàng)造力”一詞可能適用于計算機等非人類實體。在這一點上,我們傾向于同意認知科學家瑪格麗特·博登(Margaret Boden)的觀點,他認為創(chuàng)造力一詞是否應該應用于人工智能是一個哲學問題,而不是科學問題。
AI的創(chuàng)始人預見了它的創(chuàng)造能力
值得注意的是,我們在研究中只研究了人工智能的輸出。我們沒有研究它的創(chuàng)作過程,這可能與人類的思維過程或產生想法的環(huán)境非常不同。如果我們把創(chuàng)造力定義為需要一個人,那么根據定義,我們將不得不得出結論,人工智能不可能是創(chuàng)造性的。
但是,無論關于創(chuàng)造力的定義和創(chuàng)作過程的爭論如何,最新版本的人工智能產生的產品都是新穎而有用的。我們相信這滿足了現(xiàn)在在心理學和科學領域占主導地位的創(chuàng)造力的定義。
此外,人工智能當前迭代的創(chuàng)造能力并非完全出乎意料。
在他們現(xiàn)在著名的1956年達特茅斯人工智能夏季研究項目中,人工智能的創(chuàng)始人強調了他們模擬“學習的各個方面或智力的任何其他特征”的愿望 - 包括創(chuàng)造力。
在同一提案中,計算機科學家納撒尼爾·羅切斯特(Nathaniel Rochester)透露了他的動機:“我怎樣才能制造出一臺在解決問題時表現(xiàn)出獨創(chuàng)性的機器?”
顯然,人工智能的創(chuàng)始人認為,創(chuàng)造力,包括想法的獨創(chuàng)性,是機器可以模仿的特定人類智能形式之一。
對我來說,GPT-4 和其他人工智能模型令人驚訝的創(chuàng)造力得分凸顯了一個更緊迫的問題:在美國學校中,迄今為止很少有專門針對人類創(chuàng)造力并培養(yǎng)其發(fā)展的官方計劃和課程。
從這個意義上說,人工智能現(xiàn)在實現(xiàn)的創(chuàng)造能力可能會為教育工作者和其他有興趣促進人類創(chuàng)造能力的人提供一個“人造衛(wèi)星時刻”,包括那些將創(chuàng)造力視為個人、社會和經濟增長基本條件的人。
原文標題:AI scores in the top percentile of creative thinking
本文標題: 人工智能最得分的點在于創(chuàng)造性思維
本文地址: http://www.cybfk.com/brand/news-233nld7711.html
內容均來源于網絡,錯誤糾正或刪除請發(fā)郵件,收件郵箱kefu@huangye88.com
2009-2024 黃頁88版權所有 京ICP備2023012932號-1 │ 京公網安備 11010802023561號 京ICP證100626
內容均來源于網絡,錯誤糾正或刪除請發(fā)郵件,收件郵箱kefu@huangye88.com