▲ 繼PGC、UGC 之後形成的、完全由人工智慧生成內容的創作形式,被稱為「人工智慧生成內容」(AIGC)。(圖:資料圖庫)
面對網路內容生產效率提升的迫切需求,人們突發奇想:是否能夠利用人工智慧去輔助內容生產呢?這種繼PGC、UGC 之後形成的、完全由人工智慧生成內容的創作形式,被稱為「人工智慧生成內容」(AIGC)。正如人們最初眺望Web3.0 時構想的「語義網」(Semantic Web) 一樣,未來的網路應該是更加智慧的網路,它不僅能夠讀懂各種語義資訊,還能從資訊識別角度解放人類的生產力。即便後來區塊鏈技術的蓬勃發展改變了Web3.0的指代,元宇宙也展現出網路浩瀚的未來,但內容的價值權利歸屬和虛擬空間的發展仍然需要更高效的內容生產方式,生成式AI 也就凝聚了人們對於未來的期待。
讓人工智慧這樣的非人機器學會創作絕非易事,科學家在過往做了諸多嘗試,並將這一研究領域稱為「生成式人工智能」(Generative AI),主要研究人工智慧如何被用於創建文本、音訊、圖像、影片等各種模態的資訊。為了便於理解,本書並不打算對「生成式人工智能」和「人工智能生成內容」的概念加以區分,在後續的內容中將全部以「生成式AI」作為指代。
最初的生成式AI通常由小模型展開,這類模型一般需要特殊的標註資料訓練,以解決特定的場景任務,通用性較差,很難被遷移,而且高度依賴人工調整參數。後來,這種形式的生成式AI 逐漸被基於大資料量、大參數量、強演算法的「基礎模型」取代,這種形式的生成式AI無須經過調整,或只需經過少量微調 (Fine-tuning) 就可以遷移到多種生成任務中。
2014 年誕生的GAN(Generative Adversarial Networks,生成對抗網路)是生成式AI 早期轉向基礎模型的重要嘗試,它利用生成器 (Generator) 和判別器 (Discriminator) 的相互對抗並結合其他技術模組,可以完成各種模態內容的生成。而到了2017 年,Transformer架構的提出,使得深度學習模型參數在後續的發展中得以突破1 億大關,這種基於超大參數規模的基礎模型,為生成式AI 領域帶來了前所未有的機遇。此後,各種類型的生成式AI 應用開始湧現,但尚未獲得社會大眾的廣泛關注。
2022 年下半年,兩個重要事件激發了人們對生成式AI的關注。2022 年8 月,美國科羅拉多州博覽會上,數位藝術類冠軍頒發給了由AI 自動生成並經由Photoshop 潤色的畫作《太空歌劇院》,消息一經發佈就引起了軒然大波。該畫作兼具古典神韻和太空的深邃奧妙,如此恢宏細膩的畫風很難讓人相信它是由AI 自動生成的作品,而它奪得冠軍的結果也大大衝擊了人們過往對於「人工智慧的創造力遠遜於人」的固有認知,自此徹底引爆了人們對於生成式AI 的興趣與討論。生成式AI 也自此從看似遙遠的概念逐步以生動有趣的方式走入人們的生活,帶來了過去令人難以想像的豐富體驗。
▲ GPT-4更進化!「生成式AI」產業鏈創業、投資商業地圖公開。(圖:高寶書版)
2022年11月30日,OpenAI發佈了名為ChatGPT的超級AI對話模型,再次引爆了人們對於生成式AI 的討論熱潮。ChatGPT 不僅可以清晰地理解使用者的問題,還能如同人類一般流暢地回答使用者的問題,並完成一些複雜任務,包括按照特定文風撰寫詩歌、假扮特定角色對話、修改錯誤程式碼等。此外,ChatGPT 還表現出一些人類特質,例如承認自己的失誤,按照設定的道德準則拒絕不懷好意的請求等。ChatGPT 一上線,就引發使用者爭相體驗,到處都是體驗與探討ChatGPT 的文章和影片。但也有不少人對此表示擔憂,擔心作家、畫家、程式設計師等職業在未來都將被人工智慧取代。
雖然存在這些擔憂,但人類的創造物終究會幫助人類自身的發展,生成式AI 無疑是一種生產力的變革,將世界送入智能創作時代。在智能創作時代,創作者生產力的提升主要表現為三個方面:
• 代替創作中的重複性工作,提升創作效率。
• 將創意與創作相分離,內容創作者可以從人工智慧的生成作品中找尋靈感與思考模式。
• 從海量預訓練資料和模型中引入的隨機性,有利於拓展創新的邊界,創作者可以產生前所未有的傑出創意。
即便如此,生成式AI 也並非完美無缺,「人工智慧生成的內容如何確定版權歸屬」、「生成式AI 是否會被不法分子利用,生成具有風險性的內容或用於違法犯罪活動」等一系列問題都是現在人們爭論的焦點。目前,學界與業界在嘗試從各個方面解決這些問題。但不管怎樣,生成式AI的迅猛發展已成不可逆轉之勢,智能創作時代的序幕正在緩緩拉開。
本文摘錄於高寶書版《AI生成時代:從ChatGPT到繪圖、音樂、影片,利用智能創作自我加值、簡化工作,成為未來關鍵人才》
【更多資訊請上《高寶書版》粉絲團;未經授權,請勿轉載】