揭秘生成式AI:從「訓練」到「推論」,一窺其神奇運作原理
生成式人工智慧(generative AI)的神通廣大,相信大家應該看過許多由AI來產生的圖像或文字,在此就不多花時間陳述。本篇文章的目的,是帶您探索生成式AI背後的原理,讓您了解AI「訓練」(training)與「推論」(inference)階段在做些什麼,這將有助於您挑選合乎需求的運算平台,讓您能輕鬆為您的組織導入生成式AI。
首先,我們從ChatGPT談起。「GPT」的「T」代表轉換器(transformer),是自然語言處理(NLP)技術中,「大型語言模型」(LLM)慣用的模型架構。LLM是當下開發AI的主流科技,結合深度學習和人工神經網路(ANN),讓人工智慧能「拜讀」大量未標籤化的資料(字數可能高達數兆),藉此「訓練」AI閱讀和與人交談。您可以想像成,人工智慧模型已看完了整個維基百科,因此AI學會拼字與造句,並且能在「推論」階段和您閒聊任何話題。
看懂了ChatGPT,就不難理解Stable Diffusion、Midjourney等「文字轉圖像」AI技術。這些人工智慧結合了語言與圖像生成模型,除了文字語料庫之外,還利用大量圖庫資料做訓練,因此AI能將影像轉換成文字(也就是描述圖片中看見的事物),或是將文字轉換成影像(也就是依照用戶的指令畫圖)。人工智慧甚至懂得使用濾鏡,出神入化的「畫技」已經有奪下美術展冠軍的案例。
下一章,我們將深入分析人工智慧如何進行「訓練」與「推論」,並推薦給您最合適的技嘉科技解決方案,讓您也能掌握生成式AI,利用它來創造更多價值。