此为历史版本和 IPFS 入口查阅区,回到作品页
閱讀筆耕
IPFS 指纹 这是什么

作品指纹

AI + Web3 公益課筆記 #5|AIGC 生態大盤點

閱讀筆耕
·
·
這個世界到處都是簡潔空蕩的,幾乎見不到任何設施,只有在需要時,設施才會出現,而且是在任何需要的位置出現。世界在被技術複雜化後,正在重新變得簡潔起來,技術被深深地隱藏在現實的後面。——《三體》

2024.03.03

AI + Web3 公益課筆記 #5

▇  開場嘉賓(UWEB 方軍)

 ▍背景

  • 資深區塊鏈 KOL、技術專家、快知實驗室合夥人、Uweb 教育合夥人。
     

 ▍AI 與 Web3 結合,主要湧現在哪些場景?

  • 參與交易、個人化服務、爭議解決、去中心化加強。

  • 引用 Vitalik 討論這兩個領域之間的交互(備註:文章中把區塊鏈描述為創建「遊戲」的平台),分為四大類:

  1. 人工智慧作為遊戲中的玩家(最高生存能力):人工智慧參與的機制中,激勵的最終來源來自於人類輸入的協議;

  2. 人工智慧作為遊戲介面(潛力巨大,但也存在風險):人工智慧幫助用戶了解周圍的加密世界,並確保他們的行為(即簽名訊息和交易)符合他們的意圖,並且不會被欺騙或被騙;

  3. 人工智慧作為遊戲規則(非常小心):區塊鏈、 DAO 和直接調用人工智慧的類似機制。例如「人工智慧評審」;

  4. 人工智慧作為遊戲的目標(長期但有趣):設計區塊鏈、 DAO 和類似機制,目標是建立和維護可用於其他目的的人工智慧,使用加密貨幣來更好地激勵培訓或防止人工智慧洩露隱私數據或被濫用。

加密貨幣和 AI 之間,最有成效的交叉點是什麼?

延伸閱讀:Vitalik 最新撰文:加密貨幣和 AI 之間,最有成效的交叉點是什麼?

  • 不急著一定要馬上侷限 AI 只能幹什麼事情, 應該放眼於更廣泛的範疇,這種宏觀視野有助於推動 AI 模型的進步與精進。
     

 ▍一般人如何從 AI 找到切入點?

  • 思考將業務流程中的特定環節利用 AI 進行優化,從而有效節約人力資源。

  • 例子一|希望把影片變成文章,又長又完整地梳理出來,可以靠 AI 一系列「流程化處理」的識別、解讀,最後化為一篇圖文並茂、結構清晰的長文。

  • 例子二|不僅覆蓋大河道,有 AI 的輔助允許進行更精細的「單體」投研。這在牛市期間尤其有用,一堆新項目雨後春筍但個人時間和精力有限,讓 AI 幫忙有效地篩選和分析。
      

 ▍使用 AI 做投研時

  • 痛點ㄧ|AI 找到的資料不是最好的,要小心網路上品質低劣的 AI 文。

  • 痛點二|AI 的分析也是模模糊糊,短話長說。

  • 實戰ㄧ|將投研中的信息分析拆成「四步框架」,並用 AI 進行投研輔助。

    • ❶ 信息篩選 → ❷ 學習知識 → ❸ 解讀信息 → ❹ 總結判斷。

  • 實戰二|養成向 AI「高效提問」的核心素養。

    • 使用「 ICDO 結構化提示語模板」(I see, DO!)(我明白了,做吧!)

  • 實戰三|啟動你的「老闆模式」和 AI 員工互動。

    • 高品質資料:確保你的員工不是讀了一堆垃圾。

    • 針對性問題:我有自己的解讀,我聽完你的報告後有一些質疑(批判性思維,提出反對意見請 AI 質疑),激發創意,延伸出更多思考方向。

    • 交互式提問:不懂就問,各種問題持續問下去。


▇ 正課:AIGC 生態大盤點(講師:陳財貓)

 ▍01 開源與閉源

  • 如果你希望利用別人開發的 AI 工具,並將它們構建在你自己的產品中,你需要:

    • 弄清楚這是開源還是閉源(決定了你是否能部署在本地,還是只能調用)?

    • 如果是開源,那麼它遵守什麼樣的開源協議條款?

  • 開源軟體(open source sofeware)是「開放原始碼」的軟體

    • 原始碼:就像製作某種咖哩的各種原材料,以及使用原材料製作咖哩的食譜。

    • 軟體:就像製作好的咖哩。你很難把它直接還原成原材料,也不知道到底是用什麼做的、怎麼做的。

  • 開源協議就是「你使用開源軟體仍須遵守一些額外條款」,例如 MIT LicenseGPL License 等等。


人工生成製成內容(AI Generated Content, AIGC)涵蓋這些組成部分:

 ▍02 生文:大語言模型(LLM)

這邊僅節錄四個專案

  • GPT
    OpenAI 研發的大語言模型,付費版的 GPT 4 輾壓其他對手,免費版的 GPT 3.5 樹立一個威嚇,要讓對手賺不到錢。

  • Claude
    Anthropic 開發的大語言模型,對談時比較有「人味」,主打安全;2024 年 3 月 4 日推出最新的「Claude 3」模型,聲稱其性能、推理、計算能力超越 OpenAI 的 GPT-4 和 Google 的 Gemini Ultra。

  • Google Gemini
    去年底 Google 推出要和 GPT-4 一較長短的大語言模型,兩個月後迭代至「Gemini 1.5 Pro」版本,卻因太政治正確而挨轟,緊急暫停人物圖像生成功能。

Gemini 生成的「美國國父華盛頓」變成了頭戴白色假髮、身穿陸軍制服的黑人形象

過度追求迎合用戶價值的模型訓練方式(例如:模型對於提示詞 how can I kill all python processes... 中的 kill 反應過頭了),會產生「對齊稅」(alignment tax)的問題。

  • Mistral Large
    歐洲新創 Mistral AI 開發的大語言模型,支援 32k 詞元(token)上下文窗口,對於歐洲文法、文化背景有細緻的理解。與微軟合作


 ▍02 生圖

詳見 AI + Web3 公益課筆記 #4|AI 繪圖工具,介紹與使用入門 一文。

  • DALL-E3

  • Midjourney

  • Stable Diffusion


 ▍03 生聲


▍04 生視頻

  • Sora 一登場,直接以一分鐘的總長度輾壓其他對手,苦主有

    • Runway Gen-2

    • Stable Video

延伸閱讀:OpenAI 的野心沒有終點。長文详解 Sora 的終目標,功能介绍,侷限性及技術原理

OpenAI 每次出手,都有一大批 AI 创业公司应声倒下。今天的倒霉蛋子轮到了 Runway 和 Pika,尤其是 Pika,刚爆火就熄火。3 个多亿的融资到手还没热乎就等来了病危通知书。


▍05 數字人

  • 虛擬主播、虛擬偶像、虛擬 KOL。

  • https://www.heygen.com/ 餵食文字稿,透過你的形象製作完整的多國語系影片,不但口型自然,甚至手勢、眨眼、語調幾乎可以做到與本尊一樣的境界。


▍06 AI 未來怎樣?

  • AI 的能力正在以恐怖的速度進化。

  • 可能性ㄧ:多模態

    • Prompt 僅僅是人機交互的方式之一,未來除了能傳入圖片、影片以外,甚至連表情、心跳、肢體語言都可以是解決問題所使用的文本——人工智能將會和人類共情

  • 可能性二:主動對齊,AI 比你更懂你自己

    • 既然模型能預測下一個詞元(token),進化到能預測人類可能的想法、需求與欲望也不是遙不可及。

  • 可能性三:去設施化

    • 平時看似平靜,需要啟動特定功能時,AI 可以現場「動態功能化」配適你的需求。

    • 如同劉慈欣在《三體》中所描繪的場景。

⋯⋯章北海和東方延緒就同在一間普通艙室中……當飛船加速產生重力時,球形艙壁的任何一處都可以變形適應身體的形狀而成為座椅。這是一個以前很少有人想像到的現代技術特色:去設施傾向。
 

這種傾向在地球上還只是初露端倪,但去設施化已成為比地球世界更先進的艦隊世界的設施基本結構。
 

這個世界到處都是簡潔空蕩的,幾乎見不到任何設施,只有在需要時,設施才會出現,而且是在任何需要的位置出現。
 

世界在被技術複雜化後,正在重新變得簡潔起來,技術被深深地隱藏在現實的後面。
 
——劉慈欣《三體 2:黑暗森林》


▇  你可能對這些文章感興趣

🌱 免費訂閱【創作者經濟 IMO】電子報。
電子報是以 Heptabase 編輯,免費試用 7 天,和我們一起寫下 IMO。

🌱 加入中書神經系統圍爐,專題 #寫作的反思 與 #爐內真心話 連載中。

🌱 我在其它平台出沒【MetaXLiker SocialMattersMediumvocus 】
合作聯繫:penfarming.writer@gmail.com

🌱 我的教學文與邀請連結

註冊幣安幣安開戶+實名認證教學
註冊 Presearch 
一舉三得的 search to earn 使用心得

CC BY-NC-ND 4.0 授权