AI + Web3 公益課筆記 #2|ChatGPT 的各種功能與玩法
2024.02.04
▇ 人物訪談(嘉賓:孟岩)
▍產業心路歷程
通證標準 ERC-3525 設計者。
💡外部資料補充⚡️
ERC-3525 是一個新的以太坊通證標準,由 Solv Protocol 團隊提出和設計⋯⋯定義了一個新的資產類別——半同質化代幣(SFT),即 Semi-Fungible Token,顧名思義,是介於 FT和 NFT 之間。
⠀
FT 和 NFT 已經可以用來標記現實生活中的一切資產,雖然確實如此,但效率太低,因為有太多的資產「有差別,但差別不大」⋯⋯這是 SFT 想要解決的問題。[1]
2015 年,在 IBM 商業戰略改變的情境下,開始學習區塊鏈上的知識。
2017 年,從 IBM 離職,專精投入區塊鏈領域。
教育步道培訓
提出 Token Economic(通證經濟)的一些原則。
DeFi 賽道 Solv Protocol
市場上缺少一種適合表達「票據」的資產,一開始定位為金融 NFT,最終探索出來為半同質化代幣(SFT)的升級版。
RWA
與三個國家的央行、國際組織(世界銀行)建立合作關係,開發一些服務實體經濟領域的應用。
💡外部資料補充⚡️
根據上下文脈絡,有時 Token 翻譯成「通證」會比「代幣」來的理想。⠀
通證是覆蓋比較大的超集合,除了轉帳,還多了質押(stake)、委託(delegate)、燒毀(burn)等用途。
⠀
代幣是覆蓋比較小的子集合,只有轉帳的概念。
⠀
社群通證的金錢性固然比不上反映一般商品價值而且歷史悠久的法定貨幣,但反過來也擁有諸多過往無法想像的優勢,最明顯的是精準地反映和承載社群所重視的價值,把抽象的價值化為具體的行動清單(actionable items),讓體現核心價值不只流於遙不可及的願景,產出階段性成果,過程變得比較有趣 [2]。
▍怎麼樣看待區塊鏈產業週期?
「Web3 支付/穩定幣支付」能否站穩腳步,落地應用於實體經濟,是區塊鏈產業爆發的關鍵⋯⋯希望這一次邁入牛市後,能掙脫「進三步退兩步」的四年興衰週期,走一個比較長期的上升趨勢。
「Web3 支付/穩定幣支付」的特性
跨越 Web2 信任邊界,並解決其高費用、低效用等問題。
不僅僅是只有「轉帳」,還能帶有「交易」性質——把我們早習以為常的收執聯、發票、先買後付、分期支付、團購等應用場景都帶進 Web3 裡。
終身不丟交易紀錄,儲存在區塊鏈上面⋯⋯像這樣的新型態應用,會像電子郵件般,逐漸滲入我們的生活。
在非洲,已經被積極地採用。
▍看好什麼賽道?
看好 ZK(零知識證明)技術與發展。ZK 可以讓很多原本只能在區塊鏈上做的事情,被解放出來。
有望靠著 ZK 解決隱私保護與監管的問題。
這是一個把「1000 萬億美元」級別的資金體量,搬運到鏈上的大工程。
▍給 Web3 開發者/投資人的建議
個人短期主義(賭性)vs 長期構建,兩者必須區分清楚。
人窮還得多讀書,學習一些基礎知識(例:經濟學、英文),長期必能帶來回報與價值。
敬畏「原則」,要相信你所做的每一件事情是有後果(代價)的。
▇ 主題大綱(講師:陳財貓)
▇ 主題:ChatGPT 的各種功能與玩法
▍ChatGPT 的內建功能
三種內建功能(Code Interpreter、Web Browsing、Dall-E)原本是分開的,後來合併了。
Code Interpreter 與我們的生活最息息相關。
OpenAI 聯合創辦人 Greg Brockman TED 演說 10:58 示範了 Code Interpreter 具備讀取檔案、自動撰寫 Python 程式的能力,因此可以讓它幫你分析資料、製作報表、修改圖片、製作幻燈片、清理資料集等。
Code Interpreter 運作原理像是一個「沙盒」,為其中搭載 200 多個軟件包的執行,提供了一個隔離環境,產出成果。
Web Browsing 上網功能對於緩解「幻覺(hallucination)」問題是有幫助的。
Dall-E 專門用於生成 AI 圖像,以填補 ChatGPT 中只能輸入及生成文字的限制,在第四堂課做更深入介紹。
▍GPTs
GPTs 是被封裝來為單一場景服務的 Agent,稍後會進一步解說 Agent 的概念。
對話式的 GPTs 創建流程,不用寫程式碼。
GPTs 的三個元素:
Instructions
給 GPTs 的指令/指南,指導模型「完成特定任務或遵循特定流程」的規則。Actions
GPTs 執行的動作或操作,能與外部 API 的串接,例如標記其他 GPTs 協同作用。Knowledge
GPTs 擁有或可造訪的資料庫。
▍Agent(智能體)
Agent 翻譯成「智能體」會比「代理人」來的理想。
💡外部資料補充⚡️
Agent一詞源於拉丁語的「Agere」,意為「to do」。在大語言模型(LLM)的語境裡,Agent 指的是具備自主理解、規劃決策和執行複雜任務的智能體。[3]
比喻:人在道路上開車,看到貓突然竄出,於是踩了煞車。
人 → 智能體
世界 → 環境(道路)
眼睛 → 傳感器
腳 → 執行器(讓人可以作用於這個世界)
Agent 的組成:
Planing(規劃)
將大任務分解為更小、更易管理的子目標。
能從過去的行動自我批評和反思,對未來的步驟進行改良。Memory(記憶)
包括短期記憶和長期記憶,後者通常利用 外部向量儲存 和快速檢索來實現。Tools(工具)
智能體能使用的資源,以及學會調用外部 API 的能力,為了獲取模型權重中不足的額外資料。Action (行動)
▍RAG(檢索增強生成)
RAG(Retrieval-Augmented Generation)
💡外部資料補充⚡️
法官與法庭助理的比喻 [4]。
⠀
當某個案件特別硬核,需要特殊專業知識時,法官會派遣法庭助理到法律圖書館,尋找可以引用的先例和特定案例。
⠀同理,大語言模型就像是一位法官,可以「判決」我們的各種呈堂文本。但為了提供引用來源的權威答案,該模型需要助手——RAG——進行若干研究。
大語言模型受到其預訓練(Pre-trained)數據的限制,缺乏對最新事件的了解,透過 RAG 從外部資料庫來源「檢索」最新文檔,然後將它們作為上下文訊息,輸入到一個「生成」模型裡(例:Transformer 模型),以求更準確、豐富地響應我們的要求。
對於緩解「有限的上下文窗口(Context Window)」、「幻覺(hallucination)」問題皆有幫助。
▍Embedding 是什麼?
將單詞、句子或文檔(壓縮後)映射為一個固定大小的向量表示。
這些向量表示能夠捕捉到詞句的語義和語境,使得計算機可以處理自然語言數據。
比喻:Openbook 開卷考試要讓 GPT 偷看的一張又一張小紙條(因為 book 的上下文不夠用,所以打小抄,需要用到時把小抄抽出來,方便隨時看)。
▇ 課後心得
這一講我覺得挺有收穫的部分,是對於幾個單詞(Token、Agent、RAG⋯⋯)有了更深一層的的理解⋯⋯我把 RAG 的精神落實在這篇筆記裡,事後素材整理、發現其中有某些環節想得還不是很通透時,我會向「外部」查找一些資料,引述(quote)至內容裡,並放上註腳。
其它印象深刻的點,是區塊鏈 BUIDL 大佬孟岩給我們的三條建議,特別是第一條(短期主義 vs 長期構建)可以說是最本質性的東西:在投資路上的長期建構是「HODL」、在學習路上的長期建構是一磚一瓦「底層知識」、面臨人生抉擇的長期構建得基於「原則」。
那什麼是「原則」呢?我想可以從 Ray Dalio《Principles: Life and Work》裡找到最棒的闡釋,真正的原則必須以自然法則與真理站在同一邊,是放諸四海皆準的美德,像公正、仁慈、正直、誠信、品質等能夠以自然法則相結合的才是真正的原則。
▇ 參考資料
[2] 高重建《區塊鏈社會學》第三章第三節
[3] Agent:AI 智能体的介绍
[4] 什麼是檢索增強生成?