AI + Web3 公益课笔记#2|ChatGPT 的各种功能与玩法
2024.02.04
▇人物访谈(嘉宾:孟岩)
▍产业心路历程
通证标准ERC-3525 设计者。
💡外部资料补充⚡️
ERC-3525 是一个新的以太坊通证标准,由Solv Protocol 团队提出和设计⋯⋯定义了一个新的资产类别——半同质化代币(SFT),即Semi-Fungible Token,顾名思义,是介于FT和NFT 之间。
⠀
FT 和NFT 已经可以用来标记现实生活中的一切资产,虽然确实如此,但效率太低,因为有太多的资产「有差别,但差别不大」⋯⋯这是SFT 想要解决的问题。 [1]
2015 年,在IBM 商业战略改变的情境下,开始学习区块链上的知识。
2017 年,从IBM 离职,专精投入区块链领域。
教育步道培训<br class="smart">提出Token Economic(通证经济)的一些原则。
DeFi 赛道Solv Protocol
市场上缺少一种适合表达「票据」的资产,一开始定位为金融NFT,最终探索出来为半同质化代币(SFT)的升级版。
RWA
与三个国家的央行、国际组织(世界银行)建立合作关系,开发一些服务实体经济领域的应用。
💡外部资料补充⚡️
根据上下文脉络,有时Token 翻译成「通证」会比「代币」来的理想。⠀
通证是覆盖比较大的超集合,除了转帐,还多了质押(stake)、委托(delegate)、烧毁(burn)等用途。
⠀
代币是覆盖比较小的子集合,只有转帐的概念。
⠀
社群通证的金钱性固然比不上反映一般商品价值而且历史悠久的法定货币,但反过来也拥有诸多过往无法想像的优势,最明显的是精准地反映和承载社群所重视的价值,把抽象的价值化为具体的行动清单(actionable items) ,让体现核心价值不只流于遥不可及的愿景,产出阶段性成果,过程变得比较有趣[2]。
▍怎么样看待区块链产业周期?
「 Web3 支付/稳定币支付」能否站稳脚步,落地应用于实体经济,是区块链产业爆发的关键⋯⋯希望这一次迈入牛市后,能挣脱「进三步退两步」的四年兴衰周期,走一个比较长期的上升趋势。
「 Web3 支付/稳定币支付」的特性
跨越Web2 信任边界,并解决其高费用、低效用等问题。
不仅仅是只有「转帐」,还能带有「交易」性质——把我们早习以为常的收执联、发票、先买后付、分期支付、团购等应用场景都带进Web3 里。
终身不丢交易纪录,储存在区块链上面⋯⋯像这样的新型态应用,会像电子邮件般,逐渐渗入我们的生活。
在非洲,已经被积极地采用。
▍看好什么赛道?
看好ZK(零知识证明)技术与发展。 ZK 可以让很多原本只能在区块链上做的事情,被解放出来。
有望靠着ZK 解决隐私保护与监管的问题。
这是一个把「1000 万亿美元」级别的资金体量,搬运到链上的大工程。
▍给Web3 开发者/投资人的建议
个人短期主义(赌性)vs 长期构建,两者必须区分清楚。
人穷还得多读书,学习一些基础知识(例:经济学、英文),长期必能带来回报与价值。
敬畏「原则」,要相信你所做的每一件事情是有后果(代价)的。
▇ 主题大纲(讲师:陈财猫)
▇ 主题:ChatGPT 的各种功能与玩法
▍ ChatGPT 的内建功能
三种内建功能(Code Interpreter、Web Browsing、Dall-E)原本是分开的,后来合并了。
Code Interpreter 与我们的生活最息息相关。
OpenAI 联合创办人Greg Brockman TED 演说10:58示范了Code Interpreter 具备读取档案、自动撰写Python 程式的能力,因此可以让它帮你分析资料、制作报表、修改图片、制作幻灯片、清理资料集等。
Code Interpreter 运作原理像是一个「沙盒」,为其中搭载200 多个软件包的执行,提供了一个隔离环境,产出成果。
Web Browsing 上网功能对于缓解「 幻觉(hallucination) 」问题是有帮助的。
Dall-E 专门用于生成AI 图像,以填补ChatGPT 中只能输入及生成文字的限制,在第四堂课做更深入介绍。
▍ GPTs
GPTs 是被封装来为单一场景服务的Agent,稍后会进一步解说Agent 的概念。
对话式的GPTs 创建流程,不用写程式码。
GPTs 的三个元素:
Instructions
给GPTs 的指令/指南,指导模型「完成特定任务或遵循特定流程」的规则。Actions
GPTs 执行的动作或操作,能与外部API 的串接,例如标记其他GPTs 协同作用。Knowledge
GPTs 拥有或可造访的资料库。
▍ Agent(智能体)
Agent 翻译成「智能体」会比「代理人」来的理想。
💡外部资料补充⚡️
Agent一词源于拉丁语的「Agere」,意为「to do」。在大语言模型(LLM)的语境里,Agent 指的是具备自主理解、规划决策和执行复杂任务的智能体。 [3]
比喻:人在道路上开车,看到猫突然窜出,于是踩了煞车。
人→ 智能体
世界→ 环境(道路)
眼睛→ 传感器
脚→ 执行器(让人可以作用于这个世界)
Agent 的组成:
Planing(规划)
将大任务分解为更小、更易管理的子目标。
能从过去的行动自我批评和反思,对未来的步骤进行改良。Memory(记忆)
包括短期记忆和长期记忆,后者通常利用外部向量储存和快速检索来实现。Tools(工具)
智能体能使用的资源,以及学会调用外部API 的能力,为了获取模型权重中不足的额外资料。Action (行动)
▍ RAG(检索增强生成)
RAG(Retrieval-Augmented Generation)
💡外部资料补充⚡️
法官与法庭助理的比喻[4]。
⠀
当某个案件特别硬核,需要特殊专业知识时,法官会派遣法庭助理到法律图书馆,寻找可以引用的先例和特定案例。
⠀同理,大语言模型就像是一位法官,可以「判决」我们的各种呈堂文本。但为了提供引用来源的权威答案,该模型需要助手——RAG——进行若干研究。
大语言模型受到其预训练(Pre-trained)数据的限制,缺乏对最新事件的了解,透过RAG 从外部资料库来源「检索」最新文档,然后将它们作为上下文讯息,输入到一个「生成」模型里(例:Transforme r模型),以求更准确、丰富地响应我们的要求。
对于缓解「 有限的上下文窗口(Context Window) 」、「 幻觉(hallucination) 」问题皆有帮助。
▍Embedding 是什么?
将单词、句子或文档(压缩后)映射为一个固定大小的向量表示。
这些向量表示能够捕捉到词句的语义和语境,使得计算机可以处理自然语言数据。
比喻:Openbook 开卷考试要让GPT 偷看的一张又一张小纸条(因为book 的上下文不够用,所以打小抄,需要用到时把小抄抽出来,方便随时看)。
▇ 课后心得
这一讲我觉得挺有收获的部分,是对于几个单词(Token、Agent、RAG⋯⋯)有了更深一层的的理解⋯⋯我把RAG 的精神落实在这篇笔记里,事后素材整理、发现其中有某些环节想得还不是很通透时,我会向「外部」查找一些资料,引述(quote)至内容里,并放上注脚。
其它印象深刻的点,是区块链BUIDL 大佬孟岩给我们的三条建议,特别是第一条(短期主义vs 长期构建)可以说是最本质性的东西:在投资路上的长期建构是「 HODL」、在学习路上的长期建构是一砖一瓦「底层知识」、面临人生抉择的长期构建得基于「原则」。
那什么是「原则」呢?我想可以从Ray Dalio《Principles: Life and Work》里找到最棒的阐释,真正的原则必须以自然法则与真理站在同一边,是放诸四海皆准的美德,像公正、仁慈、正直、诚信、品质等能够以自然法则相结合的才是真正的原则。
▇ 参考资料
[2] 高重建《区块链社会学》第三章第三节
[4]什么是检索增强生成?
喜欢我的作品吗?别忘了给予支持与赞赏,让我知道在创作的路上有你陪伴,一起延续这份热忱!
- 来自作者
- 相关推荐