AI 手机随想 | 人工智能与智能是否在一个维度?
导语
2 月的最后一天,魅族在珠海长琴岛上举办了一场魅族特别活动,在这次特别活动上,魅族邀请了之前负责营销的李楠和负责魅族手机系统 Flyme 的杨颜两位老魅友,发布了其宣称 All in AI 后的最后一款传统智能手机,也可以说是 All in AI 后的第一款 AI 手机。
我通过魅族社区魅友报名前往了此次活动现场,我在申请理由里面写到,尽管自己已经在 2022 年从魅族转到了 iPhone,但出于此前多年对魅族的情感,以及魅族备受称赞的产品设计和用户体验,让我一直没有停止对魅族的关注;而尤其是在魅族发出 All in AI 的消息之后,我渴望亲身体验并分享这种创新。
除了魅族 All in AI 的消息,最近这些天,还有像苹果公司放弃了造车计划,OPPO 也在除夕夜前宣布正式进入 AI 手机时代,好像都有意无意地在传达着智能手机要转型到 AI 手机了。在这篇文章,我想从魅族这次特别活动作为入口,来分享一些我对最近这些年智能手机发展历程的看法,以及讨论关于未来 AI 手机可能的新形态。
越来越统一的智能手机
我在高二那年第一次接触到魅族,魅蓝2,在那个智能手机鱼龙混杂的年代,各种各样的智能手机,有品牌的,没有品牌的,华强北的山寨机强势存在,整个市场的智能手机水平差距非常大。魅蓝2 的系统让我第一次就爱上了;设计,界面,交互,性能,都让我觉得和当时其他的很多杂牌子手机不一样。后面数年,我便一直在使用魅族的手机产品,直到 2022 年,因为 Google 安装服务这方面的问题,让我在使用一些 App 时困难重重,而当时各大手机厂商的产品已经是趋同化了,很难再去说出不同的手机有什么区别,做选择的时候,仿佛更多地还是一些情怀,我便直接从安卓阵营换到了 iOS。
系统层面
就拿现在的魅族来说,曾经魅族最引以为傲的特点之一 Flyme,在最近这些年,已经越来越难说出 Flyme 与其他厂商手机系统的区别了。如下面这张表格所示,Flyme 最早推出的手机小窗模式、全局夜间模式、游戏助手、状态栏歌词、OneMind 智能思维引擎、轻触返回,按下回到主屏幕,长按打开语音助手的 mBack;Smartisan OS 推出的闪念胶囊、大爆炸、和一步;iOS 广受好评的流畅动画、安全的系统、3D Touch、无障碍的支持、全家桶生态;iOS 和 Flyme 印象深刻的手机查找;安卓的截屏和 Nearby Share,iOS 的 Airdrop 等等诸多不同系统的功能,现如今,在各大手机厂商的系统上都逐渐具备并完善。而系统的发展,从已知的更新情况来看,此刻除了 AI 这一特点,各大厂商似乎找不到新的方向,毕竟如果还想要和 iOS 一样彻底去掉广告,对企业的营收又会是一大问题。
如上表所示,我根据各大系统厂商主页、宣传视频、部分系统提供的使用手册、以及我自己使用手机的体验,仅选择了部分类目进行简单的较,不同系统实现的方式也不尽相同。此外,这些操作系统依然有各自的特点,例如,OriginOS 4 中行业首发的「全链路停车助手」、ColorOS 14 的下一代空间音频技术「全息音频」、HarmonyOS 的「隔空手势」等等。
手机硬件层面
除了 Android 和 iOS,以及 Android 定制系统之间的对比,各个手机品牌虽然秉持着不同的价值理念,但在硬件上,手机的用料也越来越相似。曾经,光是一个芯片的问题,用户很轻易就能比较出不同产品的优缺点。比如,MTK 没有被认可的旗舰级芯片,三星猎户座没有全网通,而现在,联发科的天玑广受好评,三星猎户座也能支持全网通。
还有像是耳熟能详的「充电五分钟,通话两小时」、「照亮你的美」等等重点介绍功能,主打电池,拍照的手机标语;而现在的标语变成了「蔡司影像 心临其境」、「大师影像 更有分量」、「忘情一刻, 真徕卡」统一的影像和统一的 AI。以前标语宣传主打的时候,可以宣传芯片满血,屏幕刷新率和尺寸等,续航能力,手机材料等等,现在这些都被统一化了,留下来的卖点就只有还能再在算法上努把力的影像和还不太明白的 AI。
如下图所示,我简单的整理了各大手机厂商的旗舰机型的配置情况,无论是在这些看得见地方,手机厂商努力地堆砌最好的参数「卷」到最高的比分,还是在一些看不见的地方,从前 iPhone 的主板整洁备受好评,现在,后盖下的工艺也来到了统一的高水准。
趋同化可能也并不见得是一件不好的事情,但总觉得哪里不对,给我的感觉是,厂商可以偷懒不用去想用户到底想要一台什么样的旗舰手机,而是直接有一个「最好」的标准在那里,厂商只需要努力去够那个标准就可以。我想也正是因为这样一个统一的标准出现,才让很多以前的小众手机品牌开始生存不下去。大概这就是市场,它需要一个标准来让整个市场变得更好,让用户买到更值得信赖的产品。
只是,手机不应该是简单地比较这些冷冰冰的参数,图中所列比较项目也并不全面。不同的用户有不同的「手」,所以自然地,同样的手机在不同用户手上,手机的全数功能带来的体验也会有所不同。这个「好」的标准,应该更全面一点。
AI 手机?
AI 手机也面临这样的市场,虽然到了今天,智能手机的发展到了如此饱和的状态,摄影,屏幕,电池,处理器等等各个方面都使出了浑身解数,但是依旧没有明确的、全面的、或者能被大家接受的,到底什么样的手机才可以称作 AI 手机的标准。
其实看手机早些年的发展,很像是要把用户在电脑上完成的工作统统转移到手机上,以前我们只能在电脑上处理文档、浏览网页等等工作。现在,在我们手机和电脑的日常使用上,一台手机能做的几乎可以达到电脑功能的 90%。就连影像,手机都致力于帮助用户省下使用电脑麻烦修图的时间,通过更好的 CMOS 捕获更多的信息来帮助手机更好的 P 图,现在随手一拍,就是一张精修后的摄影作品。所以在手机的功能和电脑的功能逐渐一致后,手机的发展似乎又在追求着和电脑同样的大屏体验和真实感,于是,线性马达让用户点击手机键盘时有了各种各样的触感,折叠屏的出现让手机一边可以在大部分使用情况下维持住握在手中的形态,一边又能在需要大屏体验的时候展开。
如果说手机一直是在往电脑的发展靠齐,但我们好像还没有听到 AI 电脑的出现,微软也只是把 Cortana 砍掉,再以 Copilot 的形式重新出现。电脑的发展在性能上还有很多努力的空间,而手机,正如前文提到的,在硬件和系统上的 PK 则逐渐呈现疲态,不仅因为各家厂商都采用同一款旗舰芯片,是否还因为手机处理的任务有限,慢慢地对性能的追求将更不强烈。所以,手机这次也有了机会,要走在电脑前面,在 AI 电脑出现之前推出 AI 手机吗?
魅族提出的 AI 手机形态
魅族在特别活动上提到的 All in AI 计划,其中即将上线的 AI 功能,有 AI 图库、全新 Aciy(魅族手机语音助手)、AI 灵动键、AI 输入辅助;以及一些未来体验,包括 AI 随身秘书、任务机器人、AI 记忆管家、AI 小程序和 Open API 计划。
魅族具体的概念是希望用户只用表达自己的诉求,手机就可以帮助用户执行之后的全部操作;而它做出的主要改变是,有一个便捷的 AI 入口,用户在任何时间,任何场景,轻松唤起;同时,从系统到应用,帐号到数据,设备状态和感知能力等各个维度,这些数据信息开放给大语言模型。
首先将用户隐私数据放到一边不谈,魅族的愿景是,它在系统层面,把自己作为系统服务商拥有的权限,将读取到用户在使用该系统,即 Flyme 中产生的数据,提供给第三方大语言模型,让第三方大语言模型可以更好地读懂来自用户的指令,而魅族则不需要像目前国内的大厂一样,自己设计一个大语言模型,像百度做了自己的文心一言,阿里有通义千文,腾讯的混元等等。魅族只需要做好自己作为系统提供商,考虑如何把数据开放给第三方大语言模型。
杨颜在发布会上举的例子,例如,用户向模型发出指令,查看我少数派上关注的 XX 作者更新情况,包括其他平台的,也帮我关注这些帐号。然后模型根据用户的指令和来自系统提供的用户手机使用情况数据,转化成系统能够识别的指令自动去操作。所以,发出这样的指令后,模型会给出该作者在少数派的更新,以及用户手机上安装的其他 App,例如抖音,哔哩哔哩,假如该作者都在这些平台有帐号,系统将自动帮用户进行关注,也总结出该作者在这些平台上的更新情况。
总而言之,魅族畅想的 AI 就是能够帮助用户自动的在各个 App 之间跳跃,用户只需要发出指令。所以,魅族也才会提出将来可能不再会有 App 这一形态,就像现在,我们出去玩,可能会使用以下这些 App,1、小红书搜索目的地,2、各个 App 比价,3、智行买飞机票,4、去哪儿订酒店,5、微信组群,6、滴滴约车,7、日程 App 创建日程,8、大众点评找餐厅…… 而将来,则是由大语言模型自动地来完成这一切,而作为用户的我们只需要想。
如图所示,用户不再需要执行,只需要表达意图。但我自己可能认为,在传统的架构中,用户的业务流程和一部分的执行,应该也是在表达用户意图这一环节。
但是,不谈隐私数据是不现实,对用户来说,可能只用在开机的时候点一个同意,就无意中把自己使用手机的数据全部交给了第三方大语言模型,这样的风险是不是太大,要如何处理隐私的保护和加密,也是在实现这一计划非常重要的一部分。
和大模型对话 = AI?
另一方面,发指令给大模型让它来帮助用户执行这些操作真的有提高效率并且在用户体验上是友好的吗?对话,无论是语音还是文字,它都可以被认为是在进行聊天。例如目前的一些对话能力比较成熟的机器人,我可以唤醒它,然后使用普通话发出我的指令,「我要知道明天天气如何」,这和我打开手机点击天气 App 查看天气,并不见得前一种以语音的方式要更高效。
而且,语音还面临着很多使用少数方言的人群,聊天机器人读不懂用户指令的情况。现在的手机厂商,基本都都是把大语言模型的能力放进自己的语音助手中,但我一直觉得语音助手是无障碍的一部分,它可以更好的帮助视障人群使用手机,而对于大多数用户,并不是作为一个主要的交互方式。
目前,我们和机器的沟通,采用的是与屏幕的交互,机器把自己的能力可视化地展现在手机屏幕上,用户自己动手去点击不同的按钮,点击确定,返回,点击不同的 APP 这一交互方式,而 AI 手机则是尝试把用户的这些点击,用键盘打字等行为,全部通过用户的语音或文字来描述以获得与机器的交互。
那如果不使用对话,不是就用不上像 ChatGPT,Gemini,文心一言这些产品了吗?所以其实还是交互方式出现了问题,并不应该是让用户去描述自己想要做什么,因为发出一个合适的指令同样需要一定的学习成本,不然 GitHub 上的 ChatGPT 调教指南不会获得那么多的 star。如同我们人与人之间进行的沟通,讲清楚一件事情,往往需要很多的辅助,可能是准备一个幻灯片,一个视频,丰富的例子。沟通成本的降低可能依赖于亲密关系,我们常说的「你一个眼神,我就知道」,这是高度的信任和彼此的了解带来的加成。那机器呢,魅族提出 Open API,让大语言模型读到更多用户的信息数据,然后努力成为一个更懂你的人吧。
除了当前大语言模型的对话,其实 AI 早就已经深入到我们的手机使用上了,用以解锁的 FaceID 就是用基于深度学习的人脸识别技术,部分手机厂商采用的虹软算法以优化计算摄影的图片渲染,还有三星在 Galaxy S24 系列上的 AI 变焦,也有媒体曾表示 S24+ 是一个合格的 AI 手机先行者,还有运用机器学习的智能思维引擎在后台合理调度资源分配等等。AIGC 的出现,似乎是一支强力的助推剂,加速着所谓 AI 手机的诞生。
结语
发布会结束的时候,长琴岛的海岸边上,海风呼啸,烟花开始燃放,心中感慨非常多,像是在庆祝,又像是在告别。而正如文章封面图描绘的立在海浪中的魅族 Logo,它就站在烟花的一旁,好像同整个手机行业一样,正经历着「乘风破浪」,也共同迎接着这份庆祝和告别。
智能机这个概念应该是从 2007 年第一代 iPhone 面世,把从前的功能机时代逐步转向了智能机,在国内,魅族 2009 年发布了其第一款智能手机,魅族 M8,也是国内最早使用电容触控屏的智能手机。今天,魅族希望再次拿到了这个定义上的第一,发布了自己的第一款 AI 手机。很显然,魅族面对的不再是 2009 年那个市场,魅族自己的状态或许也和那个时代有了巨大的改变。
我们曾把智能手机翻译叫 smartphone,而现在的 AI 手机,中文叫人工智能手机,比之前的智能多了人工二字,翻译为 Artificial Intelligence,它会更加 smart 吗?曾经乔布斯在初代 iPhone 发布会上画的坐标,横轴为易用性,纵轴为智能化程度,来阐述一个真正的智能手机应该是什么样,不应该是 Phone + Email + Internet + QWERT Keyboard 的组合,应该要比当前的所有移动设备更智能,同时要超级容易使用,而这就是 iPhone,智能化程度足够高,易用性也足够高;那就是 iPhone。2024 年初 Vision Pro 的上手体验似乎在易用性这个维度上,为交互带来了崭新的发展,但智能化发展还不够。今天,AI 手机的维度,是否要从使用平面坐标到使用立体坐标来定义,它是不是将成为一个新的转折点,还是只是用来占据一个概念上的红利。
手机的全称是叫手持电话、还是智能手机、又或者是手持的机器,因为叫手持的机器,才会想着又要把电话、相机、游戏机、MP3、Kindle…… 塞进手机吧,手持的数码机器还有 Rabbit、AI Pin、以及其他还没出现的手持产品没加到手机里,那么是不是……无论如何,我对未来手机的发展充满期待。