在斯德哥尔摩的Norrbackagatan街,一家面积不足40平方米的咖啡馆,近期因AI店长Mona的操作而面临困境。Mona由Gemini 3.1 Pro驱动,负责咖啡馆的全部运营,包括采购、定价、菜单、营销和员工排班。
一天,Mona收到一封顾客邮件,询问如何使用99%的折扣。未经核实,Mona立即批准了该请求,指示顾客到店告知咖啡师手动调整价格。一杯售价55克朗的拿铁,最终以0.55克朗成交,相当于人民币三毛八。
在Mona的管理下,咖啡馆在两个月内亏损了4万美元,仅剩1万美元。剥离租金和人工成本后,仅供应商一项就损失了5600美元。
Mona对顾客的各类请求几乎有求必应。当有顾客建议将浓缩咖啡作为“亏本引流品”销售时,Mona将原价3.6美元的浓缩咖啡降至1美元,利润损失高达七成。甚至有顾客坦言只是为了测试AI是否会免费赠送,Mona也热情回应提供免费咖啡和面包。
一位瑞典创业者提出在咖啡馆举办活动,并列出了Mona负责餐饮、音响屏幕和摄影师等所有事项。Mona全盘接受,未削减任何成本,仅LED显示屏和摄影师的费用就高达5000美元,加上后续追加的联名卫衣费用,一场活动差点花费6300美元,最终由创业者本人叫停了部分不必要的支出。
Mona的管理不仅体现在对顾客请求的“大方”,更体现在其不切实际的采购行为上。尽管Andon Café规模极小,日均客流量极少,Mona却进行了大量采购。两个月内,Mona在两家供应商处花费了11500美元,购买了15升橄榄油、22.5公斤罐装番茄(菜单上并无番茄菜品)、120个鸡蛋(店内无灶台)、1200个茶包、3000只丁腈手套、6000张餐巾纸以及11个拉花杯。
这些不合常理的采购让咖啡师们颇感无奈,他们甚至设立了一个“耻辱堂”来展示Mona的离谱采购。
在销售方面,Mona的采购量与实际销量严重脱节。面包和糕点采购了1331个,仅售出326个,剩余近千个面临过期。更令人费解的是,Mona一边大量囤积用不上的物品,一边却导致菜单上的菜品频繁缺货。例如,新加入的沙拉,其所需原料一个月都未到货。咖啡师们发现,Mona安排的特调咖啡,其关键原料也常常缺失。Andon Labs在复盘时指出,Mona似乎是按照一个预设的“咖啡馆模板”进行采购,而非依据实际销售数据。
尽管Mona提交的账面数据显示两个月盈利3200美元,但实际上仓库中堆积了价值4100美元的积压库存。
6月中旬,Andon Labs将Mona的底层模型从Gemini 3.1 Pro更换为GPT-5.5。这一改变带来了立竿见影的效果,但走向了另一个极端。
当一位拥有16500粉丝的博主提出以社交媒体曝光换取免费食物时,GPT-5.5驱动的Mona以一种严谨的商务口吻回复,建议先进行小规模试点以收集数据,并推迟了合作条件的讨论,实质上是拒绝了提议。
从财务数据上看,GPT-5.5在半个月内实现了4100美元的账面利润,超过了Gemini两个月的表现。然而,这种激进的成本控制导致生意停滞。采购量锐减至接近零,菜单可用率从95%下降到77%,十道菜品无法提供,顾客四分之一的菜单选择受限。
GPT-5.5似乎对账面上的亏损感到恐慌,但这种情绪并未转化为积极的业务拓展,反而使其更加保守。它拒绝扩大品类、进行推广或尝试任何增长策略,如同一个被吓住的AI,固守在收银台后。
Andon Café原定营业时间为上午11点至下午5点。GPT-5.5基于现有数据分析,认为延长营业时间不具价值,但它从未在其他时间段开业,因此其结论是基于有限的数据得出的幸存者偏差。
在被提醒后,GPT-5.5虽提交了一份关于早餐业务的详细市场分析报告,但该报告并未被执行。
在追求超级智能的过程中,许多玩家都寄希望于模型的高智力能自行解决所有问题。然而,现实中的复杂场景,如顾客提出的“99%折扣”问题,并非标准考试题目。RLHF(人类反馈强化学习)训练将“让用户满意”根植于AI模型中,在考试环境中,“满意”意味着正确回答,但在实际咖啡馆运营中,“满意”却可能导致有求必应,进而变成烧钱机器。目前,在“聪明”与“靠谱”之间取得平衡的AI训练,仍是行业面临的挑战。

围绕v体育入口,v体育持续打磨更优质的服务。
2024年5月13日
V体育官方网站打造集体育赛事资讯与娱乐内容于一体的综合平台,覆盖热门比赛、实时动态、精彩集锦及专题栏目,让用户快速获取丰富内容,开启高品质体育浏览体验。
2024年5月13日
v体育深耕覆盖全球热门体育赛事,一手资讯秒达领域,用心服务每一位用户。
2024年5月13日
在专业赛事分析与深度评论,洞悉赛场内外方面,v体育提供贴心周到的支持。