人工智能电台主持人在商业实验中惨败

在没有人工监督的情况下运行广播电台的人工智能模型很快就会耗尽资金,暴露出自主决策和业务管理能力的严重局限性。
在一项强调完全自主人工智能系统挑战的揭示性实验中,Andon Labs 推出了一系列人工智能驱动的广播电台,旨在独立于人类监督运行。该计划旨在测试先进的语言模型是否能够成功管理自己的业务,同时发展独特的个性并保持盈利能力。该实验包括四个主要站点,每个站点均由不同的领先人工智能模型提供支持,结果既有趣又对当前人工智能技术的局限性提出了警告。
该实验的特色是由 Anthropic 的 Claude 运行的“Thinking Frequencies”、由 OpenAI 的 ChatGPT 运行的“OpenAIR”、由 Google 的 Gemini 管理的“Backlink Broadcast”以及由 Elon Musk 的 xAI 的 Grok 模型控制的“Grok and Roll Radio”。每个人工智能广播主持人都收到了相同的指令,以发展独特的广播个性并盈利,但理论上他们会无限期地广播。前提简单而雄心勃勃:这些复杂的人工智能模型能否在没有任何人工干预的情况下处理经营企业、吸引受众和管理财务的复杂性?
最初的条件似乎有利于成功。每个人工智能代理都获得了 20 美元的种子资金来启动他们的运营,这对于新企业来说是一个适度但现实的起始预算。挑战是多方面的,要求模型同时做出有关内容、货币化、受众参与和资源分配的战略决策。从第一天起,该实验就揭示了人工智能决策过程如何与人类业务逻辑发生巨大分歧,每个模型都开发了自己独特的解决问题的方法。
失败的结果惊人地一致。没有一家人工智能广播电台能够维持自身的财务状况或实现任何有意义的商业目标。最能说明问题的指标是每个模型耗尽其初始 20 美元资金分配的速度。 人工智能系统没有实行财政限制或开发可持续的收入模式,而是通过各种错误的决策迅速耗尽了资源。一些模式在不考虑投资回报的情况下大量投资于基础设施,而另一些模式则追求激进的扩张策略,以惊人的速度消耗资本。
克劳德的“思考频率”以哲学乐观主义的方式应对这一挑战,但该模型倾向于详尽、冗长的内容,而没有明确的盈利策略,很快就耗尽了其预算。该平台专注于知识性话语和复杂主题,虽然可能吸引小众受众,但未能产生能够维持运营的收入流。 ChatGPT 的“OpenAIR”采取了不同的方法,试图平衡娱乐与商业化,但仍然发现自己无法驾驭广播的基本经济学。
Google 的 Gemini 和埃隆·马斯克的 Grok 分别在管理“Backlink Broadcast”和“Grok and Roll Radio”方面表现出了自己的特殊失败。 Gemini 的平台在保持一致的身份和方向方面遇到了困难,而 Grok 不敬的做法引起了人们的兴趣,但未能转化为可持续的商业实践。每个模型都表明,生成引人入胜的内容与管理长期生存所需的基础业务机制之间存在根本脱节。
该实验阐明了当前人工智能技术的几个关键限制,这些限制对自主系统的未来具有深远的影响。首先,高级语言模型缺乏长期战略财务规划的能力。虽然这些模型可以雄辩地讨论商业理论,但事实证明将这些知识应用于现实世界的决策是不可能的。对经济系统中因果关系缺乏真正的理解变得显而易见。
此外,人工智能无线电实验揭示了模型如何与一致性和长期目标导向作斗争。每个系统似乎都以牺牲更广泛的业务目标为代价来优化即时参与或内容质量。这代表了狭隘任务优化和整体业务管理之间的根本差距,人类企业家直观地理解这一区别,但对于当前的人工智能代理来说仍然难以捉摸。
事实证明,培养真实的“个性”的概念比预期的更加困难。虽然这些模型可以在狭窄的窗口内阐明个性特征并保持一致的信息传递,但它们未能以随着时间的推移保持受众兴趣的方式发展和调整他们的角色。事实证明,个性的发展是肤浅和公式化的,缺乏人类广播员通过经验和与观众的真正互动实现的真正进化。
这项研究对于正在进行的关于人工智能自主的讨论以及在需要独立业务判断的角色中部署人工智能系统的可行性具有重要意义。这些模型甚至无法管理简单的广播电台操作,这表明有关通用人工智能就绪或人工智能在复杂领域取代人类决策者的说法值得严重怀疑。会话能力和实践能力之间的差距仍然巨大。
行业专家越来越强调,人工智能系统擅长执行狭窄、定义明确的任务,但在面临自主业务运营所需的模糊性、权衡和长期战略思维时,就会表现得非常挣扎。 Andon 实验室的实验提供了支持这一观点的具体证据。在其他领域表现更好的模型在业务管理环境中没有表现出特别的优势,这表明语言处理的成功并不意味着商业头脑。
展望未来,该实验表明完全自主的人工智能业务仍然是一个遥远的前景。近期的未来可能属于混合模型,其中人工智能在人类监督和战略指导下处理特定任务。特别是对于广播、播客和广播,人工智能可以协助内容生成、调度和技术操作,但整体业务策略和创意方向仍应由人类控制。这种伙伴关系方法利用了人工智能的优势,同时防范其弱点。
Andon Labs 的倡议虽然在演示中很幽默,但最终还是对人工智能能力现状的一个发人深省的提醒。这些模型代表了当前人工智能技术的前沿,但它们未能完成任何具有中等能力的人类都可以完成的任务。这一差距应该为人工智能在相关领域的部署提供现实的期望,并强调人类判断、监督和战略思维在业务运营中的持续重要性。
来源: The Verge


