2025-03-30 04:10来源:本站
当你想到由人工智能编程的声音听起来会是什么样子时,你可能会想到一些机器人和呆板的东西,断断续续的节奏无法捕捉到甚至有些人情味所需的音调、速度和情感。但现在是2024年,机器人已经得到了重大升级。现在,它们可以模仿人的声音、口音和语调,模仿到令人毛骨悚然的程度——不管是好是坏。
上周,ChatGPT向大多数用户发布了新的高级语音模式功能,这是原始ChatGPT的音频版本,它使用人工智能对文本提示进行对话响应。高级语音模式的工作方式与原版相同,但使用音频;使用高级语音模式的用户对着应用程序说话,语音会自动响应。用户可以从九种声音中选择一种,然后通过对话和文本提示,他们教会这些声音以他们喜欢的方式说话。
ChatGPT的所有者OpenAI公司发布了一份安全报告,警告人们可能会对这一功能产生情感依赖。
人工智能专家西莉亚·奎莉安(Celia Quillian)解释说:“它不仅能识别你使用的单词,还能识别你语调的变化,还能根据你所使用的单词的上下文,以最合理的方式做出回应。”“ChatGPT一直是一个预测模型,对吧?所以它只是根据你给它的输入来预测最可能的反应,现在它正在用声音来做这件事。”
这一新功能促使许多TikTok用户发布视频,展示高级语音模式的功能,包括说俚语、方言,甚至偶尔说地方口音。结果是令人惊讶的,往往是滑稽的。
当新泽西州本地人、企业家莫丽莎·施瓦茨(Morissa Schwartz)要求ChatGPT模仿她的声音时,这款应用毫不犹豫。
“嘿,你好吗?”是莫丽莎,在海岸那头,拿着一片最好的披萨。”那个声音用一种夸张的口音说。“你知道,这种披萨会让你为了食物而搬到这里来——我真受不了。”
“我听起来真的像你说的那样吗?”施瓦茨在她的TikTok账户上发布的一段视频中怀疑地问道。“我知道我有一点新泽西口音,但真的那么明显吗?”
“嗯,你确实有一点新泽西的风格,”该应用程序回应道。“它有个性和温暖,就像你一样。”
在一次采访中,施瓦茨说,作为第六代新泽西人,她发现这款应用对她的印象是“一个滑稽的惊喜”。
“我不知道它还能模仿,”她说。“在我进入高级模式几天后,我注意到它在改变口音,所以我突发奇想,问它能否模仿我。我对它的好感到震惊,就像,‘这东西是不是偷偷刷了我的tiktok ?’”
施瓦茨补充说,与机器人聊天“过去感觉就像向一位超级聪明的教授提问。”但现在,她说,“感觉那个聪明的教授就像我的闺蜜。”
高级语音模式在尝试以用户要求的方式进行交流时,往往依赖于比喻和刻板印象,这可能会导致一些用户觉得冒犯的回应。当网红诺亚·米勒(Noah Miller)要求高级语音模式(Advanced Voice Mode)说“超级基佬”(super gay)时,这款应用也做出了同样的回应:“当然,亲爱的,让我们来一个超棒的基佬吧。”什么茶?你在想什么?泄漏。(对米勒来说,他似乎觉得这段对话很滑稽。)
虽然目前大多数用户似乎都是出于娱乐目的而使用高级语音模式,但奎莉安表示,她已经看到了该功能的一些实际应用,包括帮助音频学习者完成家庭作业,进行实时翻译,以及充当替代治疗师。
“这听起来有点奇怪——我是治疗和人类治疗师的大力倡导者,”奎莉安说,“但如果你负担不起,你只需要一个倾听的耳朵,和这个东西说话就会感觉很像你在和一个同情你的人说话,他会问你问题,他会试图深入了解你的感受。”她补充说,“我可以把它看作是一种大声解决问题的方式,如果你身边没有其他人以一种非常同情的方式来解决问题。”
不过,奎莉安承认,正如OpenAI所警告的那样,不管机器人的声音看起来有多聪明、多逼真,人们对机器人过于情绪化可能会有负面影响。
“我认为很多人都有一种有根据的恐惧,有了这些情感工具,人们可能会开始取代人工智能来处理一段可怕的关系,对吧?她说。我同意这一点。我认为这是一种平衡,你知道,在使用这些工具的背景下,我们不能忘记我们的人性和我们彼此之间的关系,但我们可以使用这些工具来促进我们之间的联系和关系,以及我们与彼此和我们自己之间的关系。-?2024纽约时报公司
×