IT之家6 月 10 日报道,OpenAI 在几个月内第二次解释其文本转语音工具,并再次强调该工具目前尚未向公众开放,未来也可能不会开放。
图片来源:Pexels
OpenAI 周五在其网站上发表的声明中表示:“无论我们最终是否大规模部署这项技术,让全世界的人们了解这项技术的发展方向都很重要。”“这就是为什么我们要解释我们的模型是如何工作的,我们如何将它们用于研究和教育,以及我们如何围绕这项技术实施安全措施。”
据IT之家报道,去年年底,OpenAI 向少数外部用户分享了其“语音引擎”。该引擎利用文本输入和 15 秒的人声音频片段,“生成听起来自然、与原说话者非常相似的人类声音”。该工具可以创建逼真的多语言声音。当时,该公司表示,他们选择预览这项技术,而不是大规模发布,是为了“增强社会韧性”,以应对“越来越逼真的 AI 生成模型”所带来的威胁。
作为这些努力的一部分,OpenAI 表示正在积极淘汰语音识别用于银行账户验证的技术,探索保护个人声音在人工智能中使用的政策,向公众普及人工智能的风险,并加快开发跟踪视听内容的技术,以便用户能够识别他们是在与真人还是合成内容进行互动。
然而,尽管做出了努力,人们对这项技术的担忧仍然存在。美国总统拜登的人工智能负责人布鲁斯·里德曾表示,语音克隆是他夜不能寐的原因之一。美国联邦贸易委员会 3 月表示,诈骗者正在利用人工智能技术使他们的欺诈行为更加可信,他们使用的语音克隆工具使人们更难区分人工智能生成的声音和人类的声音。
OpenAI 试图在周五的最新声明中缓解这些担忧,称:“我们将继续与美国和国际政府、媒体、娱乐、教育、民间社会等领域的合作伙伴进行接触,以确保我们在开发过程中采纳他们的反馈。”该公司还指出,一旦“语音引擎”配备其最新型号 GPT-4o,它也会带来新的威胁。该公司表示,他们正在积极“在内部对 GPT-4o 进行‘红队测试’,以识别和解决社会心理学、偏见和公平以及错误信息等领域的已知和未知风险。”