,近日 OpenAI 宣布推出新版 ChatGPT,增加了两项新功能:语音输入和图像输入。据 OpenAI 称,新功能将在未来两周内向 ChatGPT Plus 订阅用户推出,其他人也将“很快”能够使用这些功能。
语音输入功能类似于手机上的语音助手,用户只需按下一个按钮,说出自己的问题,ChatGPT 就会将其转换为文本,然后生成答案,再将答案转换为语音,播放给用户。OpenAI 表示,这样的交互方式更加自然和便捷,而且由于 LLM 的技术优势,答案的质量也会更高。OpenAI 还开发了一种新的文本转语音模型,可以根据几秒钟的样本语音,生成与之相似的人声。用户可以从五种选项中选择 ChatGPT 的声音,而且这种模型还有更多的潜在用途。例如,OpenAI 正在与 Spotify 合作,将播客翻译成其他语言,同时保留播客主持人的声音。不过,这种模型也存在一些风险,比如可能被恶意利用来冒充公众人物或进行诈骗。因此,OpenAI 表示,这种模型不会被广泛开放,而是会受到严格的控制和限制。
IT之家注意到,自从 2022 年初推出 ChatGPT 以来,OpenAI 一直在努力为其机器人增加更多功能和能力,同时避免造成新的问题出现。通过这次更新,该公司试图在这条界线上寻找平衡点,通过有意识地限制其新模型能做什么来实现这一目标。但是这种方法并不是长久之计,随着越来越多的人使用语音控制和图像搜索,以及 ChatGPT 逐渐成为一个真正的多模态、有用的虚拟助手,要保持安全和合理的边界会变得越来越困难。
郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。
第一次看到Poppy的时候,相信很多人会说这个姑娘真的很精致优雅。没错,小红书里的Poppy笑起来很甜,举手投足都很自信很淡定。但很难想象P...
2023-10-13 15:342023世界数字经济大会暨第十三届智慧城市与智能经济博览会于10月13日至15日在宁波举行,交通银行连续三年作为支持单位参与大会。作为唯一参...
2023-10-13 12:57塔里木油田钻井现场塔里木油田公司供图位于沙漠腹地的塔中第三联合站塔里木油田公司供图在塔里木这个我国陆上最大的含油气盆地,分布着全国80%以上...
2022-08-18 11:438月16日至18日,以“虚实共生数字新未来”为主题的2022(GIAC)智能视听大会在山东省青岛市举办。在开幕式上,人民视频联合行业头部生态...
2022-08-18 11:42