论坛风格切换
正版合作和侵权请联系 sd173@foxmail.com
 
  • 帖子
  • 日志
  • 用户
  • 版块
  • 群组
帖子
购买邀请后未收到邀请联系sdbeta@qq.com
  • 108阅读
  • 0回复

[业界新闻]OpenAI发布最新旗舰生成式AI模型GPT-4o 改进文本、视觉和音频功能 [复制链接]

上一主题 下一主题
 

发帖
6201
今日发帖
最后登录
2024-09-20
只看楼主 倒序阅读 使用道具 楼主  发表于: 2024-05-14 11:03:33
  OpenAI发布了一个名为GPT-4o的新旗舰生成式人工智能模型,并将在未来几周内"迭代式"地在公司产品中推出。OpenAI首席技术官穆里-穆拉提(Muri Murati)说,GPT-4o提供了"GPT-4级"智能,但在GPT-4的基础上改进了文本、视觉和音频功能,所有用户都可以免费使用,付费用户将继续"拥有五倍于免费用户的容量限制"。 'I@l$H  
xDn#=%~+x  
  穆拉提在OpenAI办公室举行的主题演讲上说:GPT-4o的理由横跨语音、文本和视觉。OpenAI将发布桌面版ChatGPT和全新的用户界面。 G g{M  
dU|&- .rG  
  穆拉提说:"我们知道这些模型越来越复杂,但我们希望交互体验变得更自然、更简单,让你完全不用关注用户界面,而只关注与GPT的协作。这一点非常重要,因为我们正在展望人类与机器之间互动的未来。" < !PbD  
DP!~WkU~  
  GPT-4是OpenAI之前的领先模型,它是图像和文本的结合体,可以分析图像和文本,完成从图像中提取文本甚至描述图像内容等任务。但GPT-4o增加了语音功能。 'A'[N :i  
4X$|jGQ\  
  这具体能带来什么?很多方面。 m 8P`n  
:E2 ww`  
  GPT-4o极大地改善了ChatGPT的体验--ChatGPT是OpenAI的病毒式人工智能聊天机器人。ChatGPT长期以来一直提供语音模式,使用文本到语音模式转录ChatGPT中的文本。但GPT-4o对此进行了改进,让用户可以更像使用助手一样与ChatGPT互动。 h&:XO9dY  
RFLw)IWkL_  
  例如,用户可以向由GPT-4o支持的ChatGPT提问,并在ChatGPT回答时打断它。OpenAI表示,该模型能提供"实时"响应,甚至能捕捉用户声音中的情感,并生成"一系列不同情感风格"的语音。 +sx$%N  
mh,a}bX{  
  GPT-4o还改进了ChatGPT的视觉功能。有了照片或桌面屏幕,ChatGPT现在可以快速回答相关问题,从"这个软件代码是怎么回事"到"这个人穿的是什么牌子的衬衫? Dn+hI_"# _  
9QEK|x`8  
  GPT-4o从即日起在ChatGPT的免费级别中推出,OpenAI的高级ChatGPT Plus和Team用户可使用"高出5倍"的消息限制,企业选项"即将推出"。(OpenAI指出,当用户达到使用阈值时,ChatGPT将自动切换到GPT-3.5)。OpenAI表示,它将在下个月左右向Plus用户推出由GPT-4o改良的语音体验。 ]eo%eaA   
k6(0:/C  
  穆拉提说:"我们知道这些模型越来越复杂,但我们希望交互体验变得更自然、更简单,让你完全不用关注用户界面,而只关注与[GPT]的协作。" 1krSX 2L  
p4z thdN[  
  OpenAI声称,GPT-4o的多语言能力也会更强,在50种不同语言中的性能都有所提高。在OpenAI的API中,GPT-4o的速度是GPT-4(特别是GPT-4 Turbo)的两倍,价格为GPT-4 Turbo的一半,而且速率限制更高。 .hK:-q,  
"; mlQyP  
  用户只需发出简单的"嘿,ChatGPT"语音提示,就会收到来自代理的热情洋溢的口语回应。然后,用户使用简单的口语提交查询,并在必要时附上文字、音频和/或视觉效果--后者可以包括照片、手机摄像头的实时画面或代理能"看到"的任何其他内容。 #?7g_  
+RyV"&v  
  在音频输入方面,人工智能的平均响应时间为320毫秒,该公司称这与人与人对话中的人类响应时间相似。在今天的演示中,代理的回答没有出现令人尴尬的滞后现象,这无疑包含了许多类似人类的情感。此外,用户还可以打断代理的回答,而不会影响前后的信息流。  OF O,5  
g\G}b  
  在演示中,GPT-4o还充当了两个人之间意大利语和英语对话的口译员;帮助一个人解决手写的代数方程;分析编程代码的某些部分;甚至还为一个机器人的睡前故事配上了广告词。 *)s^+F 0  
Wn Ng3'6  
  目前,GPT-4o应用程序接口中还没有为所有客户提供语音功能。OpenAI以滥用风险为由表示,计划在未来几周内首先向"一小部分可信赖的合作伙伴"推出对GPT-4o新音频功能的支持。 m Q^SpK #  
W@Rb"5Gy+  
  其他方面,OpenAI将在网络上发布焕然一新的ChatGPT UI,新的主屏幕和消息布局"更具对话性",同时还将发布桌面版的ChatGPT for Mac,用户可以通过键盘快捷键向ChatGPT提问,也可以通过打字或说话截图并进行讨论。(从今天开始,Plus用户将首先获得访问权限,Windows版本的应用程序将于今年晚些时候推出)。此外,ChatGPT的免费用户现在还可以访问GPT Store(OpenAI基于其人工智能模型构建的第三方聊天机器人库)。 ricL.[v9S  
il$eO 7  
  GPT-4o的文本和图像功能现已开始向付费ChatGPT Plus和Team用户推出,企业用户也即将推出。免费用户也将开始使用,但有费率限制。 G@scz!Nt  
?7A>|p?"  
  语音版GPT-4o将"在未来几周内"开始提供。 v>0} v)<v  
Q 6dqFnz  
  开发人员将能够使用GPT-4o的文本和视觉模式,并在未来几周内向"一小部分值得信赖的合作伙伴"提供音频和视频功能。 L`"V_ "Q#0