论坛风格切换
正版合作和侵权请联系 sd173@foxmail.com
 
  • 帖子
  • 日志
  • 用户
  • 版块
  • 群组
帖子
购买邀请后未收到邀请联系sdbeta@qq.com
  • 107阅读
  • 0回复

[业界新闻]OpenAI发布最新旗舰生成式AI模型GPT-4o 改进文本、视觉和音频功能 [复制链接]

上一主题 下一主题
 

发帖
6188
今日发帖
最后登录
2024-09-19
只看楼主 倒序阅读 使用道具 楼主  发表于: 2024-05-14 11:03:33
  OpenAI发布了一个名为GPT-4o的新旗舰生成式人工智能模型,并将在未来几周内"迭代式"地在公司产品中推出。OpenAI首席技术官穆里-穆拉提(Muri Murati)说,GPT-4o提供了"GPT-4级"智能,但在GPT-4的基础上改进了文本、视觉和音频功能,所有用户都可以免费使用,付费用户将继续"拥有五倍于免费用户的容量限制"。 28"1ONs 3  
3N_KNW  
  穆拉提在OpenAI办公室举行的主题演讲上说:GPT-4o的理由横跨语音、文本和视觉。OpenAI将发布桌面版ChatGPT和全新的用户界面。 M2Nh3ijr  
PEI$1,z  
  穆拉提说:"我们知道这些模型越来越复杂,但我们希望交互体验变得更自然、更简单,让你完全不用关注用户界面,而只关注与GPT的协作。这一点非常重要,因为我们正在展望人类与机器之间互动的未来。" 8xLQ" l+"  
ww{k_'RRJ  
  GPT-4是OpenAI之前的领先模型,它是图像和文本的结合体,可以分析图像和文本,完成从图像中提取文本甚至描述图像内容等任务。但GPT-4o增加了语音功能。 Xex7Lr&  
[)I^v3]U  
  这具体能带来什么?很多方面。 > SZ95@Oh  
nGVr\u9z  
  GPT-4o极大地改善了ChatGPT的体验--ChatGPT是OpenAI的病毒式人工智能聊天机器人。ChatGPT长期以来一直提供语音模式,使用文本到语音模式转录ChatGPT中的文本。但GPT-4o对此进行了改进,让用户可以更像使用助手一样与ChatGPT互动。 c,r6+oX  
]V/5<O1  
  例如,用户可以向由GPT-4o支持的ChatGPT提问,并在ChatGPT回答时打断它。OpenAI表示,该模型能提供"实时"响应,甚至能捕捉用户声音中的情感,并生成"一系列不同情感风格"的语音。 =8l' [  
>&.N_,*  
  GPT-4o还改进了ChatGPT的视觉功能。有了照片或桌面屏幕,ChatGPT现在可以快速回答相关问题,从"这个软件代码是怎么回事"到"这个人穿的是什么牌子的衬衫? 'l/l]26rO4  
96\FJHt Z  
  GPT-4o从即日起在ChatGPT的免费级别中推出,OpenAI的高级ChatGPT Plus和Team用户可使用"高出5倍"的消息限制,企业选项"即将推出"。(OpenAI指出,当用户达到使用阈值时,ChatGPT将自动切换到GPT-3.5)。OpenAI表示,它将在下个月左右向Plus用户推出由GPT-4o改良的语音体验。 . V!5Ui<  
aG7Lm2{c"  
  穆拉提说:"我们知道这些模型越来越复杂,但我们希望交互体验变得更自然、更简单,让你完全不用关注用户界面,而只关注与[GPT]的协作。" dcrvEc_/  
~aotV1"D  
  OpenAI声称,GPT-4o的多语言能力也会更强,在50种不同语言中的性能都有所提高。在OpenAI的API中,GPT-4o的速度是GPT-4(特别是GPT-4 Turbo)的两倍,价格为GPT-4 Turbo的一半,而且速率限制更高。 RhJ3>DL  
0")_%  
  用户只需发出简单的"嘿,ChatGPT"语音提示,就会收到来自代理的热情洋溢的口语回应。然后,用户使用简单的口语提交查询,并在必要时附上文字、音频和/或视觉效果--后者可以包括照片、手机摄像头的实时画面或代理能"看到"的任何其他内容。 ]4t1dVD  
@lzq`SzM  
  在音频输入方面,人工智能的平均响应时间为320毫秒,该公司称这与人与人对话中的人类响应时间相似。在今天的演示中,代理的回答没有出现令人尴尬的滞后现象,这无疑包含了许多类似人类的情感。此外,用户还可以打断代理的回答,而不会影响前后的信息流。 t 9(,JC0  
$D`Kz*/.  
  在演示中,GPT-4o还充当了两个人之间意大利语和英语对话的口译员;帮助一个人解决手写的代数方程;分析编程代码的某些部分;甚至还为一个机器人的睡前故事配上了广告词。 \ ERBb.  
8;qOsV)UDT  
  目前,GPT-4o应用程序接口中还没有为所有客户提供语音功能。OpenAI以滥用风险为由表示,计划在未来几周内首先向"一小部分可信赖的合作伙伴"推出对GPT-4o新音频功能的支持。 NkUY_rKPb  
s1OSuSL>  
  其他方面,OpenAI将在网络上发布焕然一新的ChatGPT UI,新的主屏幕和消息布局"更具对话性",同时还将发布桌面版的ChatGPT for Mac,用户可以通过键盘快捷键向ChatGPT提问,也可以通过打字或说话截图并进行讨论。(从今天开始,Plus用户将首先获得访问权限,Windows版本的应用程序将于今年晚些时候推出)。此外,ChatGPT的免费用户现在还可以访问GPT Store(OpenAI基于其人工智能模型构建的第三方聊天机器人库)。 HHx5 VI  
3x(Y+ ymP  
  GPT-4o的文本和图像功能现已开始向付费ChatGPT Plus和Team用户推出,企业用户也即将推出。免费用户也将开始使用,但有费率限制。 -n@,r%`UK  
*/{y%  
  语音版GPT-4o将"在未来几周内"开始提供。 &kf \[|y  
k6 OO\=  
  开发人员将能够使用GPT-4o的文本和视觉模式,并在未来几周内向"一小部分值得信赖的合作伙伴"提供音频和视频功能。 ~e|E5[-i