OpenAI新模型测评：满分通过巴西最难入学考试之一

文化 2024-09-19 10:05 阿根廷

OpenAI o1人工智能大语言模型满分通过巴西航空理工学院入学考试的数学测试。《圣保罗州报》

【南美侨报网编译段木心9月18日报道】OpenAI公司上周推出了名为“OpenAI o1”的新人工智能（AI）大语言模型。根据巴西人的测评，这款AI模型可以在巴西航空理工学院（ITA）入学考试的数学测试中获得10分满分，并通过圣保罗大学（USP）住院医师考试多个专业的测试。

o1满分通过巴西最难入学考试之一的数学测试

巴西《圣保罗州报》9月17日报道，OpenAI称，o1具有逻辑推理和数学运算能力，能处理更复杂的问题。如今，这款AI模型正在世界各地接受专家和研究人员的测试。

在巴西，企业家维尼修斯·苏亚雷斯（Vinícius Soares）使用巴西航空理工学院2024年入学考试中的数学试卷对o1进行了测试，这一考试历来被视为巴西最难入学考试。最终，o1凭借其解决复杂数学问题的能力取得了10分满分的优异成绩。

不过，与ChatGPT的快速响应不同，o1需要更多的处理时间来评估现有数据，并寻找不同的方法得出答案，这一点也体现在苏亚雷斯进行的测试实验中。

苏亚雷斯认为，o1有潜力彻底改变多个领域的发展。他提到，在教育领域，该AI模型可用于生成新的问题并给出解题方案，帮助学生准备航空理工学院等高校的入学考试；在法律领域，o1还可以分析数千个诉讼，以识别其中的模式和趋势，帮助辩方寻找赢得官司的最佳辩护方案。

o1在巴西医疗领域考试中的表现优于“前辈”

不仅如此，o1在医疗领域的表现也令人惊叹。巴西医学教育和数字健康医学专家马修斯·费雷拉（Matheus Ferreira）使用2024年圣保罗大学住院医师考试的试题对o1进行了测试。结果显示，即便没有图像分析能力，o1也能达到82%的准确率，超过了同样由OpenAI开发的ChatGPT-4模型和美国AI初创企业Anthropic推出的Claude 3.5 Sonnet，后两者的准确率皆为76%。

值得一提的是，由于o1在处理图像方面的限制，完全依赖于图像分析的问题被排除在本次试验之外，但仍保留了题干中配有图像的其他问题。

费雷拉指出，在测试过程中，o1最主要的问题是反应时间过长。相比较而言，GPT-4和Claude 3.5几乎能立刻作答，而o1在面对一些问题时，需要“思考”大约100秒。尽管如此，事实证明，o1的答案更加可信，正确回答了93个问题，而另外两个AI模型只答对了85个。

不过，费雷拉强调，在预防医学专业的测试中，三个AI模型的表现都不尽如人意。他认为，主要原因在于训练三个模型的数据库内容大多是英文，而预防医学涉及很多区域性知识，例如巴西的立法和统一卫生系统（SUS）等相关问题。

http://mp.weixin.qq.com/s?__biz=MjM5MjU1NDYxOQ==&mid=2657068450&idx=3&sn=bc824761aba7771f175bdf2854377cfa

拉美华人在线

我们是“拉美华人在线”立足拉美，面向全球华人的公众号。每天为大家带来国内外优质资讯，深度好文，带你以华人视角，了解拉美，了解世界！

最新文章

阿根廷总统遭委内瑞拉通缉令！外交风波升级

阿根廷年轻人如何定义职业成功？近八成注重平衡生活与工作

马斯克用“先进魔法”让社媒X重返巴西最高法勒令调查

超2000辆巴西今年在三国边境扣机动车数量创新高

投资阿根廷百问百答 | 028阿根廷如何保护生物技术与计算机软件专利？

阿根廷名人闪耀全球!梅西、教宗领衔拉美地区500大影响力人物榜

前7个月，比亚迪是智利第二畅销电动汽车品牌

OpenAI新模型测评：满分通过巴西最难入学考试之一

阿根廷黄金白银出口成绩亮眼中国成为锂出口最大买家

巴西前人权部长涉性骚扰最高法授权联邦警察展开调查

阿根廷人疯狂赴智利扫货哪些商品更便宜？

哥伦比亚这个“鲨鱼潜水圣地”，你听说过吗？

快来打卡！巴西五家披萨店入围全球百佳

投资阿根廷百问百答 | 028阿根廷如何保护生物技术与计算机软件专利？

洗钱调查的意外收获巴西警方查获非法非洲野生动物标本

阿根廷总统米莱公布十大经济政策:改革还是革命?

美国现役军人在委内瑞拉被捕美方否认搞颠覆活动

博彩公司开赌盘下注市长选举巴西法律存“真空地带”？

八旬渔民与企鹅的感人故事《我的企鹅朋友》在巴西上映

稳定大米价格和供应玻利维亚政府与稻米业者达成协议

中秋假期日均出入境旅客将达180万人次

阿根廷四口之家每月花费近94万比索才能避免陷入贫困

世界气象组织预测拉尼娜现身概率为六成巴西受何影响？

玻利维亚牵手俄罗斯共掘"白色黄金"！世界最大盐湖蕴藏巨量锂矿

世预赛输球后拍打摄像机阿根廷门将马丁内斯或遭禁赛

阿根廷人为省钱连烤肉都成了奢侈品还有这些省钱绝招

向前世界首富贝索斯售房“被骗” 巴西富豪起诉房产中介

极端天气影响巴西23/24产季粮食减产2140万吨

巴西总统承诺将继续敞开大门欢迎委内瑚拉难民

阿根廷知名夹心饼干“Alfajores”哪家强？来看ChatGPT的选择

劫匪抢劫运钞车与巴西警方交火致4人死亡

社群内售卖猴子、鳄鱼等野生动物巴西警方介入调查

里约摇滚节试演观众提前领略音乐节风采

马斯克大胆预言美国或沦为"第二个阿根廷" 呼吁减少政府开支

亚马逊大火蔓延南美阿根廷天空被烟雾笼罩

美到窒息！阿根廷巴塔哥尼亚200万株郁金香绽放

保护潘塔纳尔湿地巴西消防员入玻利维亚灭火

投资阿根廷百问百答 | 025如何在阿根廷保护您的商标权益？

持有阿根廷驾照畅行全球？揭秘出国开车必备攻略！

美丽雪景+实惠价格 7月赴智利巴西游客突破14万人次

阿根廷华人超市惊爆窃案？12扇窗户成"赃物"

香蕉肉拌镇定剂巴西夫妇因给植物园猴子下药被捕

面向探监女性巴西女企业家掀起“监狱时尚”

真主党渗透拉美阿根廷成洗钱中转站?

2金3银8铜！阿根廷代表团在巴黎残奥会取得44年来最好成绩

36岁巴西中场保利尼奥退役曾效力广州恒大、巴萨

玩笑酿悲剧巴西少年假装抢劫友人被军警射杀

巴西渔民自建App 举报瓜纳巴拉湾违规事件

阿根廷政府与委内瑞拉紧张关系骤然升级阿使馆危机一触即发！

南美外交圈掀波澜!委内瑞拉驱逐巴西外交官阿根廷使馆陷入风波

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉