复旦大学高考数学大模型评测：阿里千问、讯飞星火力压GPT-4o 事情经过是怎样的？

发布时间：2024-06-12 17:27:18来源：

「复旦大学高考数学大模型评测：阿里千问、讯飞星火力压GPT-4o」!!!今天受到全网的关注度非常高，那么具体的是什么情况呢，下面大家可以一起来看看事情经过是怎样的！

快科技6月12日消息，近日，复旦大学NLP（自然语言处理）实验室LLMEVAL团队发布了2024年高考数学大模型评测的结果。

在这次评测中，阿里千问和讯飞星火分别获得了2024高考数学新I卷的第一名和第二名，以及高考数学新II卷的第二名和第一名，两份考卷的评测中，GPT-4o均列第三名。

复旦NLP团队认为，全新出炉的高考试题具备高度的独创性和保密性，是用来评测大模型的绝好评测集合。在新Ⅰ卷中，阿里千问和讯飞星火对14道数学客观题的准确率达到70%以上，大幅领先GPT-4o的57%，字节豆包、智谱清言、百川等大模型紧随其后，准确率超过50%，百度文心一言、腾讯元宝、Kimi等大模型准确率较低。

而在在新Ⅱ卷的评测中，讯飞星火、阿里千问、GPT-4o准确率均超过60%，其他大模型的差距较小，除百川、DeepSeek和海螺之外，准确率均在50%以上。

数学能力是GPT-4o一直以来引以为傲的能力模块，OpenAI在5月14日的发布会上推出大语言模型GPT-4o时，曾重点演示其数学能力。

在现场演示中，GPT-4o利用其实时的图像识别和语音能力进行在线教学。从评测结果可以看出，阿里千问和讯飞星火对数学问题的深入理解和分析能力已经超过GPT-4o，使其在高考数学试题的解答上具有更高的准确率。有网友表示，做数学题毕竟还是咱中国人的特长。

以阿里千问和讯飞星火为代表，国产人工智能大模型在数学领域的出色能力，为未来人工智能技术在教育领域的应用提供了有力支持。

以上就是关于【复旦大学高考数学大模型评测：阿里千问、讯飞星火力压GPT-4o】的相关消息了，希望对大家有所帮助！

标签：复旦大学高考数学大模型评测阿里千问讯飞星火力压GPT4o事情经过是怎样的

免责声明：本答案或内容为用户上传，不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。如遇侵权请及时联系本站删除。

复旦大学高考数学大模型评测：阿里千问、讯飞星火力压GPT-4o 事情经过是怎样的？

相关阅读

猜你喜欢

汽车经验

汽车知识

汽车常识

汽车百科

最新滚动