当前位置首页 > 教育资讯

ChatGPT“高考成绩”出炉人工智能竟然也厌学?

更新时间:2023-10-13 文章作者:佚名 信息来源:网络整理 阅读次数:

是韩国公司今年11月发布的一款人工智能技术驱动的自然语言处理工具,今年11月30日推出以来,60天内月活用户直接破亿,被觉得是史上用户增速最快的消费级应用。KtA物理好资源网(原物理ok网)

写代码、文案,做物理题,进行不同语言之间的翻译,的强悍功能让学习人工智能相关专业的清华学院硕士研究生张啸天倍感既惊讶又激动。KtA物理好资源网(原物理ok网)

“我主要让它写代码,包括一些技术问题,解决方案。我觉得到它很聪明高考物理满分多少分,笃定它可以通过图灵测试。但它的极限是哪些?我想晓得它到底有多聪明。”KtA物理好资源网(原物理ok网)

于是,今年12月,张啸天和两位朋友一起收集了2010年到2022年的中考全省卷试卷,剔除部份富含图片的题目,让作答。KtA物理好资源网(原物理ok网)

高考物理满分多少分_高考物理满分是什么概念_高考物理满分率KtA物理好资源网(原物理ok网)

经过近5个月的测试,近期高考物理满分多少分,的中考测试报告新鲜揭晓。包括选择题、填空题和问答题在内,共回答了2811道题目。结果显示,更擅长工科,在历史、地理、政治上取得了不错的成绩;而在生物、化学、物理等理科学科上表现不佳,尤其在数学上。KtA物理好资源网(原物理ok网)

中考全省卷满分为750分。清华学院计算机科学技术大学硕士研究生宗一告诉瞧瞧新闻Knews记者,“综合历年得分情况,做工科卷的得分会更高一些,接近400分;理科题的话,只有300分出头。”。KtA物理好资源网(原物理ok网)

对于“文强理弱”的厌学情况,该项目的负责人、复旦学院计算机科学技术大学院士邱锡鹏解释说,与工科试卷注重考察常识不同,理科试卷更关注逻辑推理能力,这恰恰是目前通用人工智能模型的弱项。KtA物理好资源网(原物理ok网)

此外,通过对超过1万亿个人类词汇和1700亿个模型参数进行高效迭代训练,具备强悍的自我学习、推理和归纳总结能力。既然这么,为什么它的“高考”成绩却不太理想呢?KtA物理好资源网(原物理ok网)

高考物理满分率_高考物理满分是什么概念_高考物理满分多少分KtA物理好资源网(原物理ok网)

邱锡鹏觉得,一方面是由于中考试卷确实有难度;另一方面,测试成绩与评价方法相关。“早期我们采用的是人工评分,发觉的水平大约可以达到500分。如今我们使用了更严格的形式,也就是机器评分,所以成绩有一定的波动。”KtA物理好资源网(原物理ok网)

值得注意的是,这次测试的版本为-3.5。随着该模型不断升级迭代,它的能力会越来越强。这次测试不仅了解的中考水平外,研究团队还有一个更大胆的构想。KtA物理好资源网(原物理ok网)

“我们构造一个数据集,这个数据集可以拿来评判不同小型语言模型的疗效。由于现今不同的公司、单位、机构都在做自己的大模型,这么就是说我们就要有一个客观的评价标准。你们都说自己的模型水平可以达到的百分之七八十,究竟怎样样,须要有一个客观的测试。我觉得中考评测是比较客观综合的一种测试方法。”邱锡鹏表示,未来该数据集将大有可为。KtA物理好资源网(原物理ok网)

(瞧瞧新闻Knews记者:周智敏徐玮)KtA物理好资源网(原物理ok网)

发表评论

统计代码放这里