展會信息港展會大全

我讓7個AI寫了今年的高考作文,還找語文老師打了分
來源:互聯(lián)網(wǎng)   發(fā)布日期:2023-06-08 13:38:11   瀏覽:5811次  

導(dǎo)讀:一年一度的全民熱點 高考! 又來了! 每到這個時候,各大網(wǎng)站的熱搜頭條,必定被高考二字占領(lǐng),之所以那些網(wǎng)友們對高考的關(guān)注度這么高,除了自己曾經(jīng)也參與過高考之外,更多的還是心里想著,終于有人感受我曾經(jīng)的痛苦了! 而高考詞條中的語文作文,更是每位...

一年一度的全民熱點高考!

又來了!

每到這個時候,各大網(wǎng)站的熱搜頭條,必定被高考二字占領(lǐng),之所以那些網(wǎng)友們對高考的關(guān)注度這么高,除了自己曾經(jīng)也參與過高考之外,更多的還是心里想著,終于有人感受我曾經(jīng)的痛苦了!

而高考詞條中的語文作文,更是每位網(wǎng)友們逃不開的話題。

不到一天,和高考作文相關(guān)的微博,就達(dá)成了評論上萬,點贊十幾萬的成就。

而今年大家對于高考作文的討論,和往年有點不一樣。隨著 AI 大模型的井噴,大家也突然好奇起來了:如果用 AI 來寫語文作文,會是一個什么水平呢?

只不過對于這事吧,大家的意見好像并不怎么統(tǒng)一。有說現(xiàn)在的 AI ,寫作文水平已經(jīng)到了雙一流學(xué)生的水平了。

但也有專家說,現(xiàn)在 AI 寫作文,拿不了高分。

巧了嘛,咱們手上別的可能缺, AI 大模型那是一點也不缺的。世超也好奇,這個 AI 寫作文到底能是個啥水平?

實踐出真知,為了解決我這個疑問,我分別讓 6 大語言模型 ChatGPT 3.5/4 、百度文心一言、科大訊飛星火、 360 智腦、還有微軟 Newbing 各寫了一篇高考作文。

使用的是這次全國新高考 I 卷,題目是 “ 故事的力量 ” 。

為了讓這次的評測更有置信度,世超我還專門去找了一位語文老師,以滿分 60 分為標(biāo)準(zhǔn),對這六大語言模型進(jìn)行打分。

改分過程采用盲改形式,老師將不會知道他改的文章是由哪個模型寫的,最大程度上保證了公平性。

百聞不如一見,下面世超就把這六篇 AI 寫的文章和老師的打分評語給出來,不過呢,世超這里先不告訴大家,哪篇文章是哪個 AI 模型寫的,大家可以先猜一猜,等到文章結(jié)尾,再來給大家公布答案。

咱們先來看第一篇:

老師評語:得分 41 分。

立意基本準(zhǔn)確,無偏題現(xiàn)象。但是整篇文章泛泛而談,太空洞。在寫故事的三個部分的時候,過于浮于表面。同時缺少多樣的論證方法,全篇以道理論證為主。青少年應(yīng)該怎么做這一板塊里,沒有提出具體措施,只是一味強調(diào)故事是有力量的,重要的。

第二篇:

老師評語:得分 44 分。

立意準(zhǔn)確,但是寫的過于官方,盡量不要出現(xiàn) “ 首先、其次、最后 ” 等字眼,無個人深度思考。其中的亮點是提出了故事的力量具有兩面性,要避免故事的濫用。同時在怎么做一板塊中,從創(chuàng)作者、傳播者、聽眾這些角度出發(fā)進(jìn)行思考,是可取的。

第三篇:

老師評語:得分 48 分。

立意準(zhǔn)確,邏輯清晰嚴(yán)密。文章文學(xué)性較強,在第一段開門見山擺出觀點,善于運用舉例、引用等多種方式。但是每一段都在舉例,缺少更深度的辨析。最后怎么做這一板塊也論述的較為合理。比較明顯的失分點在于每段都在舉例,有堆砌材料湊字?jǐn)?shù)的嫌疑。

第四篇:

老師評語:得分 40 分。

立意基本符合,和第一篇很類似,都是浮于表面泛泛而談。把故事的作用在翻來覆去的說,沒有挖掘出故事作用的內(nèi)在重要性,也沒有例子加以佐證。盡量不要出現(xiàn) “ 首先、其次、最后 ” 等字眼,是很明顯的失分點。

第五篇:

老師評語:得分 39 分。

對于材料內(nèi)容切記不可直接引用,角度新穎,從個人思維、未來發(fā)展、民族形象等角度入手來論述?上]有說到如何開拓我們的思維,如何塑造我們對未來的價值觀和眼界,也沒有具體說如何展現(xiàn)民族形象的。說到底還是寫的不夠深刻,沒有閃光點。

盡量不要出現(xiàn) “ 首先、其次、最后、綜上所述 ” 等字眼。這不是論述類文本,這是議論文,通過表達(dá)觀點立場,加以論述分析自己的觀點。分析論述觀點是重點。

第六篇:

老師評語:得分 40 分。

立意基本符合,都是浮于表面泛泛而談。把故事的作用在翻來覆去的說,要論述的是獨特的故事與其價值認(rèn)知,少說國家,多討論青年成長!沒有挖掘出故事作用的內(nèi)在重要性,也沒有例子加以佐證。

第七篇:

老師評語:得分 49 分。

做好故事的概念詮釋是高下。誰的故事,誰講故事,故事講的好不好,故事的生活價值社會價值文化價值思考。

本篇文章并不像之前的文章切入點那么大,而是選取小的切入點,有條理的進(jìn)行分析。這是很不錯的。但是缺少一定的對于社會價值生活價值的反思,這是不能獲得高分的關(guān)鍵。

評分結(jié)束啦,不知道大家對這樣的打分滿不滿意呢?

大家可以先猜猜這七篇文章分別是哪個 AI 寫的,然后再看下面的答案。

第一篇和第二篇,分別是 OpenAI 的 GPT 3.5 和 GPT 4 。

第三篇是來自百度的文心一言。

第四篇是科大訊飛的星火。

第五篇是微軟的 Newbing 。

第六篇是 360 智腦。

最后一篇,則是阿里的通義千問。

其中得分最高的兩篇,分別來自咱們國內(nèi)的大模型,通義千問和文心一言,據(jù)這位老師說,之所以給通義千問高一分,主要是覺得文心一言的論證方法較為單一,沒有更深層次的思考,通義千問雖然切入口比較小,不過他能夠有一定的思考在里面。

總結(jié)到這次的題目和大模型作文,老師的看法是:

這次作文題目審題門檻低,但概念詮釋門檻高。立意基本不會出錯,不過要得高分很難。要談?wù)摢毺氐墓适屡c其價值認(rèn)知,少說國家,多討論青年成長。誰的故事,誰講故事,故事講的好不好,故事的生活價值、社會價值、文化價值思考,所以做好故事的概念詮釋是高下。

其實從這次的評分來看,現(xiàn)在的AI大模型,雖然很難拿到接近60分的高分,但是最高49分的表現(xiàn),在實際情況下,也超過了不少的中游學(xué)生。

單從這次作文的得分上來判斷,AI想要考頂尖大學(xué)恐怕還不行,但是,考一些稍好的普本應(yīng)該是沒啥問題。

不過也沒必要太焦慮,想想,畢竟連曾經(jīng)的圍棋之王柯潔都敗在AI手下,世超認(rèn)為,人類在考試上被AI全面超越也是遲早的事。

只不過,AI只是工具。工具越好用, 占便宜的,不還是我們嘛。

贊助本站

人工智能實驗室
相關(guān)內(nèi)容
AiLab云推薦
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機會 | 展會港