欧美成人动态图_久久国产古代三级毛片视频_性一交一伦一A级_国产精品久久久久久久久久久免费看_爱情岛论坛专线一

今天,大模型都是高考生-環(huán)球播報(bào)

時(shí)間:2023-06-07 21:23:45來源:多知網(wǎng)
AI 高考作文大比拼。

來源|多知網(wǎng)


(資料圖片僅供參考)

作者 |王上

圖片來源 |Pexels

又逢高考,每年作文都是社會(huì)關(guān)注的重點(diǎn)話題。作文的命題是選拔人才的風(fēng)向,也體現(xiàn)了價(jià)值觀的引領(lǐng)。

在各家大模型征戰(zhàn)的當(dāng)下,高考可以說是一個(gè)真刀實(shí)槍的競(jìng)技場(chǎng)。多知網(wǎng)選取了北京卷大作文,要求二選一,以 " 亮相 " 為主題寫一篇記敘文,或以 " 續(xù)航 " 為主題寫一篇議論文。多知網(wǎng)分別讓 GPT-4、ChatGPT ( 3.5 ) 、文心一言、通義千問、訊飛星火予以作答。

在同一題目的競(jìng)技下,各家可以說都具備寫作的能力,但是水平不一。

從審題方面來說,文心一言還需提升,它寫了兩篇,沒理解題目 " 任選一 " 的含義。

有意思的是,提問方面,首先假設(shè)了各大模型就是一名高考生,沒有設(shè)定身份。在這種情況下,GPT-4、ChatGPT ( 3.5 ) 、文心一言、通義千問、訊飛星火都選擇了寫以 " 續(xù)航 " 為主題的議論文。

在給了提示詞,設(shè)定了 " 作文水平很高的北京高中生 " 的身份證后,有的大模型有所進(jìn)步,有的則會(huì)更糟糕。值得注意的是,在設(shè)定了身份之后,只有 GPT-4 選擇了以 " 亮相 " 為主題的記敘文。

從體裁來看,各個(gè)大模型都理解體裁之間的區(qū)別,也給出了相應(yīng)的書寫要求??梢钥吹剑洈⑽牡捏w裁更難一些,門檻更高。

從文采來看,ChatGPT 比較嫻熟,GPT-4 更勝幾籌。

GPT-4 與 ChatGPT 相比,GPT-4 能力更強(qiáng),從理解能力、語(yǔ)言組織能力和流暢度等都高出幾個(gè)維度。

值得注意的是,除了 ChatGPT 之外,其余幾個(gè)大模型均未提煉出有亮點(diǎn)的作文題目。

以下為各家大模型的作答情況及點(diǎn)評(píng):

01

考生姓名:GPT-4

點(diǎn)評(píng):結(jié)構(gòu)完整,論點(diǎn)比較詳實(shí)。

加了提示詞 " 作文水平很高的北京高中生 " 后再提問的效果——

點(diǎn)評(píng):一篇非常生動(dòng)的記敘文,結(jié)構(gòu)完整,語(yǔ)言流暢。

02

考生姓名:ChatGPT

點(diǎn)評(píng):言之有理,論點(diǎn)鮮明,邏輯清晰。點(diǎn)評(píng):有提示詞后更勝一籌,優(yōu)點(diǎn)是兩篇都有完整的作文題目。

03

考生姓名:文心一言

點(diǎn)評(píng):文心一言可能有糾結(jié)癥,先寫了 " 續(xù)航 ",又補(bǔ)充了一篇 " 亮相 "。此外,兩篇都是議論文,不完全符合體裁要求。點(diǎn)評(píng):文心一言加入提示詞后,讀懂了題目。依然選擇了 " 續(xù)航 " 這一主題,語(yǔ)言表達(dá)比第一次有所進(jìn)步。

04

考生姓名:通義千問

點(diǎn)評(píng):讀懂了題目,也懂題材。看起來中規(guī)中矩。不過,不懂為什么在倒數(shù)第二段夾雜了一段 " 亮相 "。點(diǎn)評(píng):更糟糕了。

05

考生姓名:訊飛星火

點(diǎn)評(píng):讀懂了題目,也懂體裁。還有一段結(jié)合實(shí)際的小例子,看起來比較符合要求。點(diǎn)評(píng):加了提示詞后,審題錯(cuò)誤寫了兩篇。值得肯定的是,明白體裁的區(qū)別。不過,情節(jié)略顯單薄。

您覺得哪家大模型更符合考官的評(píng)卷標(biāo)準(zhǔn)呢?可以在文末的留言區(qū)告訴我們。

關(guān)鍵詞:

相關(guān)資訊
熱門頻道