SUEN

AI曰:我可以取代一切老師閱一切試卷

https://chat.openai.com/share/525e67be-54c2-4b63-9400-cdfe8c78230c


答案文件: 📎1.pdf 編碼:0a7d8d4f-696f-4bf1-be9c-e6eb0c839c12

測試答卷:編碼:a0255d08-6263-43a6-8b24-d328e78a48da

AI與人類閱卷結果對比

作為人類的我,幾道題目給的總分是9分;AI給的總分,也是9分。

但其實紅筆審閱並未完全依照參考答案,而AI肯定是完全依照的。

模型為3.5,4肯定會更準確。

結論

漢字手寫,是禍首罪魁

閱卷流程自動化的卡點,只剩下手寫了,公式與圖表等的識別,比手寫漢字其實更精準。而此刻的高中教學,此刻的高考,要求手寫,本身……就有點是笑話。

當然,是個正常的笑話。原因很簡單,當代社會的真實場景中,除特殊保密單位,沒人會手寫單位的文件的……那麼,教育中以高考方式要求日常必需手寫,骨子裡不過是對學生顯示出管制的權威,馴服其聽話罷了。在真實呈現學生思考,信息交互的應用場景中,手寫早已被淘汰。

手寫識別的插件還沒進入GPT商店,AZURE其實是有的,初步思考下肯定可以走通,只是成本有點高,懶得去梳理了。

悲觀看,這一卡點,基本沒可能在技術層面打破,因為,很不幸的是,在可以看到的範圍內,只有學校教育,還有大量手寫這玩意,這就意味著,不會有專門機構會開發更精準的手寫識別軟件來解決這個問題。

在這點上,漢字,又一次成為民族落後的罪魁。

本可以解放的教師閱卷

假設高考進化到真正的全球級機考測試,以GPT為代表,參考上述閱卷和此前我拿全國某一道題目用GPT-4的閱卷結果,AI已經可以取代教師的主閱地位。場景將更新為:

AI獲取答案數據並分析,獲取全部試卷數據並分析,

審閱給分,

說明每一分的理由;

人類教師,從原體力勞工位置解脫,只需要審核一個個結果,點擊確認,或者語音指令通過,或者直接點頭即可。

這個流程的精準程度,以此刻閱卷效果看,要高於真實人類教師。

學生視角

輸出自己的答案;

日常考試,AI告知每一個人答案與參考答案之間的每一處異同,學生針對性的據此複習所不足;

高考等篩汰考試:AI精準剖析每一個人答案與參考答案之間的每一處異同,因此可以開放查分,更加公開公平。

教師視角

不再有閱卷,只需審核AI閱卷的結果,確認發布;體系成熟後,甚至,可以不需人類教師再審核。

教師,只需要做那些必須人,才可以做的事情。

向來難

我知道理想向來難,但容易的事情,多沒意思。

https://pkuschool.yuque.com/qrvbic/alldata/dqusru8sxxgqg9r7?singleDoc#