AI曰:我可以取代一切老師閱一切試卷

https://chat.openai.com/share/525e67be-54c2-4b63-9400-cdfe8c78230c

答案文件: 📎1.pdf 編碼:0a7d8d4f-696f-4bf1-be9c-e6eb0c839c12
測試答卷:編碼:a0255d08-6263-43a6-8b24-d328e78a48da
AI與人類閱卷結果對比
作為人類的我,幾道題目給的總分是9分;AI給的總分,也是9分。
但其實紅筆審閱並未完全依照參考答案,而AI肯定是完全依照的。
模型為3.5,4肯定會更準確。
結論
漢字手寫,是禍首罪魁
閱卷流程自動化的卡點,只剩下手寫了,公式與圖表等的識別,比手寫漢字其實更精準。而此刻的高中教學,此刻的高考,要求手寫,本身……就有點是笑話。
當然,是個正常的笑話。原因很簡單,當代社會的真實場景中,除特殊保密單位,沒人會手寫單位的文件的……那麼,教育中以高考方式要求日常必需手寫,骨子裡不過是對學生顯示出管制的權威,馴服其聽話罷了。在真實呈現學生思考,信息交互的應用場景中,手寫早已被淘汰。
手寫識別的插件還沒進入GPT商店,AZURE其實是有的,初步思考下肯定可以走通,只是成本有點高,懶得去梳理了。
悲觀看,這一卡點,基本沒可能在技術層面打破,因為,很不幸的是,在可以看到的範圍內,只有學校教育,還有大量手寫這玩意,這就意味著,不會有專門機構會開發更精準的手寫識別軟件來解決這個問題。
在這點上,漢字,又一次成為民族落後的罪魁。
本可以解放的教師閱卷
假設高考進化到真正的全球級機考測試,以GPT為代表,參考上述閱卷和此前我拿全國某一道題目用GPT-4的閱卷結果,AI已經可以取代教師的主閱地位。場景將更新為:
AI獲取答案數據並分析,獲取全部試卷數據並分析,
審閱給分,
說明每一分的理由;
人類教師,從原體力勞工位置解脫,只需要審核一個個結果,點擊確認,或者語音指令通過,或者直接點頭即可。
這個流程的精準程度,以此刻閱卷效果看,要高於真實人類教師。
學生視角
輸出自己的答案;
日常考試,AI告知每一個人答案與參考答案之間的每一處異同,學生針對性的據此複習所不足;
高考等篩汰考試:AI精準剖析每一個人答案與參考答案之間的每一處異同,因此可以開放查分,更加公開公平。
教師視角
不再有閱卷,只需審核AI閱卷的結果,確認發布;體系成熟後,甚至,可以不需人類教師再審核。
教師,只需要做那些必須人,才可以做的事情。
向來難
我知道理想向來難,但容易的事情,多沒意思。
https://pkuschool.yuque.com/qrvbic/alldata/dqusru8sxxgqg9r7?singleDoc#