SUEN

AI 閱卷記

上次說這次閱卷把前端做了:

監考時順便完善好:

Screenshot 2026-04-27 at 05.58.09.png (20260427008)

還願:

Screenshot 2026-04-27 at 05.28.43.png (20260427004)

Screenshot 2026-04-27 at 05.28.59.png (20260427005)

整理好分點答案:

Screenshot 2026-04-27 at 06.15.33.png (20260427011)

做兩次試評:

Screenshot 2026-04-27 at 05.29.28.png (20260427006)

一則是人工看下評閱,一面也為對比不同模型效度:

Screenshot 2026-04-26 at 23.32.33.png (20260427001)

Screenshot 2026-04-26 at 23.35.35.png (20260427002)

Screenshot 2026-04-26 at 23.37.29.png (20260427003)

為什麼不能 DeepSeek⋯⋯

因為 API 不能 OCR⋯⋯
對比中能評分是因為把 Gemini 識別到的文字按一樣指令給過去了。

實際對比測試的結果如上圖: 一次能用的,
一次不回的,
一次評分不靠譜的。

能不能幹活能不能穩定幹活,就是一切⋯⋯

基於試閱選擇了 OCR 效果最好的 gemini-3.1-pro-preview ,比 2.5 確實要貴:

Screenshot 2026-04-27 at 05.29.42.png (20260427007)

這個費用也是因為選擇了 Thinking 的 High 最高等級。併發 5 份,從打理網站到最後全部閱完,大致 6 個小時。
網站對評閱做了詳細數據記錄,下載例行喂給:

Screenshot 2026-04-27 at 06.02.50.png (20260427009)

一個髒東西 PPT 就自動有了:
Screenshot 2026-04-27 at 06.09.38.png (20260427010)

本次語文閱卷共完成批閱834份學生作答,該題滿分為4分,全體學生的平均得分為2.05分。以下將從整體分值分佈到具體知識點得分率,為您進行全面、具體且深刻的答題數據透析:

一、 整體分值分佈透析

從834名學生的總體得分情況來看,分值分佈呈現出極為典型的「紡錘形(常態分佈)」特徵:

二、 核心知識點(踩分點)得分率深度透析

數據顯示,學生在四個維度的知識點掌握上存在巨大的差異,這直接反映了當前學生在現代文閱讀理解中的能力短板:

1. 引用論證作用(point_quote_yinjiu)—— 命中率:85%(709人/834人)

2. 結構作用分析(point_jiegou_chengyin)—— 命中率:55.8%(465人/834人)

3. 田園意境刻畫(point_tianyuan_jingjie)—— 命中率:51.6%(430人/834人)

4. 哲理具象化手法(point_xuanli_shiyi)—— 命中率:13.1%(109人/834人)

三、 綜合診斷與後續指導建議

綜合上述數據,學生的作答呈現出**「懂套路、明大意,但缺細節、乏深度」**的群體畫像。

在後續的教學與訓練中,建議針對性解決以下問題:

  1. 戒除「空泛套話」:嚴格要求學生在回答「承上啟下」「豐富文章內容」「深化主旨」等術語時,必須緊跟文本具體的關鍵詞(如本文中的「自然」、「心遠」),做到「詞不離句、句不離段」。
  2. 培養「立體」答題思維:面對「某段/某句引文有何作用」的題型,必須強制要求學生從三個維度進行掃描:內容主旨(寫了什麼境界/印證了什麼觀點) + 篇章結構(與前後文的邏輯關聯) + 藝術手法與效果(如化虛為實、哲理具象化等),以此來攻克得分率僅為13.1%的深層鑑賞難題。

網站開放使用,自備 API 即可: https://mark.bdfz.net