SUEN

真 AI 閱卷報告

因為要逐一審視 OCR 結果和評卷質量,且當時 Gemini API 官方的多模態未正式可用;所以如下的上次,是手動拖拽了圖片給網頁 Gemini ,再拉回識別結果,人負責人工,AI 負責智能。 很笨,但啟程。

AI 閱卷報告

2025-04-24

語文試卷中一道主觀題,手寫,4-5行,每行約20字,701份,高質量審閱評分,一個教師,高強度的話大概要多少個小時完成?

進化到今天,上午考完,下午開始構想如何更新。

首選 Gemini CLI ,一段長指令下,確實能跑通:

指令1.0
你现在要在浏览器里批改语文试卷,请严格按下面顺序操作,不要跳步。
1. 打开并登录
• 访问:https://yue.k12media.cn/testmate/index.html#/marking
• 用户名:
• 密码:
• 如果出现任务列表或弹窗,进入当前任务的批阅页面,直到看到左侧是试卷图片、右侧是打分/提交区域的界面。
2. 页面识别 • 确认你所在的是批阅界面,右侧能看到本题的得分输入框、对勾/叉或“提交”按钮。 • 如果不是本题,先切到这道题再开始识别。 3. 提取答题内容(OCR) • 对当前显示的这道题的学生手写答案区域进行截图/识别,识别为简体中文文本。 • 要求识别结果尽可能保持学生原有语序,用于后面比对,不要自行润色。 4. 参考答案与评分标准(固定内容)批改这一题时,请把学生答案和下面这段参考答案、评分说明逐条对照:参考答案:①塑造人物形象。吉米的父亲看到蝙蝠就飞起刷子扔过去,说明父亲身手矫健(1 分),最终吉米抓住蝙蝠,先关在笼子里,但晚上的时候两个人又把蝙蝠放生,刻画出吉米的善良和对生命的尊重呵护。(1 分)②烘托离别情绪。(1 分)离别在即,厨房里的任何一件事物都能让吉米想起之前的事情,一个洗碗刷,背后有父子两人抓蝙蝠、放飞蝙蝠的温馨往事。(1 分)可以想象,其他的东西也同样有不同的故事,小说虽然不一一提及,但通过这一细节,可以给读者充分的想象空间,可以想象这个厨房承载着吉米多少的回忆。(1 分)评分说明: • 人物方面:能结合文本分别回答出这一细节中体现的父亲的形象和吉米的形象,各 1 分。 • 情节/作用方面:能结合“洗碗刷—抓蝙蝠—放蝙蝠”等文本细节答出“烘托/渲染离别情绪”得 1 分,只说“离别情绪”不得分。 • 能答出这一细节的作用(如“承载着家庭的温馨回忆”“给读者想象空间”等)再得 1 分。 • 学生表述若与参考答案同义、表达接近,也应给分。 5. 给分规则(请在本次操作中固定使用) • 先把学生答案拆成几点,看他有没有: 1. 写到父亲形象(抓蝙蝠、动作利索/身手矫健) 2. 写到吉米形象(善良、尊重/呵护生命、放生) 3. 写到烘托离别情绪并且是结合这一厨房细节说的 4. 写到这一细节的作用(承载回忆 / 给想象空间 / 厨房有很多故事) • 学生写到哪几条,就给对应条目的分。 • 如果学生只空泛写“体现离别情绪”没有扣到这个细节,不给这一条的分。 • 如果本题右侧有总分(比如 4 分),就按上面四点对应到 4 分写入。 6. 写入并提交 • 在右侧打分区,把刚才算出的分数填进去(对应本题的分数框)。 • 如果有“对/错”按钮不影响分数,就保持默认或根据页面要求点一下。 • 点击“提交”或本页面的确认按钮,确保当前这份试卷的这一题已经记分成功。 7. 进入下一份/下一张 • 回到批阅列表或使用页面里的“下一份”按钮,切到下一份学生的同一题目。 • 重复步骤 3~6。 • 一次只处理一份,提交后再处理下一份,直到没有新卷或我让你停下。 8. 异常处理 • 如果某一份的图片没有加载出来、被遮挡、或字迹无法识别,请在这份上填 0 分并提交,然后继续下一份。 • 如果页面弹出登录失效,按第 1 步重新登录后继续刚才未完成的那一份。

Screenshot 2025-11-10 at 23.30.30.png (20251111002)

進化了到指令 5.0 版本,增加讀源碼拼原圖,簡化點擊步驟,但⋯⋯還是真慢,且處理不好加載環節,最終放棄。
昨天剛給 Gemini CLI 加了 MCP 設定檔,但閱卷這種多點擊多互動,此刻,還是有點幼年。 但一如整個 AI,Gemini CLI 會以可怕的速度進化,且一旦完成,沒有任何代碼基礎的人,閱卷也可以全自動了就。

Screenshot 2025-11-11 at 01.17.04.png (20251111003)

另一台機器最近用 Gemini CLI,其實已經是自己叫累的成精狀態了。

IMG_1816.jpeg (20251111001)
是真可期。

偷懶不成,沒必要也不想再人工體力,那麼,開抓。
這個閱卷網站⋯⋯是足夠原始的。

開源:

text
bash <(curl -Ls https://raw.githubusercontent.com/ieduer/bdfz/main/yue-auto-mark.sh)

指令硬寫入上述腳本,還是很從嚴了。

Screenshot 2025-11-11 at 07.12.42.png (20251111004)

GPT 計算的費用成本是:

•	輸入:$0.30 / 1,000,000 token
•	2,000 token × $0.30 / 1,000,000 = $0.0006 / 份
•	輸出:$2.50 / 1,000,000 token
•	700 token × $2.50 / 1,000,000 = $0.00175 / 份
•	$0.0006 + $0.00175 = $0.00235 / 份
    試卷總量: 848 份 × $0.00235 ≈ $1.99 美金

用付費 API 是因為高密度做一個任務,輪詢多 API 也會被群封。
且,這件事,本該有成本。

時間成本?
至 23:25 閱卷完成。

所有學生的題目答案,圖版,識別文字版,每一份批閱分數和理由,都存檔,不發,備查。
想像一下,你可以查到自己每一道題目批閱分數,不才對嗎?
依舊如上次的問題:高考,什麼時候把草台閱卷班子拆了⋯⋯

未來的教育嗎這是?
NO,這是已來的。


順手,把 789,035 tokens 的數據給 Gemini,要求:

Screenshot 2025-11-11 at 08.15.55.png (20251111005)

好的,这份详尽的阅卷数据为了解学生在现代文阅读理解中的共性问题提供了极佳的样本。通过对这份日志文件的深入分析,我们可以清晰地看到学生们的优势、普遍存在的不足,并据此提出通往满分的具体学习建议。

I. 核心采分点回顾

首先,我们再次明确本题的四个核心采分点(根据提供的满分答案和多数批改日志反推,此题满分应为4分或6分,但评分要点是固定的,此处以4个核心要点为准):

  1. 父亲形象 (1分): 通过“看到有只蝙蝠,扔过去正好卡住”这一细节,展现父亲身手矫捷、行动果断的形象。
  2. 吉米形象 (1分): 通过“逮住后先关在个笼子里…待到天黑,我们就把它带到湖边去放了”这一细节,刻画出吉米(父子二人)善良、尊重和呵护生命的品质。
  3. 烘托离别情绪 (1分): 在“离别在即”的大背景下,“我”看到厨房里一个普通的物件(洗碗刷),便能回忆起一段温馨的往事(抓蝙蝠、放蝙蝠),这种“睹物思情”的方式,有力地烘托了“我”对这个家深深的不舍与留恋
  4. 细节作用 (1分): 这种写法“以小见大”。作者只写了一个洗碗刷背后的故事,但暗示了厨房里每一件物品都承载着类似的美好回忆。这为读者提供了充分的想象空间,让读者自行补完那些未曾言说的、充满生活气息的家庭故事,从而深化了情感的浓度。

II. 学生答案共性优势分析

从得分情况看(多数学生得分在1-2分),学生们普遍具备一定的基础阅读能力和情感感知力。

  1. 能感知到“离别情绪”与“回忆”的关联: 这是得分最集中的一点。绝大多数学生都能意识到,作者详细描写厨房和蝙蝠的故事,是为了表达“不舍”、“留恋”、“怀念”等情感。他们成功地将“回忆往事”和“离别”这两个核心概念联系了起来。
  2. 能识别关键事件: 很多学生能够准确指出“洗碗刷”引出了“抓蝙蝠”或“放蝙蝠”的故事,表明他们能够抓住情节的关键节点。

III. 学生答案共性不足分析(失分点重灾区)

尽管有上述优势,但绝大多数学生未能拿到3分或满分,暴露出以下几个关键且共性的问题:

  1. 人物形象分析“脸谱化”,未能与具体行为挂钩: 这是失分最多的地方。

    • 关于父亲: 学生们常常用“随性”、“不拘小节”、“有生活情趣”、“关爱孩子”等非常笼统的词语来概括父亲形象。这些评价虽然不算错,但完全没有抓住题目所给细节的核心。那个瞬间的动作——“飞起刷子扔过去正好卡住”,最直接体现的是行动的敏捷与果断(即“身手矫捷”)。阅卷日志中反复出现“学生未提及父亲在处理蝙蝠时的具体动作细节”,说明学生们忽略了从动作本身出发去分析人物。
    • 关于吉米: 同样的问题也存在。很多学生只提到“父子关系好”、“生活温馨”,或者只说了“抓了蝙蝠”。他们忽略了整个事件的闭环——“逮住”、“笼养”、“天黑后带到湖边”、“放生”。真正体现吉米(父子)品质的,恰恰是最后的“放生”行为,它升华了整个事件,展现出对生命的尊重与呵护。阅卷日志中也频繁出现“学生未提及吉米(或‘我’)在对待蝙蝠时的善良、尊重生命或放生等具体行为”。
  2. “烘托离别情绪”的分析逻辑链不完整:

    • 虽然很多学生提到了“不舍”和“回忆”,但他们的分析往往缺少了关键的触发条件和背景。一个完整的分析逻辑应该是:在即将远行离别的背景下(情境) → “我”看到了厨房里一个普通的洗碗刷(物件) → 由此想起了与之相关的抓蝙蝠的往事(回忆) → 这种温馨的回忆加剧了此刻离别的不舍(情感升华)
    • 许多学生只说了“回忆往事体现了不舍”,但没有点明是“看到洗碗刷”这个物件触发的,也没有强调这是在“离别在即”这个特殊时刻,导致分析不够精准、深刻。
  3. “细节作用”的理解浅层化、套路化:

    • 这是最考验文学鉴赏能力的一点,也是高分和普通分的“分水岭”。
    • 很多学生会使用“承上启下”、“推动情节发展”、“吸引读者兴趣”等“万金油”式的套话。这些话本身没有错,但没有解释清楚这个细节在此处独特作用
    • 本题中,这个细节的深层作用在于**“以小见大”和“留白”。作者只用一个洗碗刷的故事,就让读者联想到,这个厨房里的炉子、水槽、桌子、扫帚……每一件物品背后都可能有一个类似的故事。它打开了一个想象空间**,让读者自行去填充那些未被讲述的、父子间无数个温馨的日常瞬间。阅卷日志中的评语“未能明确指出细节能让读者联想到厨房承载的回忆或提供想象空间”精准地指出了这个问题。

IV. 满分学习建议

结合以上分析,想要在这类题目中拿到满分,建议从以下四个方面进行针对性训练:

  1. 回归文本,“抠”准动作细节:

    • 训练方法: 在分析人物形象时,强制自己不要先下结论(如“父亲很爱孩子”),而是先找到文本中描写该人物的具体动词。问自己:“他做了什么?”(He threw the brush.)然后,再问:“这个动作体现了什么?”(敏捷、果断)。同样,对于吉米,关键动作是“放生”,它直接导向“尊重生命”的品质。
    • 满分思维: 人物形象不是靠形容词堆砌的,而是靠具体行为支撑的。分析 = 描述具体行为 + 提炼人物品质
  2. 建立“情境-媒介-回忆-情感”的完整逻辑链:

    • 训练方法: 在分析情感烘托时,学会寻找一个完整的逻辑链条。问自己四个问题:
      • (情境) 主人公此刻正处于什么特殊的情境下?(即将离别)
      • (媒介) 是什么东西触发了他的情绪或回忆?(一个洗碗刷)
      • (回忆) 他想起了什么具体的往事?(抓蝙蝠和放蝙蝠)
      • (情感) 这段回忆如何影响了他此刻的情感?(美好的回忆加剧了离别的不舍)
    • 满分思维: 将这四要素串联起来,就能形成一个逻辑严密、论证充分的答案,而不是简单地说“回忆了过去,所以不舍”。
  3. 深挖作用,拒绝“万金油”式套话:

    • 训练方法: 在回答“作用/用意/好处”这类问题时,除了想到“承上启下”等基本作用外,要多问自己一句:“作者只写了A,是不是想让我们读者去想象B、C、D……?”
    • 满分思维: 学会使用**“以小见大”、“言有尽而意无穷”、“留白”、“提供想象空间”**等更高级的鉴赏术语。要能解释清楚:作者通过一个洗碗刷的故事,成功地让整个厨房“活”了起来,让读者相信这个空间里充满了无数未曾言说的温暖故事。这正是从“文本内容”到“读者感受”的升华。
  4. 拆分要点,分条作答,确保全面性:

    • 训练方法: 拿到题目后,先在草稿纸上列出可能的采分点(如:父亲形象、吉米形象、情感、手法等)。然后逐一思考,分点作答。
    • 满分思维: 优秀的答案(如题目给出的范例)结构都非常清晰,通常会从“人物塑造”和“情节/情感”两个大方面入手,再在每个方面内部细化。这样做可以确保覆盖所有采分点,避免遗漏。

总结: 从“能读懂”到“会分析”是现代文阅读高分的核心。关键在于将模糊的情感感知,转化为对文本具体细节(动作、物件、情境)的精确分析,并构建起严谨的逻辑关系。通过刻意练习上述四点,学生将能更有效地突破瓶颈,向满分迈进。