Suen

AI高考

做完 AI論語 和 AI紅樓夢,突然意識到,也許,還可以繼續走走。
這種感覺類似當初做論文文獻綜述,一旦開頭,點線而面,此面彼面,多層多面,就都來了。

最煩的還是架構問題。
AI論語 和 AI紅樓夢其實從來不是獨立的,而一直都是北京高考真題的二選一,10分。
所以,我真正在做的,其實是 AI高考。

高考的王道一直是真題,尤其在北京高考這種低水準命題模式下,就只能,且更是。
此前真題都是在教學網站給,從 Googlesite 到語雀,都是硬給,效果⋯⋯等於冇。這輪做互動網頁,原本就是想到學生刷網頁遊戲的一念而已;那麼,乾脆把真題都做了。

然後,今天上午先把數據 JSON 化。不做不知道,真題的數據整理精校,進度實在是不足 10%⋯⋯想想前些日子和學生聊把帽子扔過去的寓言;現在,沒別的,扔!

之所以非連做了精校,其實是因為這道題目的靈魂是信息梳理整合。現階段,以項目所用 LLM 的能力,如果 AI 給了和人類不一樣的答案,基本上,人類答案,就是錯的了。換言之,這道題的訓練,你就信 AI 即可。

詩詞和古文,都是之前專題整理過的資料,但後續還需要對 JSON 做調整,答案也需要做人工確認;現階段,也就算是能用。且,注意!古文的處理,LLM 都還功力迄今也沒那麼足,在我將人工答案整理錄入前,必須小心。

整理數據這事,估計要等到今年九月才可能完成。
畢竟,一個人,有限。

好消息是,今天下午下課後,開始代碼,本文寫到這一行,時間是 20:18,代碼在 30 分鐘前完成 1.0 版本,網站已經上線。

網址: https://gk.bdfz.net
嗯。


2025-03-27

昨天在 AI高考 一文說:

“整理數據這事,估計要等到今年九月才可能完成。
畢竟,一個人,有限。”

然後,今天完成!

X上我發文說了:

啊啊啊啊啊啊啊啊啊啊啊啊啊!
因為模型效果不好,我昨天手動清洗這個數據中的一部分,一小時清洗完非連⋯⋯
今天,Gemini 2.5 Pro Experimental 03-25 模型,用 10 幾分鐘,把我計劃到今年九月才可能整理完的數據,清洗完了!

這就很⋯⋯神!
一直盯著屏幕上每年的數據審閱,整個處理過程,比我自己要周密。
當然,也是因為這次我以2024年為範例,徹底重構了各題目 JSON 化的基本邏輯,然後,寫了一個超級複雜的指令。

原本擔心模型會做不出,還想拆分任務;但又轉念,雖然過於複雜又何妨一試,做不出來再簡化任務就好。結果⋯⋯低估模型了,效果是真的嚇人。
中間斷開三次,要求繼續,就直接繼續了。
Token count : 333,554/1,048,576。

那,精進之!上傳新 data 數據,改代碼邏輯,將微寫作大作文指令一併寫入。替換下之前 AI論語 / AI紅樓夢 。哦,還有默寫網站:高考默寫
這兩個高考訓練網頁原本就是備考用,本該獨立。
那麼。完工。

現在的效果是,每一年的所有題目,都已經錄入可見。
任何一個北京考生,都可以隨時:

後續完善人類參考答案進去,就是純體力活了。
嗯。


2025-04-01

學生建議,所以版本更新。

之所以加速處理古文,是因為昨天突然發現,現在的模型在古文題目上,分析和答案都已經很精準,前幾天課上跟學生還說,這個網站最要小心使用的就是古文。
現在,臉疼。
但,人類被羞辱,好事。

2025-04-02

再次重構頁面,原來上下,不利於邊看題邊做題,現在左題右答,好些了。

後續更新點:

2025-04-04

沒法硬剛GFW,繞⋯⋯
AI高考 🦁 | AI論語 🐭 | AI紅樓 🐌 | 高考默寫 🦉 | AI課文現在應該都可以無牆使用 AI 了。
已加入網站統計。

AI 回覆速度依舊沒有解決,會很慢慢慢⋯⋯

#AI #高考