SUEN

四個小時,失敗紀錄⋯⋯

開學,例行下載新的電子版教材。

好消息是,現在的 https://basic.smartedu.cn/elecEdu?defaultTag=fa6200b8-b4aa-4d72-bebb-dddd93022a13%2Fd1914cee-dbcc-44e6-bab3-74eeed0e9875%2F0a724f60-913a-4c39-90a3-f9ce4c899e7b 直接inspect就可以在網頁標籤下載原文件,去年7月時,還必須登陸必須自己修改鏈接纔可以。

下完,犯懶,想直接讓機器做去年和今年同一本教材的文件對比。

四個小時折騰後,失敗。

命令行方式:

brew install poppler

pdftotext file1.pdf file1.txtpdftotext file2.pdf file2.txtdiff file1.txt file2.txt導出文件沒有對比意義⋯⋯細化下brew install wdiff colordiff ahawdiff -3 file1.txt file2.txt | colordiff | aha > diff_output.html依舊沒意義。更換思路,找來i-net PDFC,前幾十頁效果很驚艷,能直接標示出第六頁學習提示內有沒有刪除引文出處的區別,也標示了去年和今年,從“詠歌”到“永歌”的變化。但全本左右的對接還是不夠智能,對比意義也就上述兩點。明顯可見的是排版有變化,以阿Q為例,舊版一行的字數要少於新版一行字數。好消息是,新版終於刪除了右下角隱藏的“統編版”水印。前幾天下了Adobe Acrobat DC一直猶疑裝不裝,為對比,裝;結果兩個文件對比後直接不能導出⋯⋯廢。折騰完,想想,何必呢。反正每一課都已經被我網頁化,慢慢逐課校對,和學生讀到哪就校到哪,就可以了。網頁,是有版本記錄的。我每一次更動,自然就是版本的變化說明了。嗯。把教材扔學生大群,收工。其實,想折騰的,可以自己下載i-net PDFC,拆分pdf成為50頁的幾個文件,做對比,會很容易也很可觀。