cpami-captcha.mp4
最近在刷租屋,發現某個物件在建案旁邊,想要根據模糊的 Google Map 街景圖裡面的建照號碼,找出實際的建案,卻發現營建署的網站有夠難用 XD
既然有圖像驗證碼,那就來試試看辨識吧!
先跑 download_captchas.sh
下載圖像驗證碼:
./download_captchas.sh
再來對圖片做基本處理,移除雜訊、邊緣切割等:
deno run 1_processImage.ts
接著人工從 ./processed
裡面挑出 0~9 的數字圖片,並放到 ./original_templates
裡面,最後執行:
deno run 2_processTemplate.ts
最後就是測試辨識的環節!執行:
deno run 3_recognizeCaptcha.ts
本專案也實作了 Tempermonkey 能用的 UserScript,能在瀏覽器裡面直接辨識圖像驗證碼,請見 ./captcha.userscript.js。
- 首次使用 Deno 做不正經事,順便練習一下 TypeScript
- GPT4 醬使此專案的規模降為睡前專案等級,完整 Prompt 請見 https://sharegpt.com/c/3tvhdlp
- 臺北市建造執照公開資料:所以其實不用爬蟲了嘛