画像比較ツール
Hashファイル無しで、単純に比較だけする機能が欲しいと思った。
その延長で、Hashファイルに追加する画像ファイル内に重複があった場合に、その重複が見つけられないままHashファイルに追加されてしまうことに気がついた。
そして既に実行した分で、重複したまま保存されているかもしれない。
ということで、ハッシュデータ内の重複チェック処理を作って、Hashファイル内での重複チェックをできるように追加。
これで画像追加した際の重複削除忘れや誤ってresult.htmlを消してしまっても、削除すべきファイルを見つけられるようになた。
加えてHashファイルに画像を追加する際も追加分するファイルの中で事前にチェックするように修正。
で、最初に思った、画像比較だけしたい機能のインターフェイスはまだ作ってない。
既に実施した分で、重複登録はやっぱりあった。
宝くじ。
ダウンロードした個別の当選番号ページから当選番号を取得するのはできたが、静的なページは一部の古い結果だけで、基本はJavaScriptで読み込んでいるので、単純にRequests()で読み込んでもダメみたい。
やっぱり、Seleniumを使う必要がありそう。
PCのPythonでもSeleniumを使えるようにできるみたいだけど、ちょっと面倒なので、とりあえずGoogle Colaboratoryでやることにする予定。