機械学習に用いるデータセットの作成はしんどいとよく聞きます.画像認識であれば少なくとも数百,数千枚は必要なので,自動でダウンロードしてラベル付けすれば少しは楽になりそうですね.
サーバに SSH 接続はできるが,外部に公開しているポートが接続しているものの他にはなく,これでは余ってるポートを使ってアプリを動かすなんてことができないので,ローカルポートフォワーディングすることにした.
Tweepy のリファレンスだけを見ると気づきにくいですが,twitter の API リファレンスも参照すると,friends や followers は最大 5,000 人までしか取得できないと書かれています.
twitterfeed という外部サービスを利用していましたが,つぶやくタイミングとか調整できませんし,シンプルなものを自分で実装したくなりました.
これまでは twitter bot に使う consumer key や access token の値をソースコードに直に書いていたのですが,ソースコードが漏れるとそれらの値も流出してしまいます.
Twitter BOT を自作するという例は山ほどあります.言語も PHP や Ruby, Java など様々ですが,今回は Python で書いていきます.