Python

【Python】TwitterAPI v2でツイート検索結果の画像を一括保存する

この記事は約5分で読めます。

 

Pythonを使用してTwitterAPIでツイート検索結果の画像を一括保存するため方法について紹介します

 

前準備

 

1. TwitterAPIのアクセストークンを取得する

TwitterAPIを使用するには、Twitterの開発者アカウントを作成し、アプリケーションを作成して、アクセストークンを取得する必要があります。アクセストークンを取得する方法については、以下のURLを参照してください。

https://developer.twitter.com/en/docs/authentication/oauth-1-0a

 

2. ライブラリをインストールする

PythonでTwitterAPIを使用するためには、requestsというライブラリを使用することが一般的です。requestsをインストールするには、ターミナルで以下のコマンドを実行してください。

 

pip install requests

 

3. ツイート検索のクエリを作成する

検索したいキーワードやハッシュタグなどから検索クエリを作成してください。画像を検索するにはパラメーターとして「has:images」とすることで画像ツイートのみを検索対象とすることができます。

 

なのでクエリは以下のように「<検索キーワード> has:images」としてあげます。

 

'水星の魔女 has:images'

 

TwitterAPI v2でツイート検索結果の画像を一括保存する

 

import requests
import os
import json

#定数の設定
bearer_token = 'API鍵取得済のアカウントのベアラートークン'

search_url = "https://api.twitter.com/2/tweets/search/recent"
query_params = {'query': '水星の魔女 has:images', 'expansions': 'attachments.media_keys', 'media.fields': 'url', 'max_results': 10}

#画像URLを格納するリストを作成
image_urls = []

#認証用の関数
def bearer_oauth(r):
    r.headers["Authorization"] = f"Bearer {bearer_token}"
    r.headers["User-Agent"] = "v2RecentSearchPython"
    return r

#検索エンドポイントに接続してJSONを取得する関数
def connect_to_endpoint(url, params):
    has_next = True
    while has_next:
        #APIを叩いて結果を取得
        response = requests.get(url, auth=bearer_oauth, params=params)

        #ステータスコードが200以外ならエラー処理
        if response.status_code != 200:
            raise Exception(response.status_code, response.text)

        #responseからJSONを取得してループを回し、URLを追加していく
        json_response = response.json()
        # print(json_response)
        for image in json_response['includes']['media']:
            try:
                image_urls.append(image['url'])
            except:
                pass

        #次のページがあるかどうかを確かめ、あればquery_paramsにnext_tokenを追加
        has_next = 'next_token' in json_response['meta'].keys()
        if has_next:
            query_params['next_token'] = json_response['meta']['next_token']

#実行
try:
    connect_to_endpoint(search_url, query_params)
except:
    pass

#結果の確認
print('取得した画像数',len(image_urls))

for image_url in image_urls:
  response = requests.get(image_url) 
  img_name = image_url.replace('https://pbs.twimg.com/media/','')
  with open(img_name, 'wb') as saveFile: 
    saveFile.write(response.content)

 

これを実行すると検索でヒットした画像が実行したディレクトリの直下に画像が出力されます。

 

 


プログラミング・スクレイピングツール作成の相談を受け付けています!

クラウドワークス・ココナラ・MENTAなどでPython・SQL・GASなどのプログラミングに関する相談やツール作成などを承っております!

過去の案件事例:

  • Twitter・インスタグラムの自動化ツール作成
  • ウェブサイトのスクレイピングサポート
  • ダッシュボード・サイト作成
  • データエンジニア転職相談

これまでの案件例を見る

キャリア相談もお気軽に!文系学部卒からエンジニア・データサイエンティストへの転職経験をもとに、未経験者がどう進むべきかのアドバイスを提供します。


スポンサーリンク
/* プログラミング速報関連記事一覧表示 */
ミナピピンの研究室

コメント

  1. […] 【Python】TwitterAPI v2でツイート検索結果の画像を一括保存する […]

タイトルとURLをコピーしました