S&P500の企業リスト/ドメイン/企業URL/ロゴ

今年の値動きをSpreadsheetでS&P500のデータを見ていました。

この時に思いつきで「Ticker Symbolを見て「企業ロゴ」を入れる」仕様にしました。

思ったより手間で記事にしておきます。オッサンなので書いておかないと忘れるのです。

 

ClearbitのロゴAPIを利用

「企業のドメインからロゴを取得する」APIを、Clearbitという企業が無料で公開しています。精度は完璧ではありませんが助かりますね。

Spreadsheetで下記の様に打つとソフトバンクのロゴが表示されます。

=image(“https://logo.clearbit.com/softbank.com”)

後術のSpreadsheetではAppscriptで関数化しています。

 

S&P500企業のURLリストがなかった!

APIの入力パラメータとして「企業ドメイン名」が必要でしたが、「S&P500の企業URLリスト」が揃っているページを見つけられませんでした。止む無くPythonでWikipediaからS&P500企業リストのページから、各企業のWikipediaページを取得し、そこから企業URLを取得しcsvで吐き出すプログラムを書いて、Spreadsheetに貼り付けました。(なので自動更新ではありません。)

 

S&P500企業のログ一覧のSpreadsheetのページはこちら 

Googleアカウントでログインしてコピーすれば使えます。プログラム書かないと取得できなかったので備忘録も兼ね記事にしておきます。

.PNG

 

S&P500の企業Wikiをスクレイピングして、企業URL一覧のCSVを作るGoogle Colabはこちら

こういうプログラムが、僕の様な初級者でも25ステップ程で書けるPythonって素晴らしいですね。ですが、汎用性はなくWikipediaの仕様が崩れたら動かないですね。一応企業の紹介をするWikiはvcardというセレクタが着いていて、ある程度ルールがあるみたいです。