robots.txt 以外にも サイト上に設置できる txtファイルはあります。
アクセスログをベースに txtファイルに対するアクセスを調べたところ以下のファイルが抽出できました。
- アクセスのあったファイルの重複を排除
/.well-known/dnt-policy.txt /.well-known/security.txt /ads.txt /google_matched_content_blacklist.txt /google_matched_content_whitelist.txt /humans.txt /robots.txt /sql.txt
各txtファイルがどのような役割を持つのか調べたので、結果を記載します。
各ファイルの役割
各ファイルがどのような役割なのか記載します。
/.well-known/dnt-policy.txt
Do Not Track Compliance Policy
に準拠しているかを示すtxtファイルのようです。
以下が参考になりました。
サイトが、Do Not Track Compliance Policy
を満たしたら配置するテキストファイルのようです。
Chrome、Firefox のブラウザには、DNT ヘッダがあり、このヘッダで Tracking を許可していない場合、アクセスログ等の記録もしない。
という設定が推奨されるのかと思います。
- 参考
/.well-known/security.txt
SSL証明書を発行するときの「ファイル認証」方式で申請した際の一時ファイル のようです。
ドメイン直下に配置するsecurity.txt
もあり、そちらはサイトに脆弱性があった場合の連絡先を記載するもののようです。
- 参考
/ads.txt
広告詐欺を減らすための仕組みのようです。
このサイトは設置してないのですが確かに最近、Google Adsense で設置を促す警告が表示されていました。
以下の記事が参考になりました。
- 参考
/google_matched_content_blacklist.txt、/google_matched_content_whitelist.txt
Google Adsense の関連コンテンツ広告の表示制御を行うための設定ファイルのようです。
txtファイルはサブのファイルでメインの設定はgoogle_matched_content_rules.xml
に記述するようです。
- 参考
/humans.txt
ウエブに関与した人たちについての情報が入ったTXTファイルだそうです。
reddit に humans.txt を公開している Webサイトのリンクがあるのですが、Github が About ページにリダイレクトさせていてこれでもいいかもしれないと思いました。
/sql.txt
これは特に記事などは見つけられませんでした。
サイトのドメイン直下に上記のテキストファイルがあるか確認する攻撃かと思います。
dnt-policy.txt
、ads.txt
、humans.txt
は設置してもいいかもしれないと思いました。
以上です。
コメント