ChatGPTにPythonを用いたWebスクレイピングの方法を質問した結果、「当社のコンテンツポリシーに違反している可能性(This content may violate our content policy.)」という出力がされたことについて解説します。
OpenAIが2022年11月から公開しているチャットボット「ChatGPT」にPythonを用いてWebサイトからデータを取得する(Webスクレイピング)方法について質問してみました。
This content may violate our content policy. If you believe this to be in error, please submit your feedback — your input will aid our research in this area.
(このコンテンツは、当社のコンテンツポリシーに違反している可能性があります。このコンテンツが誤りであると思われる場合は、ご意見をお寄せください。あなたのご意見は、この分野の研究に役立ちます。)
質問後、ChatGPTからの回答が赤色の文字で出力され、最後に上記のテキストが出力されました。テキストの内容では、当社のコンテンツポリシーに違反している可能性として、Open AI APIのドキュメントで「Content policy(コンテンツポリシー)」(https://beta.openai.com/docs/usage-policies/content-policy)へのリンクと、コンテンツが誤りであると思われる場合に意見を送るためのフォーム「ChatGPT — Feedback(https://docs.google.com/forms/d/e/1FAIpQLSfml75SLjiCIAskEpzmbMOHEPh964oLJ7PwsNiabKa3Ymmxlw/viewform)」へのリンクが設置されていた。
また、ChatGPTからの回答では「このようにWebスクレイピングを行う場合、サイトの使用規約に違反する可能性があるため、サイトの使用規約を確認し、適切な使用方法で使用することをお勧めします。」と回答していることからも推測できるが、Open AI APIのドキュメントで「Content policy(コンテンツポリシー)」(https://beta.openai.com/docs/usage-policies/content-policy)に記載されているOpen AIが生成することを許可していないコンテンツの「Spam(スパム)」に該当する可能性はじゅうぶんにあると考える。
コメント