プロンプトエンジニアリング(Prompt engineering)について解説しているページです。
ChatGPTのような生成AIモデルに提供する入力を設計・改良するもの、または情報を引き出す手法のことです。エンジニアリングを行っている人たちとっては芸術(アート)のようなものでもある。
なお、AIにおけるプロンプト(Prompt)とは、AIモデルに提供する広範な指示、または出力を生成するためにAIモデルに提供するテキストまたは情報です。
■必要性
プロンプトエンジニアリング(Prompt engineering)の必要性としては、特定のタスクやアプリケーションに合わせた、明確で簡潔、または構造化された入力を提供することによって、AIモデルのパフォーマンスを向上させる。または潜在的なバイアスを低減しつつ、コントロール等を向上。次に、同じプロンプトでもモデルによって反応が異なるため、特定のモデルを理解することで、適切なプロンプトで正確な結果を生成させる。
■必要なスキル、センスや能力
プロンプトエンジニアリング(Prompt engineering)を行うためには、大規模言語モデル(LLM:Large Language Model)の能力と限界の両方を深く理解する必要があります。そのため、大前提として大規模言語モデル(LLM:Large Language Model)の仕組みを理解しておくことが大事です。
これ以外にも下記のスキル等が必要です。
・技術的な能力:大規模言語モデル(LLM:Large Language Model)の仕組み以外にも、コーディングとソフトウェア開発について深く理解している必要がある。またタスクまたはアプリケーションに精通していることも必要である。
・芸術的センス:ChatGPTのような生成AIに対しての説得力ある入力を作るために必要。これは、既成概念に囚われずに考え、新しいアイデアを生み出し、斬新なアプローチを開発するクリエイティブな能力。
・観察眼:プロンプトを少し変えるだけで出力が大きく変わるため、細部への鋭い観察が必要。
・言語と文章に対する理解力:ライティング、文法、言語構造に関する本や記事を読み、さまざまなスタイルやフォーマットで書く練習をする。
・フィードバック能力:AIモデルを試す際には、他の人からのフィードバックを求め、自分のスキルを向上させる必要がある。
・結果を分析及び解釈する能力:効果的なプロンプトを作成するには、AIモデルの結果を分析および解釈して、問題や改善すべき領域を特定する能力が必要。
・英語:ほとんどのAIモデルやデータセットで使用される主要言語は「英語」です。日本語でもエンジニアリングできなくはないが、英語は学んでおいた方が良い。
・これ以外の非技術的な能力:問題解決能力と批判的思考能力、優れたコミュニケーション能力とチームワークのスキルも必要。また自分の考えを明確に伝え、他者と協力できることも必要である。
他にも必要なスキル等があれば追記します。
■成功のためには
プロンプトエンジニアリングを成功させるためには、文脈(コンテキスト)とユーザーの意図に依存が関係する。当たり前の話ですが、人間の相互作用を理解し、それに対応するために不可欠な要素が「文脈(コンテキスト)」です。そして「人間が、いつ、何を言われたのか」を理解し、状況に応じた対応をするために役立つのが、「人との会話の文脈(コンテキスト)」なのです。これは、AIの相互作用でもこれは基本変わりません。適切な文脈(コンテキスト)があれば、AIはユーザーが使用する言葉の背後にある意味や意図をよりよく理解できるため、より自然で正確な応答を提供できます。またAIはユーザーのリクエストに含まれるキーワードを特定し、その情報をもとに、より適切なレスポンスを提供することができます。
■将来性
プロンプトエンジニアリングが価値のあるものになるのは1〜2年後という予想が立てられていますが、AIの進化により独自のプロンプトを作成できるAI(人工知能)が登場し、人間のプロンプトエンジニアはこのAIにとってかわられる可能性もじゅうぶんに考えられます。しかし、プロンプトエンジニアリングのために、学んだスキルはAIにとってかわられても、別の仕事にもじゅうぶん応用できるものです。
■目次
・Bing AI Chat上での指定のURLと記事の自動要約
・プロンプトインジェクション攻撃(prompt injection attack)
・DALL-E 3が搭載されたBing AI(Bing Image Creator)で無料でドット絵を作成する
・Google最高性能の対話型AI「Gemini Advanced」サービスの利用開始
■その他
・BardでGemini Proを使用する方法【2023年12月8日時点】
・OpenAI LLM モデルのトークンと価格の計算ができる「AiPrice」
・ChatGPTが生成するコードにはAIの妄想で生成されるコードも存在する
・Google Bardで生成されるコードにはAIの妄想で生成されるコードも存在する
・Slackベータ版のChatGPT アプリにアクセスしインストール、または使用する
・Google Al が開発した大規模な言語モデルを動かすために使用されているGPU
・GoogleのGenerative AI for Developers(PaLM API )
・画像生成AI「Midjourney(ミッドジャーニー)」で生成した画像内に文字を入れる
・画像生成AIを使用した商売で詐欺にあった(海外展開の場合への注意喚起)
・画像生成AI「Midjourney(ミッドジャーニー)」の退会・解約
プロンプトエンジニアリング(Prompt engineering)に関するお問い合わせはこちらまで。