Showing posts with label PromptEngineering. Show all posts
Showing posts with label PromptEngineering. Show all posts

Sep 12, 2024

Claude AI プロンプトエンジニアリング: 核心概念と実践方法

 Claude AI プロンプトエンジニアリング: 核心概念と実践方法

生成AIのためのプロンプトエンジニアリングは、生成AIとの効果的なインタラクションを通じて望ましい結果を得るためのプロセスです。 良いプロンプトエンジニアになるためには、次のような能力が必要です:

1.明確なコミュニケーション能力

例文: クロード、私は今、1つのブログポストを作成しているんだ。 テーマは「日常で簡単に実践できる環境保護の方法」だ。 ポストの構成は、序論-本論-結論で構成され、総文字数は1500文字前後で、読者に親しみやすくなるように、文体は堅苦しくなく、柔らかい感じに書いてくれ」。

プロンプトで記事のテーマ、構造、分量、文体などを具体的に明示することで、生成型AIが希望する方向に記事を生成できるよう、明確なガイドラインを提供しています。

2.反復作業をコツコツと行う意欲

例示: 最初のプロンプト - "クロード、私のために'春のピクニック'をテーマにした詩を書いてくれる?" 2番目のプロンプト - "詩の雰囲気をもっと軽快に変えて、青系で締めてくれる?" 3番目のプロンプト - "詩の3~4行目に、春のピクニックに行くときに聴きやすい音楽を推薦する内容を追加してくれる?"

同じテーマの詩を対象に、プロンプトを少しずつ修正しながら、生成型AIと繰り返しインタラクションすることで、ユーザーが望む方向に詩を完成させていきます。

3.プロンプトが間違っている可能性がある場合を考慮する能力

例: 「クロード、これから架空のインタビュー記事を書いてみよう。 架空の人物Aは「理想の職場の上司」に選ばれたんだ。 Aさんをインタビューしていると思って、Aさんが理想的な上司に選ばれた理由を5つくらいあげて記事を書いてくれ。 ただし、もし私が「男性」または「女性」と言わなかったら性別を言わないで、もしAさんの業種を言わなかったら、具体的な業種を書かないで自然に記事を書いてくれ。

プロンプトで曖昧になる可能性のある部分(性別、業種など)への配慮を事前に言及することで、プロンプトが意図しない方向に解釈される可能性を事前に遮断しています。

4.正直さ、ペルソナ、比喩の使用

例文: "クロード、私は今、大学の新入生向けのガイドブックを作るプロジェクトをしているんだ。 複数の人が共同で執筆するプロジェクトなので、文章の統一性を保つことが重要なんだ。 これから私が担当する章の草稿を作成するので、たくさんのフィードバックをお願いするよ。"

生成型AIにプロジェクトの背景やコンテキストを率直に共有することで、生成型AIがユーザーのニーズをよりよく理解し、適切な支援を提供できるようになります。

5.プロンプトの精緻化

例示: (生成型AIの出力例) - "環境保護の実践方法には、ハンカチを使う、カートを持ち歩く、残飯を残さない、中古品を利用するなどがあります..." (次のプロンプト) - "クロード、いいこと言うね。 でも、ちょっと内容が列挙的な感じがするけど、段落を分けて、段落と段落が自然につながるように文章を整えてくれる?"

生成型AIが生成した文章をよく読んで、修正・補完する部分を見つけ、次のプロンプトに反映することで、文章の完成度を高めることができます。

6.生成型AIの推論

例示: "クロード、僕は今、小説を書いているんだ。 主人公のキャラクターが初恋の人と別れて挫折するシーンなんだけど、モノローグ形式で主人公の複雑な心境を表現したいんだ。 ただし、直喩と比喩を積極的に活用して表現してくれ。" (生成型AIの推論過程) "主人公の心は、まるで嵐の中で漂流する小さな船のように揺れていた。 愛という灯台の明かりは消え、今、彼は暗闇の中で一人で道を探さなければならなかった...」。

生成型AIが文学的な表現技法を活用して人物の心理を描写する過程で、比喩と直喩を通して推論の過程を示しています。

7.企業用vs研究用vs一般的なチャットプロンプト

  • 企業向けプロンプト<<13>例: "クロード、当社の製品である「スマートウォッチ」の新しい広告コピーを作成する必要がある。コピーは、製品のコア機能である「24時間健康モニタリング」と「パーソナライズされた運動ガイド」に焦点を当て、20代後半から30代前半の健康に関心の高いサラリーマンをターゲットにした内容が良い。 コピーは簡潔かつ印象的なものでなければならない。"


企業向けプロンプトは、明確な要件とターゲット顧客層を提示し、生成型AIがブランドアイデンティティに合致した成果物を生成するように誘導します。

  • 研究用プロンプトの例: "クロード、私は今、自然言語処理生成型AIの性能を評価するための新しいベンチマークデータセットを作成しています。 このデータセットは、生成型AIが文の含意をどれだけよく理解しているかを測定することを目的としています。 様々なトピックと難易度の文のペアを生成してもらい、生成型AIが単にパターンを覚えるだけでなく、実際に含意関係を理解できるかどうかを確認できる文のペアが必要です。"


研究用プロンプトは、生成型AIの性能を評価するための具体的な基準と要件を提示し、多様で挑戦的なデータセットを生成することを要求します。

  • 一般的なチャットプロンプトの例: 「クロード、最近ストレスがたまりすぎて、仕事も多いし、家事も多いし...。 どうしたらストレス解消できるかな? あなたが考える最も効果的なストレス解消法をいくつか教えてください。" 

一般的なチャットプロンプトは、ユーザーの悩みや質問を率直に共有し、生成型に共感とアドバイスを求める形で行われます


プロンプトエンジニアリングを向上させるための便利なヒント:

1.プロンプトと生成型AIの出力をよく読む

例: (生成型AIの出力例) - 「環境保護の実践方法には、ハンカチを使う、カートを持ち歩く、残飯を残さない、中古品を利用するなどがあります。 ハンカチの使用は、紙ティッシュの代わりに直接ハンカチを持ち歩くことですが、これにより...」(次のプロンプト) - 「クロード、いい言葉だね。 でも、ちょっと文章が羅列的な感じがするんだ。 段落を分けて、段落と段落が自然につながるように文章を整えてくれるかな?

生成型AIが生成した文章をよく読んで、修正・補完する部分を見つけ、次のプロンプトに反映させることで、文章の完成度を高めることができます。

2.プロンプトを他の人と共有し、フィードバックを得る

例文: (同僚にプロンプトを共有した後)同僚: "プロンプトで文字数を1500文字に制限したのは良かったけど、"堅苦しくなく柔らかい感じ"という表現は少し曖昧な気がする。 代わりに"例をたくさん挙げて親しみやすく"くらいの表現にしたらどうだろう?"

プロンプトを作成するときは、一人で悩むよりも、他の人のフィードバックを積極的に求めるのが効果的です。 そうすることで、未だ考えもしなかった部分を発見し、プロンプトを改善していくことができます。

3.生成型AIができないと思われることを試してみる

例示: "クロード、私は今、小説を書いているんだ。 主人公のキャラクターが初恋の相手と別れた後、挫折するシーンだけど、モノローグ形式で主人公の複雑な心境を表現してほしい。 ただし、直喩(simile)と比喩(metaphor)を積極的に活用して表現してくれ。"

文学的な表現技法を使ったライティングは、生成型AIにとって十分に挑戦的な課題かもしれません。 しかし、このような試みを通じて、生成型AIの可能性を確認し、活用範囲を広げていくことができます。

4.文法や句読点に気をつけることも重要

例文: "クロード、まずは前回一緒に書いた投稿の下書きを見てみましょう。 文章全体のスペースの間隔が適切かどうか、文末のピリオドの使い方が適切かどうかチェックしてくれる? そして、厄介な表現や文法的な誤りがあれば教えてくれ。"

文章を書く上で、文法と句読点は基本的でありながら非常に重要な要素です。 生成型AIに校正者の役割をさせることで、文章の読みやすさと完成度をより高めることができます。

プロンプトエンジニアリングは、生成型AIとの効果的なコミュニケーションを通じて望ましい結果を引き出すプロセスであり、プロンプトを精緻化し、生成型AIの推論プロセスを理解することが重要です。 また、プロンプトの種類(企業用、研究用、一般チャットなど)に応じて適切な戦略を立てることも必要です。

プロンプトエンジニアリングの将来は、生成型AIがユーザーのニーズをよりよく理解し、よりインタラクションが活発になることが予想されます。 それに伴い、

参考資料:



マインドマップの整理:







Jul 11, 2023

[How to use GPT-4/BingChat for Drug Discovery or Other Research Development White Paper (w/ Prompt Engineering)]


Backgrounds

The motivation to write this white paper was inspired by an article in Hankyoreh on July 5 (Generative AI designs new drug in 46 days...enters phase 2 for the first time ever[1]which I read as a non-expert in the field of drug development. To summarize the content of the article, it is as follows.

A drug candidate designed using artificial intelligence (AI) by biotech company Insilico Medicine has entered Phase II clinical trials. The drug, a treatment for idiopathic pulmonary fibrosis, will be administered to 60 patients in China and the United States. Insilico developed the drug using a combination of generative AI and reinforcement learning, which cut drug development costs by a tenth and time by a third. The company currently has more than 30 AI drug development programs underway, three of which have entered clinical trials. This entry into Phase II clinical trials is considered a major milestone in the field of drug development using AI.

Based on this article, I tried to explain how generative AI (ChatGPT, BingChat) can be well utilized in drug discovery with an example of the process of applying prompt engineering techniques to derive concrete results step by step.

 

This course will help you understand why prompt engineering is necessary and how to apply it. It will also show you how we uncovered hidden prompt directives that are very useful in drug discovery.  

Here are the prompt directives (in the form of #hashtags) that we discovered while writing this paper: (*Note: The hashtag directives below should be run in BingChat rather than GPT-4 to achieve the desired results.')

  • #patent_search
  • #trend_analysis
  • #information_query
  • #information_detail
  • #scenario_write
  • #scenario_simulate
  • #content_generate
  • #expert_interview
  • #educational_content
  • #risk_assessment
  • There are many other

These hashtags are not only useful for drug discovery, but also for other research and development. We encourage you to apply these hashtag directives to a variety of research areasFor example, among the hashtags below, "#patent_search" is a command to search for patent information.

A drug discovery researcher can ask a question in BingChat with "#patent_search: rituxim"] or give a command with "Give me the latest patents for rituxim"]. However, there are differences between these two commands.

The '#patent_search: rituxim' command uses a hashtag to search for patent information. It searches for domestic and international patents with the keyword rituxim and provides information such as patent name, application number, filing date, inventor, and summary.

"Show me the latest patents for rituxim" is a typical question to retrieve patent information: it performs a web search with the keyword rituxim, finds patent-related sites or documents in the search results, and provides the information.

Drug discovery is an important field that improves human health and quality of life. However, drug development is an extremely difficult, time-consuming, and costly process. Drug candidates need to be discovered, validated for efficacy and safety, tested in clinical trials, and approved before they can be brought to market. There is a lot of failure and waste along the way, and the probability of success in drug development is very low.

To address these challenges, artificial intelligence (AI) technologies are increasingly being used in drug discovery. Generative AI, in particular, is an AI technology that generates new data by learning from existing data, and can be used to design drug candidates, predict their efficacy and safety, and even simulate clinical trial results. A typical example of generative AI used in drug discovery is the Generative Adversarial Network (GAN).  

Generative Adversarial Networks (GANs) and GPT-4 are both deep learning models, a branch of artificial intelligence, but they differ in their purpose and how they work. Both models can be utilized in drug discovery, but the way and context in which they are used is different.

1. Generative Adversarial Networks (GANs): GANs are generative models in which two neural networks, a generator and a discriminator, learn by competing with each other. The generator tries to create fake data that resembles real data, and the discriminator tries to determine whether the data created by the generator is real or fake. Through this competition, the generator gradually creates fake data that is indistinguishable from real data, which is then used to generate new images, speech, and more.

GANs  are often used in the molecular design phase of drug development. GANs can be used to generate new molecular structures, which can help find new drug candidates. A constructor creates a new molecule that is similar to a real molecule, and a discriminator determines how similar it is to the real molecule. In this way, GANs can be used to explore and generate new molecular structures in drug discovery.

2. GPT-4: GPT-4 is a model used in natural language processing (NLP) that focuses on understanding and generating textual data. GPT-4 can learn large amounts of text data to understand context, generate appropriate text for a given input, provide answers to questions, translate text, and more. GPT-4 is based on the Transformer architecture, which is designed to process all words in an input sentence simultaneously to better understand context. Natural language processing models like GPT-4  can be used in other aspects of drug discovery. For example, these models can be used to analyze and understand large amounts of medical text data. This can help analyze research findings, interpret clinical trial results, or search and summarize medical literature.

So, the main difference between GANs and GPT-4 is that GANs are used to generate different types of data, such as images and speech, while GPT-4 is primarily used to process and generate text data. Also, GANs learn by having two neural networks compete against each other, while GPT-4 learns by training a large amount of text data to understand context and generate text.

GANs and GPT-4 can be utilized in different ways at different stages of drug development. By leveraging their respective strengths, these two models can contribute to improving and accelerating the drug discovery process.

This paper describes the process of applying prompt engineering techniques to analyze how GPT-4 can be utilized in the drug discovery process.

 

In order to utilize generative AI for drug discovery, prompt engineering techniques are required. Prompt engineering is the art of providing an AI model with the right inputs (prompts) to achieve a desired outcome. Prompt engineering can help you increase the performance and efficiency of your AI model, tailor your AI model to your desired purpose, and reduce the limitations and risks of your AI model.

I am a non-expert in the drug discovery field. Based on my experience in general prompt engineering,I have been studying the process of how generative AI (ChatGPT, BingChat) can be utilized in drug development.


Much of the content in this whitepaper was generated by utilizing GPT-4 and BingChat as appropriate.


For more information, download the PDF file here 


-------------------------------------------

Published Book: Mastering ChatGPT-4 Prompt for Writers: (Author:Charly Choi)