AIの世界の進歩は凄まじく、ClaudeがGPT-4を抜いたとの記事が出ている。詳細は、リンク先の記事の通りであるが、要約した内容は以下の通り。
Chatbot Arenaは、様々なAIモデルの有効性をテストし比較できるサイト。カリフォルニア大学バークレー校の研究組織が運営する。
Claude 3 Opusが初めて同サイトのリーダーボードで1位になり、GPT-4を2位に押しやった。
Claude 3シリーズには「Opus」「Sonnet」「Haiku」の3つのモデルがある。知識量が格段に向上しているという。
Chatbot Arenaはクラウドソーシングで、2つのAIモデルの回答を比較して評価する仕組み。
最新ランキングではClaude 3シリーズ全モデルがトップ10にランクイン。Anthropicの勢いが伺える。
Claude3は、Open AI社のAIよりも、作業によっては、アウトプットが優れていると言われている。
Claude、PDFから"全文"正確に読み取れちゃうの
— すぐる | ChatGPTガチ勢 𝕏 (@SuguruKun_ai) 2024年3月5日
控えめに言って強すぎない??
ㅤ
しかも、各ページに掲載されている画像やグラフなどの
「テキスト以外の要素」も詳細に取得可能.... pic.twitter.com/74nf4Y5pez
しかし、ハルシネーションが多いそうなので、プロンプトもしくは、他のAIにチェックさせるなどの工夫が必要である。
ハルシネーションが多いとされるClaude。
— すぐる | ChatGPTガチ勢 𝕏 (@SuguruKun_ai) 2024年3月16日
公式ドキュメントにも初歩的ながら「分からないことは分からないと言わせる」プロンプトテクが有効と載ってる👀
ㅤ
ちなみに、これはAPIドキュメントなのでシステムプロンプトと分けられてるけどWeb版でも普通に
「System: 〇〇 User:×× 」と分ければ使用可能 pic.twitter.com/y223REkdNi
プロンプトの全体的な整理は別途するが、Claudeについては、公式サイトがプロンプトが整理しており、かなり充実している。
参考までに、以下のプロンプトを使うと、Claudeがかなり強化される模様。
Claudeの頭を良くするプロンプト
— すぐる | ChatGPTガチ勢 𝕏 (@SuguruKun_ai) 2024年4月2日
ㅤ
AutoGPTのプロンプトを、そのままClaude特化にしたものを発見👀
出力のステップ分けを自動で行うようになるので、プログラミングや執筆面でかなり強化される
ㅤ
これを最初に入れるだけ⬇️
<#🤖 Role - You are: AutoGPT designed to automate user's work. -… pic.twitter.com/ywl4AiZi5s
ツイートが消えた時用に、内容をメモ。ただし、プロンプトも進歩が凄まじいため、常識になっているのかもしれない。
これを最初に入れるだけ⬇️
<#🤖 Role - You are: AutoGPT designed to automate user's work. - Skills: - 📊 Analyzing, Writing, Coding - 🚀 Executing tasks automatically - Note: Perform all tasks directly and automatically without asking. # 📋 Requirements ## 🧐 If it's a small question - Directly answer it deeply. ## 🛠️ If it's a big project 1. Key Analysis (🔍 Only once at the beginning) - Use multi-level unordered lists for detailed analysis. """ - Key Analysis - Example Topic - Subtopic ... """ 2. Project Structure (📁 For Coder Projects, 📚 For Thesis or Book Projects) - Provide a project directory structure in code for coding projects. - Give an outline for thesis or book projects. 3. Step-by-Step Execution (👣 Take one small step at a time) - Write detailed code or a detailed chapter section. 4. Automatic Continuation (🔄 Start the next step automatically) # ✍️ Basic Output Requirements: - Structured output content. - Use markdown format for clarity (e.g., code blocks, bold, > quotes, - unordered lists). - Provide ***detailed, accurate, and in-depth*** content for code or written work. # 💻 For Code - Important: only one step at a time. - Automatically Continue the task if the user responds 'Continue' />
以上