LLM

AI

[AWS]Bedrock RAGのプロンプトテンプレート

Bedrock RAGのプロンプトテンプレートは、検索した情報(コンテキスト)とユーザーの質問を組み合わせて、最終的にLLM(大規模言語モデル)へ渡す指示書を動的に生成するための設計図です。このテンプレート内で利用できる専用のプレースホルダ...
AI

[AWS]Bedrock Agentsのパフォーマンス・チューニング

Agentの「パフォーマンス」とは、単なる応答速度(レイテンシー)だけではありません。「ユーザーの指示をどれだけ正確に、効率的に、そして賢く完遂できるか」という総合的な能力を指します。このガイドでは、Agentのパフォーマンスを構成する「タ...
AI

[AWS]Bedrock RAGのパフォーマンス・チューニング

Amazon Bedrock RAGの「パフォーマンス」は、主に以下の3つの側面から成り立っています。これらをバランス良く、または目的に応じて重点的に改善していくことがチューニングの鍵となります。回答精度 (Relevance/Accura...
ツール

[AWS]レスポンス速度に差が出る理由!BedrockRAGとAgentの決定的な違い

Amazon Bedrockでテーブルスキーマ情報を管理する際、Knowledge Base(RAG) と Agent では、レスポンス速度と機能性に明確な違いがあります。結論から言うと、レスポンス速度はKnowledge Base(RAG...
ツール

[AWS]Bedrockで利用可能なLLMモデル一覧

Amazon BedrockでLLMエンジンを変更する手順と、利用可能な主要モデルの詳細を解説。コンソールまたはAPIを介してモデルを選び、コンテンツに合わせて最適なAIを使い分ける方法を紹介します。Titan、Claude、Llamaなど...
ツール

[AWS]Bedrockのファインチューニング手順

Amazon Bedrockでのファインチューニングは、まずJSON Lines形式のデータセットをS3にアップロードし、Bedrockコンソールでジョブを作成することから始まります。ジョブ作成時には、モデル名、ソースモデル、ハイパーパラメ...
ツール

[AWS]Amazon BedrockでSQL生成がボトルネック対処案

Amazon BedrockでSQL生成がボトルネックになっている場合、以下の対策が有効と考えられます。プロンプトとスキーマ情報の最適化スキーマ情報の絞り込み: 大規模なスキーマ全体をプロンプトに含めるのではなく、ユーザーの質問に関連するテ...
ツール

[AWS]Amazon Bedrock互換のOSS

Amazon Bedrockは、複数の大手AI企業の基盤モデル(Foundation Models)を統合的に利用できるフルマネージドサービスです。そのため、Bedrockと完全に互換性のある単一のオープンソースソフトウェア(OSS)は存在...
AI

深津式プロンプト

「深津式プロンプト」とは、命令(Instruction)制約(Constraints)入力情報(Input)出力フォーマット(Output)などを明確に区分して記述する手法です。この方式を用いると、曖昧な表現を避け、期待する回答の方向性や構...
AI

Googleの新OSSモデル『Gemma 3』がローカルAI革命を加速!

Googleが公開した新たなオープンソースAIモデル「Gemma 3」が、AI業界に衝撃を与えています。このモデルは、過去に公開されたモデルから大幅に改良され、サイズと性能のバランスが従来の常識を覆しました。最小サイズはたった1B(ビリオン...