LLM アーカイブ - 開発メモ

[AWS]Bedrock RAGのプロンプトテンプレート

Bedrock RAGのプロンプトテンプレートは、検索した情報（コンテキスト）とユーザーの質問を組み合わせて、最終的にLLM（大規模言語モデル）へ渡す指示書を動的に生成するための設計図です。このテンプレート内で利用できる専用のプレースホルダ...

2025.08.15

AI

Agentの「パフォーマンス」とは、単なる応答速度（レイテンシー）だけではありません。「ユーザーの指示をどれだけ正確に、効率的に、そして賢く完遂できるか」という総合的な能力を指します。このガイドでは、Agentのパフォーマンスを構成する「タ...

2025.08.15

AI

Amazon Bedrock RAGの「パフォーマンス」は、主に以下の3つの側面から成り立っています。これらをバランス良く、または目的に応じて重点的に改善していくことがチューニングの鍵となります。回答精度 (Relevance/Accura...

2025.08.15

AI

Amazon Bedrockでテーブルスキーマ情報を管理する際、Knowledge Base（RAG）と Agent では、レスポンス速度と機能性に明確な違いがあります。結論から言うと、レスポンス速度はKnowledge Base（RAG...

2025.08.13

ツール

Amazon BedrockでLLMエンジンを変更する手順と、利用可能な主要モデルの詳細を解説。コンソールまたはAPIを介してモデルを選び、コンテンツに合わせて最適なAIを使い分ける方法を紹介します。Titan、Claude、Llamaなど...

2025.08.11

ツール

Amazon Bedrockでのファインチューニングは、まずJSON Lines形式のデータセットをS3にアップロードし、Bedrockコンソールでジョブを作成することから始まります。ジョブ作成時には、モデル名、ソースモデル、ハイパーパラメ...

2025.08.08

ツール

Amazon BedrockでSQL生成がボトルネックになっている場合、以下の対策が有効と考えられます。プロンプトとスキーマ情報の最適化スキーマ情報の絞り込み: 大規模なスキーマ全体をプロンプトに含めるのではなく、ユーザーの質問に関連するテ...

2025.08.07

ツール

Amazon Bedrockは、複数の大手AI企業の基盤モデル（Foundation Models）を統合的に利用できるフルマネージドサービスです。そのため、Bedrockと完全に互換性のある単一のオープンソースソフトウェア（OSS）は存在...

2025.08.07

ツール

「深津式プロンプト」とは、命令（Instruction）制約（Constraints）入力情報（Input）出力フォーマット（Output）などを明確に区分して記述する手法です。この方式を用いると、曖昧な表現を避け、期待する回答の方向性や構...

2025.04.16

AI

Googleが公開した新たなオープンソースAIモデル「Gemma 3」が、AI業界に衝撃を与えています。このモデルは、過去に公開されたモデルから大幅に改良され、サイズと性能のバランスが従来の常識を覆しました。最小サイズはたった1B(ビリオン...

2025.03.18

AI