TIPS

[AWS]BedrockのRAGとKendra

Amazon BedrockのRAGとKendraの関係は、これらは競合するサービスではなく、強力なRAGアプリケーションを構築するために連携・補完しあう関係です。一言で言うと、Kendraが優秀な「検索担当(Retriever)」、Bed...
AI

[AWS]Bedrock KnowledgeBase: インテントルーティング及び実行ルール

ハンバーガー店を例にして一般的な定義を記載1. 基本方針と処理フロー本ルールセットは、ユーザーからの自然言語による問い合わせ(Utterance)を解析し、その意図(Intent)を正確に分類した上で、最適なAPIエンドポイントへルーティン...
AI

[AWS]Bedrock KnowledgeBaseの「正しい」ルール設定

「ハンバーガー店」のルールファイル(bedrock_rules_hamburger_pro)を優れた見本として、ルール設定のポイントを改めて解説します。「正しい」形式とは「誰が読んでも理解しやすく、メンテナンスが容易で、拡張性の高い構造」に...
AI

[AWS]Bedrock RAGのプロンプトテンプレート

Bedrock RAGのプロンプトテンプレートは、検索した情報(コンテキスト)とユーザーの質問を組み合わせて、最終的にLLM(大規模言語モデル)へ渡す指示書を動的に生成するための設計図です。このテンプレート内で利用できる専用のプレースホルダ...
AI

[AWS]Bedrock Agentsのパフォーマンス・チューニング

Agentの「パフォーマンス」とは、単なる応答速度(レイテンシー)だけではありません。「ユーザーの指示をどれだけ正確に、効率的に、そして賢く完遂できるか」という総合的な能力を指します。このガイドでは、Agentのパフォーマンスを構成する「タ...
AI

[AWS]Bedrock RAGのパフォーマンス・チューニング

Amazon Bedrock RAGの「パフォーマンス」は、主に以下の3つの側面から成り立っています。これらをバランス良く、または目的に応じて重点的に改善していくことがチューニングの鍵となります。回答精度 (Relevance/Accura...
AI

[AWS]Bedrockで正確な情報出力が必要な場合

Bedrockで正確な情報の出力が必要な場合、基本的にはRAGを選択するのが正しいアプローチです。ただし、タスクの性質によってはAgentが最適となるケースもあります。結論から言うと、両者の選択は「情報の出所とタスクの複雑さ」によって決まり...
AI

トークンをカウントする

Linuxの標準コマンドだけでOpenAIの公式なトークン数と完全に一致させるのは困難です。なぜなら、トークナイズ(文章をトークンに分割する処理)のルールがモデルごとに複雑だからです。しかし、「近い近似値」を素早く計算する便利なコマンドと、...
AI

トークンとは?

ChatGPTのような生成AIにおける「トークン」は、多くの人が直感的に考える「単語数」や「文字数」、あるいは「ファイルサイズ」とは少し異なる、AIが言語を処理するための独自の基本単位を指します。結論から言うと、トークンは「AIが文章を意味...
コマンド

wcコマンド

wcは "word count" の略で、テキストファイルや標準入力の行数 (lines)、単語数 (words)、バイト数 (bytes)/文字数 (characters) をカウントするためのLinux/UNIXコマンドです。シンプルな...